Zusammenfassung
Mit der Einführung der neuesten Generationen von Sequenziermaschinen sind die Kosten für die Sequenzierung eines menschlichen Genoms auf weniger als 1.000 US-Dollar gesunken. Es wird prognostiziert, dass die Menge der Sequenzierungsdaten bald die Menge anderer Datentypen, wie z.B. Videodaten, übersteigen wird. Daher werden in dieser Arbeit drei neue Datenkompressionsverfahren zur Verbesserung der Speicherung, Übertragung und Verarbeitung von Sequenzierungsdaten vorgestellt. Die drei Verfahren beschäftigen sich mit der Komprimierung von Sequenzfragmenten, der Quantisierung und Komprimierung von Sequenzierungs-Qualitätswerten, sowie der MPEG-G-konformen Entropiecodierung von Sequenzierungsdaten. Im Vergleich zum Stand der Technik erzielen die Verfahren in separaten Experimenten die jeweils besten Ergebnisse. Abschließend wird die Integration der vorgeschlagenen Verfahren in den MPEG-G-Standard diskutiert
C O N T E N T S
1 introduction 1
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 State of the Art and Contributions . . . . . . . . . . . . . . 7
1.2.1 Compression of Aligned Reads . . . . . . . . . . . 7
1.2.2 Compression of Quality Scores . . . ...
Schlagworte
Kompression DNA-Sequenzierung MPEG-G compression DNA sequencing- 1–11 1 Introduction 1–11
- 12–44 2 Preliminaries 12–44
- 129–132 7 Conclusions 129–132
- 133–133 Appendix 133–133
- 133–152 Bibliography 133–152
- 153–166 Publications 153–166