Kompression der Erregungsmuster von Cochlea-Implantaten
Zusammenfassung
Cochlea-Implantate sind implantierte Reizprothesen, welche den Hörverlust infolge gewisser Schädigungen des Gehörs zum Teil beheben können. Moderne Signalprozessoren von Cochlea-Implantaten erlauben, unter anderem zur Verbesserung des Hörverstehens, die drahtlose Übertragung von Audiosignalen von externen Geräten (Smartphones, drahtlose Mikrophone, …). Diese Arbeit befasst sich mit spezialisierter Datenkompression für die Erregungsmuster von CochleaImplantaten. Diese hat das Ziel der reduzierten Latenz und Energieaufnahme im Kontext der drahtlosen Übertragung von Hörinformation in Form von Audiosignalen an Signalprozessoren von Cochlea-Implantaten. Es werden insgesamt vier im Rahmen der Arbeit entwickelte Kompressionsverfahren vorgestellt und evaluiert. Mit Trägern von Cochlea-Implantaten durchgeführte Hörtests belegen die Überlegenheit des untersuchen Ansatzes im Vergleich zur Audiocodierung mittels des Audiocodecs Opus. Verfahren auf Basis rückgekoppelter Autoencoder erzielen latenzfrei bei sehr guter objektiver Sprachverständlichkeit der codierten Erregungsmuster eine sehr geringe Bitrate von 4,67 kbit/s. Hauptresultat ist ein generisches, automatisches Entwurfsverfahren latenz...
Schlagworte
- Kapitel Ausklappen | EinklappenSeiten
- I–XII Titelei/Inhaltsverzeichnis I–XII
- 1–6 1 Einleitung 1–6
- 1.1 Motivation
- 1.2 Problembeschreibung
- 1.3 Idee und Zielsetzung
- 1.4 Aufbau der Arbeit
- 7–51 2 Grundlagen 7–51
- 2.1 Das Gehör des Menschen
- 2.1.1 Hörschädigungen
- 2.2 Cochlea-Implantate
- 2.2.1 Aufbau und Signalverarbeitung
- 2.2.2 Leistungsfähigkeit und Stand der Technik
- 2.2.3 Objektive Maße des Hörverstehens
- 2.3 Theoretische Grundlagen und Verfahren der Datenkompression
- 2.3.1 Grundlagen der Wahrscheinlichkeitstheorie
- 2.3.2 Dichten transformierter Zufallsvariablen
- 2.3.3 Korrelation
- 2.3.4 Stochastische Prozesse
- 2.3.5 Quellencodierung
- 2.3.6 Verbesserung der Arithmetischen Codierung
- 2.3.7 Prädiktion
- 2.3.8 Quantisierung
- 2.3.9 Differential Puls-Code Modulation
- 2.3.10 Neuronale Netze und Autoencoder
- 2.3.11 Audiocodierung: Stand der Technik
- 2.3.12 Stochastic Perturbation Simultaneous Approximation
- 2.3.13 Sequential Model-Based Algorithm Configuration
- 2.4 Verfahren der Statistik
- 2.4.1 Hypothesentests
- 2.4.2 Varianzanalyse
- 2.4.3 Wilcoxon-Vorzeichen-Rangtest
- 52–80 3 Entwickelte Codierungsstrategien, Datensätze sowie Beschreibung des Hörtests 52–80
- 3.1 Der Electrocodec
- 3.2 Verlustlose Kompression der Erregungsmuster mittels künstlicher neuronaler Netze
- 3.3 Autoencoder
- 3.4 Rückkopplungsautoencoder
- 3.5 Datensätze
- 3.5.1 Mischung mit Rauschen
- 3.6 Analyse der Erregungsmuster
- 3.7 Beschreibung der durchgeführten Hörtests
- 3.7.1 Datengenerierung
- 3.7.2 Probanden
- 3.7.3 Testprozedur
- 3.7.4 Sprachverständlichkeitstest
- 3.7.5 Sprachqualitätstest
- 81–113 4 Ergebnisse 81–113
- 4.1 Objektiver Vergleich des Electrocodecs mit dem G.722
- 4.2 Ergebnisse der Hörtests
- 4.3 Evaluierung der verlustlosen Kompression
- 4.3.1 Vergleich mit alternativen Kompressionsverfahren
- 4.4 Evaluierung des Autoencoders ohne Rückkopplung
- 4.4.1 Evaluierung des Rückkopplungsautoencoders
- 4.4.2 Regularisierung
- 114–143 5 Überlegungen zur Optimalität 114–143
- 5.1 Grundsätzliches Vorgehen
- 5.2 Wahrscheinlichkeitsdichtefunktionen nach der DFT
- 5.3 Die Wahrscheinlichkeitsdichte der Einhüllenden
- 5.3.1 Wahrscheinlichkeitsdichte der Einhüllenden des 22. Bandes
- 5.4 Wahrscheinlichkeitsdichte nach der Lautheitswachstumsfunktion
- 5.5 Wahrscheinlichkeitsverteilung der Bandselektion
- 5.6 Weitere notwendige Schritte einer theoretischen Analyse
- 5.7 Die empirische Bestimmung des Optimalprädiktors und der Entropie der Bandselektion
- 5.8 Datengrundlage
- 5.8.1 Stationaritätsprüfung
- 5.9 Generierung künstlicher Erregungsmuster
- 5.10 Validierung der Schätzung des bedingten Erwartungswerts
- 5.10.1 Prozessmodelle
- 5.10.2 Validierung
- 5.10.3 Ergebnisse der Validierung
- 5.11 Der Optimalprädiktor der Erregungsmuster für stimmlose Sprache
- 5.12 Die Entropie der Bandselektion
- 144–150 6 Diskussion 144–150
- 6.1 Zukünftige Arbeiten
- 151–152 7 zusammenfassung 151–152
- 153–158 8 Anhang 153–158
- 8.1 Verteilung der DFT-Koeffizienten von Gaußschem Rauschen
- 159–172 Literatur 159–172
- 173–182 Veröffentlichungen 173–182