Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning
54,99 €
Sofort verfügbar, Lieferzeit: Sofort lieferbar
Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning, Springer Vieweg
Von Jakob Behnke, im heise shop in digitaler Fassung erhältlich
Produktinformationen "Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning"
In diesem Buch wird die Empfindlichkeit des Automatic Speech
Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden
unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es
zeigte sich, dass einige Störgeräusche wie reines Rauschen oder
Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben.
Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären
Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann,
welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die
Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne
Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur
Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht
identifiziert werden.
Artikel-Details
- Anbieter:
- Springer Vieweg
- Autor:
- Jakob Behnke
- Artikelnummer:
- 9783658500481
- Veröffentlicht:
- 02.02.26
Barrierefreiheit
This PDF has been created in accordance with the PDF/UA-1 standard to enhance accessibility, including screen reader support, described non-text content (images, graphs), bookmarks for easy navigation
- entspricht den Vorgaben der PDF / UA 1 (05)
- keine Vorlesefunktionen des Lesesystems deaktiviert (bis auf) (10)
- navigierbares Inhaltsverzeichnis (11)
- logische Lesereihenfolge eingehalten (13)
- kurze Alternativtexte (z.B für Abbildungen) vorhanden (14)
- Inhalt auch ohne Farbwahrnehmung verständlich dargestellt (25)
- hoher Kontrast zwischen Text und Hintergrund (26)
- Navigation über vor-/zurück-Elemente (29)
- alle zum Verständnis notwendigen Inhalte über Screenreader zugänglich (52)
- Kontakt zum Herausgeber für weitere Informationen zur Barrierefreiheit (99)