Zum Hauptinhalt springen Zur Suche springen Zur Hauptnavigation springen

Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning

54,99 €

Sofort verfügbar, Lieferzeit: Sofort lieferbar

Format auswählen

Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning, Springer Vieweg
Von Jakob Behnke, im heise shop in digitaler Fassung erhältlich

Produktinformationen "Automatische Optimierung von Audiosignalen für Transkription mit Evolutionären Algorithmen und Machine Learning"

In diesem Buch wird die Empfindlichkeit des Automatic Speech Recognition-Werkzeugs Whisper auf Störgeräusche untersucht. Hierbei werden unterschiedliche Geräuschtypen in verschiedenen Lautstärken untersucht. Es zeigte sich, dass einige Störgeräusche wie reines Rauschen oder Hintergrundgespräche einen höheren Einfluss auf die Transkript-Fehlerrate haben. Es wurde untersucht, ob mittels Machine Learning-Algorithmen und evolutionären Algorithmen eine Audioplugin-basierte Vorverarbeitung gefunden werden kann, welche die Transkriptgenauigkeit in Gegenwart von Störgeräuschen verbessert. Die Ergebnisse zeigen, dass mit den gewählten Methoden Verbesserungen für einzelne Störgeräusche erzielt werden konnten. Eine universelle Pluginkette zur Verbesserung der Transkriptgenauigkeit auf beliebigen Daten konnte jedoch nicht identifiziert werden.

Artikel-Details

Anbieter:
Springer Vieweg
Autor:
Jakob Behnke
Artikelnummer:
9783658500481
Veröffentlicht:
02.02.26

Barrierefreiheit

This PDF has been created in accordance with the PDF/UA-1 standard to enhance accessibility, including screen reader support, described non-text content (images, graphs), bookmarks for easy navigation

  • entspricht den Vorgaben der PDF / UA 1 (05)
  • keine Vorlesefunktionen des Lesesystems deaktiviert (bis auf) (10)
  • navigierbares Inhaltsverzeichnis (11)
  • logische Lesereihenfolge eingehalten (13)
  • kurze Alternativtexte (z.B für Abbildungen) vorhanden (14)
  • Inhalt auch ohne Farbwahrnehmung verständlich dargestellt (25)
  • hoher Kontrast zwischen Text und Hintergrund (26)
  • Navigation über vor-/zurück-Elemente (29)
  • alle zum Verständnis notwendigen Inhalte über Screenreader zugänglich (52)
  • Kontakt zum Herausgeber für weitere Informationen zur Barrierefreiheit (99)