ne-na.de/IT versus Babylon - verbesserte Spracherkennung im Rampenlicht der Technik

DJ ne-na.de/IT versus Babylon - verbesserte Spracherkennung im Rampenlicht der Technik

ne*na.de/IT versus Babylon - verbesserte Spracherkennung im Rampenlicht der 
Technik 
 
Aachen, 24. Oktober 2008 * Verbesserte Technologien der Spracherkennung und 
Sprachausgabe sind in allen Bereichen modernen Kommunikationstechnik 
geschätzte Trumpfkarten. Die aktuellen Entwicklungen und Trends auf diesen 
hochdynamischen Markt standen im Fokus einer internationalen Tagung, zu der 
die Informationstechnische Gesellschaft im VDE (ITG) zahlreiche Experten 
nach Aachen eingeladen hatte. 
 
Im Automobil sind die Anwendungsmöglichkeiten für Sprachausgaben in den 
letzten Jahren stetig gewachsen. Ein Ende dieses Trends zeichnet sich nicht 
ab, denn die Anwendungsmöglichkeiten sind vielfältig. Die Palette reicht vom 
Reiseführer, der für sämtliche Sehenswürdigkeiten Beschreibungen im 
Audio*Format bereit hält bis hin zu Stauinformationen, die dem Fahrer erst 
vorgelesen werden, bevor die Navigation eine neue Route berechnet. ,,Eine 
neue Anforderung an die Sprachausgabe im Kfz stellt die multilinguale 
Ausgabe dar", resümiert Bärbel Jeschke von der Harman/Becker Automotive 
Systems in Ulm. Diese benötige man vor allem für das Navigieren zu 
ausländischen Zielen oder für die Auswahl von MP3 Titeln. Eine besondere 
Herausforderung sei der Sprachenwechsel mitten im Satz. Als technische 
Lösung werde derzeit ein Phonemmapping verwendet, da das Umschalten zwischen 
verschiedenen Sprachen und Stimmen aus Gründen der Ladezeit technisch nicht 
möglich sei. 
 
Signalrekonstruktionen verbessern Sprachsignale 
 
Mit einem Verfahren zur Sprachsignalverbesserung hat sich Jeschkes Kollege 
Mohamed Krini, bei Harman/Becker Automotive Systems für den Bereich Acoustic 
Speech Enhancement zuständig, beschäftigt. ,,Werden Telefonate über eine 
Freisprechanlage aus dem Fahrzeug geführt, so überlagern sich der Sprache 
des lokalen Gesprächspartners störende Hintergrundgeräusche", erläutert der 
Experte. Um die Sprachqualität zu verbessern, setze man 
Geräuschreduktionsverfahren ein, die in der Regel auf dem Prinzip einer 
zeitvarianten, spektralen Gewichtung basierten. Bei guten bis mittleren 
Signal*zu-Geräusch-Abstand könne man auf diese Weise gute Ergebnisse 
erzielen. 
 
,,In lauten Geräuschszenarien funktionieren die zurzeit verwendeten 
Standardalgorithmen jedoch nicht mehr zufrieden stellend und sollten daher 
verbessert werden", ergänzt Krini. Zu diesem Zweck habe Harman/Becker 
Automotive Systems ein neues Verfahren zur Verbesserung von stark gestörten 
Sprachsignalen entwickelt, das im Wesentlichen aus zwei Algorithmenteilen 
bestehe: einer Geräuschreduktion und einer partiellen Sprachrekonstruktion. 
Das Prinzip der partiellen Rekonstruktion basiere darauf, jene 
Zeit*Frequenz-Bereiche, in welchen das Signal-zu-Geräusch-Verhältnis gering 
ist, zunächst zu detektieren und dort das Sprachsignal zu synthetisieren. 
Durch das neue Verfahren sei es möglich, die stark gestörten 
Nutzsignalanteile wiederherzustellen und die Sprachqualität merklich zu 
verbessern. 
 
Visualisierung spektraler Merkmale 
 
Mit einem neuen Verfahren zur Spracherkennung sorgte Hans*Günter Hirsch vom 
Fachbereich Elektrotechnik und Informatik der Hochschule Niederrhein in 
Krefeld für ein viel beachtetes Thema der Tagung. Zur Modellierung 
sprachlicher Einheiten wie Wörtern oder Lauten wird bei den meisten 
heutzutage eingesetzten Systemen zur automatischen Spracherkennung der 
mathematische Ansatz des so genannten Hidden Markov Modells (HMM) verwendet. 
Bei diesem Verfahren wird die jeweilige sprachliche Einheit als eine 
zeitliche Folge kurzer sprachlicher Abschnitte modelliert. ,,Es ist uns 
nunmehr gelungen, die in einem HMM enthaltenen spektralen Merkmale zu 
bestimmen und zu visualisieren", erläutert Hirsch. Mit den daraus gewonnenen 
Ergebnissen könnten neue Verfahren zur Spracherkennung bei gleichzeitigem 
Vorhandensein bestimmter Störeinflüsse abgeleitet werden. Der Autor Dr. Rolf 
Froböse ist freiberuflicher Wissenschafts* und Wirtschaftsjournalist für 
Chemie, Biotechnologie, Umwelt, Energie, Raumfahrt, Medizin und IT*Technik 
Website: http://www.froboese.com. Eine Meldung vom Medienbüro Sohn. Für den 
Inhalt ist das Medienbüro Sohn verantwortlich.

(END) Dow Jones Newswires

November 04, 2008 08:21 ET (13:21 GMT)

Favoritenwechsel

Das Börsenjahr 2026 ist für viele Anleger ernüchternd gestartet. Tech-Werte straucheln, der Nasdaq 100 tritt auf der Stelle und ausgerechnet alte Favoriten wie Microsoft und SAP rutschen zweistellig ab. KI ist plötzlich kein Rückenwind mehr, sondern ein Belastungsfaktor, weil Investoren beginnen, die finanzielle Nachhaltigkeit zu hinterfragen.

Gleichzeitig vollzieht sich an der Wall Street ein lautloser Favoritenwechsel. Während viele auf Wachstum setzen, feiern Value-Titel mit verlässlichen Cashflows ihr Comeback: Telekommunikation, Industrie, Energie, Pharma – die „Cashmaschinen“ der Realwirtschaft verdrängen hoch bewertete Hoffnungsträger.

In unserem aktuellen Spezialreport stellen wir fünf Aktien vor, die genau in dieses neue Marktbild passen: solide, günstig bewertet und mit attraktiver Dividende. Werte, die nicht nur laufende Erträge liefern, sondern auch bei Marktkorrekturen Sicherheit bieten.

Jetzt den kostenlosen Report sichern – bevor der Value-Zug 2026 endgültig abfährt!

Dieses exklusive PDF ist nur für kurze Zeit gratis verfügbar.

Hier klicken

	Indizes	Kurs	%	News 24 h / 7 T	Aufrufe 7 Tage


	Aktien	Kurs	%	News 24 h / 7 T	Aufrufe 7 Tage


	Xetra-Orderbuch


	Fonds	Kurs	%


	Devisen	Kurs	%


	Rohstoffe	Kurs	%


	Themen	Kurs	%



Erweiterte Suche