Anzeige
Mehr »
Freitag, 20.06.2025 - Börsentäglich über 12.000 News
+435 % Beteiligungsrendite durch TAO nach £5 Mio. Finanzierung und Bitcoin-Treasury-Strategie!
Anzeige

Indizes

Kurs

%
News
24 h / 7 T
Aufrufe
7 Tage

Aktien

Kurs

%
News
24 h / 7 T
Aufrufe
7 Tage

Xetra-Orderbuch

Fonds

Kurs

%

Devisen

Kurs

%

Rohstoffe

Kurs

%

Themen

Kurs

%

Erweiterte Suche
Dow Jones News
115 Leser
Artikel bewerten:
(0)

ne-na.de/IT versus Babylon - verbesserte Spracherkennung im Rampenlicht der Technik

DJ ne-na.de/IT versus Babylon - verbesserte Spracherkennung im Rampenlicht der Technik

ne*na.de/IT versus Babylon - verbesserte Spracherkennung im Rampenlicht der 
Technik 
 
Aachen, 24. Oktober 2008 * Verbesserte Technologien der Spracherkennung und 
Sprachausgabe sind in allen Bereichen modernen Kommunikationstechnik 
geschätzte Trumpfkarten. Die aktuellen Entwicklungen und Trends auf diesen 
hochdynamischen Markt standen im Fokus einer internationalen Tagung, zu der 
die Informationstechnische Gesellschaft im VDE (ITG) zahlreiche Experten 
nach Aachen eingeladen hatte. 
 
Im Automobil sind die Anwendungsmöglichkeiten für Sprachausgaben in den 
letzten Jahren stetig gewachsen. Ein Ende dieses Trends zeichnet sich nicht 
ab, denn die Anwendungsmöglichkeiten sind vielfältig. Die Palette reicht vom 
Reiseführer, der für sämtliche Sehenswürdigkeiten Beschreibungen im 
Audio*Format bereit hält bis hin zu Stauinformationen, die dem Fahrer erst 
vorgelesen werden, bevor die Navigation eine neue Route berechnet. ,,Eine 
neue Anforderung an die Sprachausgabe im Kfz stellt die multilinguale 
Ausgabe dar", resümiert Bärbel Jeschke von der Harman/Becker Automotive 
Systems in Ulm. Diese benötige man vor allem für das Navigieren zu 
ausländischen Zielen oder für die Auswahl von MP3 Titeln. Eine besondere 
Herausforderung sei der Sprachenwechsel mitten im Satz. Als technische 
Lösung werde derzeit ein Phonemmapping verwendet, da das Umschalten zwischen 
verschiedenen Sprachen und Stimmen aus Gründen der Ladezeit technisch nicht 
möglich sei. 
 
Signalrekonstruktionen verbessern Sprachsignale 
 
Mit einem Verfahren zur Sprachsignalverbesserung hat sich Jeschkes Kollege 
Mohamed Krini, bei Harman/Becker Automotive Systems für den Bereich Acoustic 
Speech Enhancement zuständig, beschäftigt. ,,Werden Telefonate über eine 
Freisprechanlage aus dem Fahrzeug geführt, so überlagern sich der Sprache 
des lokalen Gesprächspartners störende Hintergrundgeräusche", erläutert der 
Experte. Um die Sprachqualität zu verbessern, setze man 
Geräuschreduktionsverfahren ein, die in der Regel auf dem Prinzip einer 
zeitvarianten, spektralen Gewichtung basierten. Bei guten bis mittleren 
Signal*zu-Geräusch-Abstand könne man auf diese Weise gute Ergebnisse 
erzielen. 
 
,,In lauten Geräuschszenarien funktionieren die zurzeit verwendeten 
Standardalgorithmen jedoch nicht mehr zufrieden stellend und sollten daher 
verbessert werden", ergänzt Krini. Zu diesem Zweck habe Harman/Becker 
Automotive Systems ein neues Verfahren zur Verbesserung von stark gestörten 
Sprachsignalen entwickelt, das im Wesentlichen aus zwei Algorithmenteilen 
bestehe: einer Geräuschreduktion und einer partiellen Sprachrekonstruktion. 
Das Prinzip der partiellen Rekonstruktion basiere darauf, jene 
Zeit*Frequenz-Bereiche, in welchen das Signal-zu-Geräusch-Verhältnis gering 
ist, zunächst zu detektieren und dort das Sprachsignal zu synthetisieren. 
Durch das neue Verfahren sei es möglich, die stark gestörten 
Nutzsignalanteile wiederherzustellen und die Sprachqualität merklich zu 
verbessern. 
 
Visualisierung spektraler Merkmale 
 
Mit einem neuen Verfahren zur Spracherkennung sorgte Hans*Günter Hirsch vom 
Fachbereich Elektrotechnik und Informatik der Hochschule Niederrhein in 
Krefeld für ein viel beachtetes Thema der Tagung. Zur Modellierung 
sprachlicher Einheiten wie Wörtern oder Lauten wird bei den meisten 
heutzutage eingesetzten Systemen zur automatischen Spracherkennung der 
mathematische Ansatz des so genannten Hidden Markov Modells (HMM) verwendet. 
Bei diesem Verfahren wird die jeweilige sprachliche Einheit als eine 
zeitliche Folge kurzer sprachlicher Abschnitte modelliert. ,,Es ist uns 
nunmehr gelungen, die in einem HMM enthaltenen spektralen Merkmale zu 
bestimmen und zu visualisieren", erläutert Hirsch. Mit den daraus gewonnenen 
Ergebnissen könnten neue Verfahren zur Spracherkennung bei gleichzeitigem 
Vorhandensein bestimmter Störeinflüsse abgeleitet werden. Der Autor Dr. Rolf 
Froböse ist freiberuflicher Wissenschafts* und Wirtschaftsjournalist für 
Chemie, Biotechnologie, Umwelt, Energie, Raumfahrt, Medizin und IT*Technik 
Website: http://www.froboese.com. Eine Meldung vom Medienbüro Sohn. Für den 
Inhalt ist das Medienbüro Sohn verantwortlich. 
 
 

(END) Dow Jones Newswires

November 04, 2008 08:21 ET (13:21 GMT)

© 2008 Dow Jones News
Die USA haben fertig! 5 Aktien für den China-Boom
Die Finanzwelt ist im Umbruch! Nach Jahren der Dominanz erschüttert Donald Trumps erratische Wirtschaftspolitik das Fundament des amerikanischen Kapitalismus. Handelskriege, Rekordzölle und politische Isolation haben eine Kapitalflucht historischen Ausmaßes ausgelöst.

Milliarden strömen aus den USA – und suchen neue, lukrative Ziele. Und genau hier kommt China ins Spiel. Trotz aller Spannungen wächst die chinesische Wirtschaft dynamisch weiter, Innovation und Digitalisierung treiben die Märkte an.

Im kostenlosen Spezialreport stellen wir Ihnen 5 Aktien aus China vor, die vom US-Niedergang profitieren und das Potenzial haben, den Markt regelrecht zu überflügeln. Wer jetzt klug investiert, sichert sich den Zugang zu den neuen Wachstums-Champions von morgen.

Holen Sie sich den neuesten Report! Verpassen Sie nicht, welche 5 Aktien die Konkurrenz aus den USA outperformen dürften, und laden Sie sich das Gratis-PDF jetzt kostenlos herunter.

Dieses exklusive Angebot gilt aber nur für kurze Zeit! Daher jetzt downloaden!
Werbehinweise: Die Billigung des Basisprospekts durch die BaFin ist nicht als ihre Befürwortung der angebotenen Wertpapiere zu verstehen. Wir empfehlen Interessenten und potenziellen Anlegern den Basisprospekt und die Endgültigen Bedingungen zu lesen, bevor sie eine Anlageentscheidung treffen, um sich möglichst umfassend zu informieren, insbesondere über die potenziellen Risiken und Chancen des Wertpapiers. Sie sind im Begriff, ein Produkt zu erwerben, das nicht einfach ist und schwer zu verstehen sein kann.