Sprachsynthese
Sprachsynthese nennt man die Erzeugung von gesprochener Sprache durch einen Computer. Ziel ist es dabei, der menschlichen Stimme nahe zu kommen.
Sprachsynthese wird auch synonym zu Vorleseautomat oder Text-to-Speech-System verwendet. Dabei wird ein geschriebener Text in ein Sprachsignal umgewandelt.
Grundsätzlich lassen sich zwei Ansätze zur Erzeugung eines Sprachsignals unterscheiden. Zum einen kann auf Sprachaufnahmen (Samples) zurückgegriffen werden, die passend verändert werden. Zum anderen kann das Signal aber auch vollständig im Rechner erzeugt werden.
Zur Zeit (Februar 2005) basieren die industriell eingesetzten Systeme vorwiegend auf bereits vorgefertigten Sprachaufnahmen. Diese werden bis auf Phonemebene indiziert, um bei der Synthese wieder passend zusammengesetzt zu werden.
Ein besonderes Problem ist für die Sprachsynthese die Erzeugung einer natürlichen Sprachmelodie (Prosodie).
Die ersten Systeme waren Formantsynthesen. In der Forschung befinden sich Systeme zur artikulatorischen Synthese, die auf einer Simulation des Vokaltrakts beruhen.
Literatur
- Stöber, Karlheinz / Schröder, Bernhard / Hess, Wolfgang: Vom Text zur gesprochenen Sprache. In: Lobin, Henning / Lemnitzer, Lothar (Hrsg.): Texttechnologie. Perspektiven und Anwendungen. Tübingen:Stauffenburg 2004, S. 295-325
Siehe auch
- Voice Portal
- Computerlinguistik
- Voder
- Vocoder
- Formant
- Diphon
- Stimmverschlüsselung
- Prosodie
- Intonation
- Spracherkennung
- Baron Wolfgang von Kempelen
- DeskBot
Weblinks
- Ausführliche Liste von Sprachsynthesesystemen mit Beispielen
- Txt2Pho - wandelt deutschsprachige Texte in Phonemrepräsentation
- MBrola - Projekt zur Synthese von Sprache
- FreeTTS - ein in Java implementiertes, quelloffenes TTS-System (Text-To-Speech)
- Festvox - ein Open Source Projekt zur Sprachsynthese
