Sprachsynthese

Sprachsynthese nennt man die Erzeugung von gesprochener Sprache durch einen Computer. Ziel ist es dabei, der menschlichen Stimme nahe zu kommen.

Sprachsynthese wird auch synonym zu Vorleseautomat oder Text-to-Speech-System verwendet. Dabei wird ein geschriebener Text in ein Sprachsignal umgewandelt.

Grundsätzlich lassen sich zwei Ansätze zur Erzeugung eines Sprachsignals unterscheiden. Zum einen kann auf Sprachaufnahmen (Samples) zurückgegriffen werden, die passend verändert werden. Zum anderen kann das Signal aber auch vollständig im Rechner erzeugt werden.

Zur Zeit (Februar 2005) basieren die industriell eingesetzten Systeme vorwiegend auf bereits vorgefertigten Sprachaufnahmen. Diese werden bis auf Phonemebene indiziert, um bei der Synthese wieder passend zusammengesetzt zu werden.

Ein besonderes Problem ist für die Sprachsynthese die Erzeugung einer natürlichen Sprachmelodie (Prosodie).

Die ersten Systeme waren Formantsynthesen. In der Forschung befinden sich Systeme zur artikulatorischen Synthese, die auf einer Simulation des Vokaltrakts beruhen.

Literatur

Siehe auch

Weblinks

See also: Sprachsynthese, Baron Wolfgang von Kempelen, Computerlinguistik, DeskBot, Diphon, Formant, Intonation, Phonem, Prosodie, Sample