Aussprache der deutschen Sprache

Die Aussprache der deutschen Sprache bezeichnet die Phonetik und die Phonologie der deutschen Standardsprache, d.h. es handelt sich um die nationale Sprachvarietät der Bundesrepublik Deutschland.

Im weiteren Sinn kann darunter auch die Aussprache der deutschen Dialekte verstanden werden, siehe dazu deutsche Mundarten.

Dieser Artikel befasst sich nicht mit den nationalen Standardvarietäten der deutschen Sprache in der Schweiz und in Österreich.

Inhaltsverzeichnis

Geschichte

Anfänglich war die deutsche Standardsprache eine reine Schriftnorm. Wenn sie gesprochen wurde, dann entsprechend dem Lautstand der regionalen Mundarten.

Gegen Ende des 18. Jahrhunderts galt die sächsische Aussprache des Standarddeutschen als vorbildlich. Das lag am großen Einfluss der sächsischen Fürstentümer auf die deutsche Kultur.

Im 19. Jahrhundert wurde die norddeutsche Aussprache zur einflussreichsten. Verschiedene Faktoren haben dabei eine Rolle gespielt. Einerseits war Preußen insbesondere seit der Gründung des deutschen Kaiserreichs zur dominierenden Macht geworden, andererseits waren in vielen Gegenden Norddeutschlands die Mundarten zugunsten der Standardsprache aufgegeben worden, so dass die Sprecher eine natürliche Gewandtheit im mündlichen Gebrauch der Standardsprache erreichten.

Kodifiziert wurde die Aussprache der deutschen Sprache erst 1898 in der Deutschen Bühnensprache von Theodor Siebs. Moderne Aussprachewörterbücher stimmen im Großen und Ganzen mit der Siebs'schen Aussprache überein, wenn sie auch in verschiedenen Details von ihr abweichen (beispielsweise wird heute [r] nicht mehr als die einzige zulässige Aussprache des Phonems /r/ angesehen). Üblicherweise wird dieselbe Aussprache auch im Deutschunterricht an Ausländer gelehrt.

Variationen

Die deutsche Sprache ist plurizentrisch, das heißt, es gibt keine einheitliche Aussprache des Standarddeutschen für den gesamten deutschen Sprachraum. Vielmehr gibt es verschiedene Aussprachen des Standarddeutschen, die in den jeweiligen Regionen eine Vorbildwirkung ausüben.

Es ist nicht so, dass es nur eine dieser verschiedenen Aussprachen des Standarddeutschen die richtige wäre und alles andere dialektgefärbte Abweichungen. Diese Auffassung war früher verbreitet, als eine präskriptive Haltung üblich war, vorzuschreiben, wie die Leute sprechen sollten.

Es ist auch nicht so, dass eine bestimmte Aussprache des Standarddeutschen in Radio und Fernsehen gebraucht würde. Nachrichtensprecher aus Deutschland, Österreich und der Schweiz unterscheiden sich in ihrer Aussprache des Standarddeutschen. Der Unterschied liegt nur darin, dass es wegen der höheren Bevölkerungszahl in Deutschland mehr Sender gibt und dass diese eine größere Reichweite haben.

Das Ideal der Schreiblautung

Zu verschiedenen Zeiten ist gefordert worden, eine vorbildliche Aussprache solle sich direkt an der Schreibung orientieren. Ein Argument für die Vorbildlichkeit der norddeutschen Ausprache lautet beispielsweise, sie orientiere sich besonders stark an der Schreibung, weil die örtlichen norddeutschen Dialekte zu verschieden von der Standardsprache seien.

In Wirklichkeit gibt es jedoch Varietäten des Standarddeutschen, deren Aussprache näher an der Schreibung ist als die norddeutsche. Dies zeigt, dass sich das Ideal der Aussprache nicht an der Schreibung orientieren kann. Einige Vergleiche der norddeutschen gemäßigten Hochlautung nach Duden mit dem schweizerischen Standarddeutschen:

Aussprache

Die folgenden Ausführungen beschreiben den norddeutschen Sprachgebrauch. Das meiste gilt jedoch ebenfalls für andere Varietäten der Standardsprache, z. B. die österreichische oder die schweizerische.

Wortbetonung

In deutschen Wörtern herrscht Stammbetonung vor, das heißt es wird die erste Silbe betont: "lehren, Lehrer, Leh-re-rin, lehrhaft, Leh-rer-kol-le-gi-um." Manche Präfixe und Suffixe allerdings ziehen die Betonung auf sich: "(Aus-spra-che, vor-le-sen, Bä-cke-rei)."

Das bedeutet, dass der Akzent im Deutschen beweglich ist, da er innerhalb einer Wortfamilie variieren kann. Ein Beispiel ist "Aus-spra-che, Spra-che und be-spre-chen." Allerdings ist diese Abweichung vom Prinzip der Stammbetonung eine Folge späterer Neubildungen. So findet man oft keine Stammbetonung bei Worten, die noch die semantische Eigenständigkeit zwischen Präfix und Stammwort erkennen lassen: ein-füh-ren, hinaus-ge-hen. Auch erhielten manche Substantive, die in Analogie zu präfigierten Verben gebildet wurden, die Betonung auf dem Präfix: "Ü-ber-fall, ü-ber-fallen").

Bei zusammengesetzten Wörtern (Komposita) wird immer das erste Wort (Bestimmungswort) betont. Die betonte Silbe wird im Vergleich zu den unbetonten stärker und damit lauter gesprochen (dynamischer Akzent). Silben mit langem Vokal können zusätzlich gedehnt werden, um dem betreffenden Wort mehr Gewicht zu verleihen (temporaler Akzent). Der Hauptakzent liegt im Satz auf dem Rhema, meistens gegen Ende des Satzes.

Für Fremdwörter im Deutschen lassen sich keine Regeln angeben, da die Betonung häufig zusammen mit dem Wort übernommen wird.

Intonation

Deutsch kennt drei verschiedene Melodieverläufe, nämlich fallende, steigende und schwebende (progrediente) Intonation. Die fallende Intonation kennzeichnet den Satzschluss bei Aussagesätzen und Wortfragen wie zum Beispiel bei den Sätzen: Wann kommst du?Ich komme jetzt. Die schwebende Intonation wird bei Pausen wie zum Beispiel zwischen Haupt- und Nebensatz verwendet. Die steigende Intonation ist typisch für Satzfragen (auch Entscheidungsfragen) wie zum Beispiel: Isst du gerne Schokolade? Auch Wortfragen können mit steigender Intonation gesprochen werden, wenn man ihnen einen freundlichen Ton verleihen will.

Die Hebung oder Senkung der Stimme erfolgt ausgehend von der letzten betonten Silbe im Satz. Bei fallender Intonation wird diese Silbe etwas höher gesprochen als die Vorangehenden. Die nachfolgenden Silben fallen dann bis unter das Niveau des Satzes. Ist die letzte betonte Silbe ein einziges Wort, findet diese Melodiebewegung innerhalb dieses Wortes statt. Bei steigender Intonation wird die letzte betonte Silbe analog etwas tiefer gesprochen.

Rhythmus

Die deutsche Sprache ist gekennzeichnet durch einen so genannten "punktierten Sprechrhythmus". Unter dem Rhythmus einer Sprache versteht man die zeitliche Gliederung der Rede. Sie ergibt sich aus den immer wiederkehrenden und nach einer der entsprechenden Sprache bestimmten Regel untergeordneten Bewegungen der Atemmuskulator. Die betonte Silbe überragt im Deutschen die unbetonten Silben nicht nur in ihrer Schallfülle sondern auch hinsichtlich ihrer Länge: alle auf eine betonte Silbe folgenden unbetonten Silben werden fast stets kürzer gesprochen. Dass es auch andere Sprachrhythmen geben kann, zeigen beispielsweise das Italienische und das Spanische, bei denen die Silben, unabhängig davon, ob sie betont oder unbetont sind, jeweils ungefähr die gleiche Länge haben. Vom Deutschen unterscheidet sich das Englische dadurch, dass dort unbetonte Silben nur kürzer gesprochen werden, wenn sie nicht zur selben syntaktischen Einheit wie die betonte Silbe gehört.

Vokalsystem

Das Vokalsystem des Deutschen ist mit 15 Vokalphonemen ziemlich groß, die Spanische Sprache zum Beispiel kennt nur sieben. Diese Vokalphoneme werden durch die acht Vokalbuchstaben a, e, i, o, u, ä, ö und ü dargestellt, sowie durch y, welches jedoch auch als Konsonant verwendet wird.

Die Vokalphoneme der betonten Silben werden oft in Paare aus "geschlossenem" und "offenem" Vokal eingeteilt, die sich in ihrer Länge und Qualität voneinander unterscheiden: // und /a/, // und /ɛ/, // und /ɪ/, // und /ɔ/, // und /ʊ/, /ɛː/ und /ɛ/, /øː/ und /œ/ und // und /ʏ/.

Ritt /rɪt/ und riet /riːt/ unterscheiden sich beispielsweise auch in der Qualität voneinander, wie die Notation des Internationalen Phonetischen Alphabets zeigt. Die Mehrzahl der langen Vokalphoneme werden also geschlossener ausgesprochen und sind andere Phoneme als ihre kurzen verschrifteten Entsprechungen.

Ähnliche Vokalpaare betonter Silben wie im Deutschen hat es in allen germanischen Sprachen.

[ɛː] wie in "Käse" stellt in dem System der Vokalpaare betonter Silben eine Ausnahme dar, da er der einzige lange offene Vokal im Deutschen ist. In verschiedenen nördlichen Varietäten der Standardsprache fällt dieser Laut jedoch mit [] zusammen, d.h. der Vokal in "Käse" und in "Seele" haben oft den gleichen Lautwert. Daher ist der Status dieses Lauts als eigenständiges Phonem des Deutschen umstritten.

Die deutschen Monophthonge
Laut Beschreibung
i(ː) geschlossener, palataler, langer Monophthong mit Lippenspreizung wie in Miete (lang), vital (kurz).
ɪ fast halbgeschlossener, palatal bis zentraler, kurzer Monophthong mit leichter Lippenspreizung wie in Mitte.
e(ː) halbgeschlossener, palataler, langer (oder kurzer) Monophthong mit Lippenspreizung wie in stehlen (lang) bzw. Genom (kurz).
ɛ(ː) halboffener, palataler, langer Monophthong mit leichter Lippenspreizung wie in Käse (lang) bzw. Stelle, ächten (kurz).
ə fast halbgeschlossener, zentraler, kurzer Monophthong mit neutraler Lippenspreizung wie in bitte.
a(ː) offener, zentraler bis velarer, langer Monophthong mit offener Lippenrundung wie in kam (lang) bzw. Kamm (kurz).
o(ː) halbgeschlossener, velarer, langer Monophthong mit vorgestülpter Lippenrundung wie in Ofen (lang) bzw. Roman (kurz).
ɔ halboffener, velarer, kurzer Monophthong mit leicht offener Lippenrundung wie in offen
u(ː) geschlossener, velarer, langer Monophthong mit vorgestülpter Lippenrundung wie in Mut (lang) bzw. Rubin (kurz).
ʊ fast halbgeschlossener, velar bis zentraler, kurzer Monophthong mit geschlossener, aber nicht vorgestülpter Lippenrundung wie in Mutter.
ø(ː) halbgeschlossener, palatal bis zentraler, langer Monophthong mit vorgestülpter Lippenrundung wie in Höhle (lang) bzw. Ödem (kurz).
œ halboffener, palatal bis zentraler, kurzer Monophthong mit vorgestülpter Lippenrundung wie in Hölle.
y(ː) geschlossener, palataler, langer Monophthong mit vorgestülpter Lippenrundung wie in müßig (lang) bzw. Physik (kurz).
ʏ fast halbgeschlossener, palatal bis zentraler, kurzer Monophthong mit vorgestülpter Lippenrundung wie in müssen.
Die deutschen Diphthonge
Laut Beschreibung
aʊ̯ der zentrierende Diphthong setzt mit einem [a] wie in Schwamm ein, und gleitet in Richtung auf das deutsche [ ʊ ], wobei die Lippen von neutraler zu leichter Rundung übergehen. Beispiel: Haus.
aɪ̯̯ der zentrierende Diphthong setzt mit einem [a] wie in Schwamm ein, und gleitet in Richtung auf das deutsche [ɪ], das jedoch selten erreicht wird. Beispiel: Heim.
ɔʏ̯ der zentrierende Diphthong setzt mit einem halboffenen, leicht gerundeten [ɔ] wie in Gott ein, und gleitet in Richtung [ʏ], wobei die leichte Rundung der Lippen zum Ende hin fast verloren geht (aus [ʏ] wird fast [ɪ]). Beispiel: Eule.

Phonotaktik

Ein typisches Merkmal für den phonotaktischen Aufbau deutscher Wörter sind relativ komplexe Konsonantencluster in den Wortstämmen, konjugierten Formen und an der Wortfuge, die in der geschriebenen, graphotaktischen Form (wegen der verwendeten Di- und Trigraphen) oft besonders komplex wirken (z.B. kleckste, auftrumpfen, Angstschweiß, schreiben, ernst, schrumpfst, trittst, knutschst, hältst, Herbst, jetzt, Schrift, Schnitt).

Dies verleiht der Sprache einen konsonantischen Charakter. Silbische Vokale (Monophthonge) treten (außer in Fremdwörtern: Bio, Chaos usw.) nur dort nacheinander auf, wo ein langer Vokal auf die typischen Wortausgänge mit Schwa ("gemurmeltes e"), -ig, -ung o.a. trifft (gehen, tue, Erziehung, fähig).

Verschriftung

Duden-Rechtschreibung

Vokale

Die deutsche Rechtschreibung bezeichnet die Quantität (Länge) und damit auch die Qualität der Vokale nur indirekt. Trotzdem kann die Quantität der Vokale kann meistens aus der Schreibung abgeleitet werden.

Länge kann durch doppelten Vokalbuchstaben ("aa", "ee", "oo", z. B. wie in "Tee"), Vokalbuchstabe plus h (z. B. "ah" wie in "Zahl", "ih" wie in "ihm") oder für [i:] außerdem durch die Buchstabenkombination "ie" oder "ieh" (wie in "Liebe" oder "ziehen") gekennzeichnet werden.

Ebenfalls lang sind Vokale ganz regelmäßig in offenen Silben wie das "e" in "Leben" oder das "a" in "raten".

Eine offene Silbe liegt dann vor, wenn im Wort ein einzelner Konsonantenbuchstabe plus Vokalbuchstabe folgt. Denn ein einzelner Konsonantenbuchstabe gehört in der Regel zur nächsten Silbe.

Kurz sind dagegen Vokale häufig in geschlossenen Silben, vor allem wenn im Wort weitere Silben folgen ("Kante", "Hüfte", "Wolke").

Von daher leitet sich die Regel ab, dass zwei gleiche Konsonantenbuchstaben (ebenso "ck" und "tz") nach einem einzelnen Vokal dessen Kürze signalisieren (zum Beispiel in "Sonne", "irren", "Ratte", "Masse"), da der doppelt dargestellte Konsonant zu beiden Silben gehört und damit die erste Silbe zu einer geschlossenen macht.

Umgekehrt deutet daher ein einzelner Konsonantenbuchstabe (inkl. ß, dessen Entstehung und Gebrauch u. a. gerade in der funktionalen Abgrenzung zu "ss" begründet ist) die Länge des vorangehenden Vokals an ("Krone", "hören", "raten", "Maße"), da er, wie gesagt, den Vokal in einer offenen Silbe stehen lässt. (Ausnahme: der Konsonantenbuchstabe x – vor "x" wird ein einzelner Vokalbuchstabe immer kurz gesprochen, z. B. "Hexe", "Axt".)

Ebenfalls lang sind Vokale, die zwar in geschlossenen Silben stehen, welche aber so erweitert werden können, dass eine offene Silbe entsteht. Bei "hörst" handelt es sich um eine geschlossene Silbe, "hö" in "hören" ist offen, deshalb wird auch das "ö" in "hörst" lang gesprochen.

Ebenfalls lang sind Vokale, die zwar in geschlossenen Silben stehen, welche nicht zu offenen Silben erweiterbar sind, welche aber erkennbar in Parallele zu solchen erweiterbaren Silben aufgebaut sind. "Obst" hat einen erkennbar parallelen Aufbau zu "lobst" (von "loben"), da von der Aussprache her statt b eigentlich der Buchstabe p zu erwarten wäre.

So lässt sich verallgemeinern: Lang sind Vokale vor den Konsonantenbuchstaben "b", "d", "g", "ß" (wenn "t", "s" oder "st" folgt), sowie vor "gd" und "ks". (Diese markieren die lange Aussprache, da sie anstelle von sonst zu erwartenden "p", "t", "k", "s"; "kt" und "x"/"chs" stehen.) Die Vorhersagbarkeit der Vokallänge gilt vor diesen Konsonantenbuchstaben also unabhängig von der Erweiterbarkeit der Silben. Vgl.: "Obst"/"lobst" (lang) vs. "optisch" (kurz), "Krebs"/"lebst" vs. "Klops", "beredt"/"lädt" vs. "nett", "Vogt"/"legt" vs. "Sekt", "spaßt" vs. "fast", "Magd"/"Jagd" vs. "Akt", "Keks"/"piksen" vs. "fix". In Eigennamen gilt dies auch für "w" (statt "f") und "sd" (statt "st"): "Drews", "Dresden".

Vor anderen Häufungen von Konsonantenbuchstaben sind die Vokale in der Regel kurz (da es sich hier oft um geschlossene Silben handelt). Allerdings gibt es einige, vor denen Vokale kurz oder lang vorkommen können ("tsch", "st", "chs", "nd", "rd" u. a.) oder in der Regel lang sind ("br", "kl", "tr" u. a.); insbesondere vor Di- und Trigrafen: vor "ch", "sch" meist kurz, vor "ph", "th" meist lang).

Einzelne Vokale in Wörtern aus geschlossenen Silben mit nur einem Konsonantenbuchstaben am Ende, die aber keine erweiterte Form mit langem Vokal haben (in der Regel Funktionswörter und Präfixe), wie zum Beispiel bei "mit", "ab", "um", "un-" (nach alter Rechtschreibung auch "daß", "miß-"), werden meistens kurz gesprochen (aber lang: "dem", "nun", vor "r": "der", "er", "wir", "für", "ur-"). Diese Ausspracheregel wird unter bestimmten Bedingungen auch auf Nomen und Adjektive angewandt: Bei (orthografisch) noch nicht vollständig integrierten Wörtern aus dem Englischen und Französischen ("Top", "fit", "Bus", "chic"), bei sog. Abkürzungswörtern ("TÜV", "MAZ"), bei einigen undurchschaubaren Wortbestandteilen ("Brombeere"). Generell gilt diese Regel für Wörter mit "x" (vgl. oben) und (wenn es denn ausnahmsweise vorkommt) für Wörter mit "j" am Ende ("Fax"; "Andrej", "ahoj"). Nach alter Rechtschreibung galt dies auch für einen Teil der Wörter mit "ß": "Nuß", "Boß", "iß!". Die kurze Aussprache des Vokals in solchen Wörtern, denen orthographisch der doppelt dargestellte Konsonant am Wortende fehlt, lässt sich zum Teil daraus erschließen, dass es verwandte Formen mit orthographisch markiertem kurzen Vokal gibt (kurzer Vokal bei "in" wg. "innen", "fit" wg. "fitter", "Bus" wg. "Busse", "Top" wg. "toppen", "Nuß" wg. "Nüsse"; dagegen lang: "Biotop" wg. "Biotope", "Fuß" wg. "Füße").

In Eigennamen (Familien- und geografische Namen) kann die Vokalkürze auch vor doppelt dargestellten Konsonanten nicht immer eindeutig bestimmt werden. Insbesondere "ck", "ff", "ss" und "tz", aber auch andere, kommen dort nicht ausschließlich nur nach kurzen Vokalen vor ("Bismarck", "Hauff", "Zeiss", "Hartz", "Kneipp", "Württemberg"). So kann auch ein einzelner Vokal vor diesen Doppelbuchstaben ausnahmsweise lang sein: "Buckow", "Mecklenburg", "Bonhoeffer", "Gross", "Lietzensee".

Da in der Schweiz anstelle des Eszetts "ss" in Gebrauch ist, signalisiert dort "ss" als einziger doppelter Konsonantenbuchstabe (außerhalb von Eigennamen) nicht die Kürze des vorangehenden Vokals (neben "gg", wenn man schweizerdeutsche Wörter miteinbezieht); Länge oder Kürze des Vokals ist also in diesem Fall nicht vorhersagbar (wie sonst auch vor den Di- und Trigrafen "ch", "sch" u. a.). Allerdings werden auch in Deutschland und in Österreich die (seit 1996 für im Singular stehende Wörter mit ss geltenden) Regeln für die korrekte Verteilung von "ß" und "ss", besonders in den Fernsehmedien, in Werbung ("Heisse Tasse", "Perl weiss") und Öffentlichkeitsarbeit, oft nicht konsequent angewandt.

IPA-Umschrift auf Wikipedia

Sofern Wörterbücher oder Enzyklopädien überhaupt Ausspracheangaben machen, verwenden sie meist eine möglichst einfache Umschrift auf phonologischer Basis. Dies gilt auch für Lautschriftangaben auf Wikipedia (siehe dort).

Siehe auch

Literatur

See also: Aussprache der deutschen Sprache, 18. Jahrhundert, 19. Jahrhundert, Aspiration, Austriazismus, B, Betonung, Deutsch als Fremdsprache