IDNA
IDNA (Internationalizing Domain Names in Applications) ist ein Internetstandard, um Domains, die Nicht-ASCII-Buchstaben enthalten, als gültige ASCII-Strings im Domain Name System abzubilden. Einen solche Domainnamen bezeichnet man als IDN (Internationalized Domain Name), im deutschen Sprachraum trivial auch Umlautdomain.
Unicode-Domains werden mittels der Verfahren Nameprep und Punycode zu ASCII-Strings umgewandelt, welche als ACE-Strings (ASCII Compatible Encoding) bezeichnet werden. Die Umwandlung erfolgt beim Client (z. B. dem Browser oder Mailprogramm), sodass die Server-Infrastruktur nicht verändert werden muss. Statt der Unicode-Strings kann der Benutzer im Client auch direkt die ACE-Strings eingeben. So können auch Clients ohne IDN-Fähigkeit mit internationalen Domains arbeiten, sofern der Benutzer den ACE-String kennt. Da dies jedoch umständlich ist, wird es nur empfohlen, wenn die Software nicht IDN-tauglich ist.
Grundsätzlich sind alle Unicode-Zeichen in IDNs zulässig. Das "ß" wurde als identisch mit "ss" deklariert und wird bei der Normalisierung in ss umgewandelt, so dass zum Beispiel "Pleiße" identisch ist mit "Pleisse". Jede Vergabestelle für Domains regelt separat, welche Zeichen sie für die von ihr vergebenen (Sub-)Domains erlaubt. Seit dem 1. März 2004 können neben den 37 gebräuchlichen Zeichen (26 Buchstaben des lateinischen Alphabets, 10 Ziffern und das Minus-Zeichen) für deutsche (.de) Second-Level-Domains 92 und für schweizerische (.ch) und liechtensteinische (.li) Domains 31 weitere Zeichen benutzt werden. Seit dem 31. März 2004 sind für österreichische Domains (.at) 34 weitere Zeichen erlaubt. Afilias, zuständig für .info-Domains, lässt nur die zeichen ä, ö und ü zu.
| Inhaltsverzeichnis |
Verarbeitung des Unicode-Strings
Zunächst wird eine Unicode-Domain durch Nameprep normalisiert, das heißt Großbuchstaben werden zu Kleinbuchstaben und als äquivalent definierte Zeichen werden in die Normalform im ASCII-Code umgewandelt (so ist ß zu ss äquivalent, es wird also aus StRAße strasse).
Im Anschluss an die Normalisierung werden mittels Punycode die Nicht-ASCII-Buchstaben aus dem Namen entfernt und am Ende des Namens ein daraus abgeleiteter ASCII-String hinzugefügt, in dem die Position und Art des Unicode-Zeichens kodiert ist. Um einen IDN- von einem ASCII-Domainnamen zu unterscheiden, beginnt der Punycode-String mit dem vorangestellten Prefix xn--.
Zeichensätze
.de-Domains
à á â ã ä å ā ă ą æ ç ć ĉ ċ č ď đ è é ê ë ē ĕ ė ę ě ŋ ð ĝ ğ ġ ģ ĥ ħ ì í î ï ĩ ī ĭ į ı ĵ ķ ĸ ĺ ļ ľ ł ñ ń ņ ň ò ó ô õ ö ø ō ŏ ő œ ŕ ŗ ř ś ŝ ş š ţ ť ŧ þ ù ú û ü ũ ū ŭ ů ű ų ŵ ý ÿ ŷ ź ż ž
.com-, .net-Domains
à á â ã ä å ā ă ą æ ç ć ĉ ċ č ď đ è é ê ë ē ĕ ė ę ě ŋ ð ĝ ğ ġ ģ ĥ ħ ì í î ï ĩ ī ĭ į ı ĵ ķ ĸ ĺ ļ ľ ł ñ ń ņ ň ò ó ô õ ö ø ō ŏ ő œ ŕ ŗ ř ś ŝ ş š ţ ť ŧ þ ù ú û ü ũ ū ŭ ů ű ų ŵ ý ÿ ŷ ź ż ž
.info-Domains
ä ö ü
.at-Domains
à á â ã ä å æ ç è é ê ë ð ì í î ï ñ ò ó ô õ ö ø oe š þ ù ú û ü ý ÿ ž
.ch und .li-Domains
à á â ã ä å æ ç è é ê ë ð ì í î ï ñ ò ó ô õ ö ø þ ù ú û ü ý ÿ
Beispiel-Domainnamen
- www.dömain.de → www.xn--dmain-jua.de
- www.kühe-mögen-äpfel.de → www.xn--khe-mgen-pfel-jfb9x9c.de
- www.äaa.de → www.xn--aa-uia.de
- www.aäa.de → www.xn--aa-via.de
- www.aaä.de → www.xn--aa-wia.de
- déjà.vu → xn--dj-kia8a.vu
- foo.âbcdéf.bar → foo.xn--bcdf-9na9b.bar
- www.dreiländereck-vogtland.de → www.xn--dreilndereck-vogtland-91b.de
Zum Ausprobieren: mit beiden URLs gelangt man zur selben Seite. Startet man die Site www.dreiländereck... mit www.xn--dreilndereck... (dem xn-Locator, bei Microsoft Windows über Start > Ausführen... > OK), so wird nicht etwa xn... angezeigt, sondern der Domainname mit dem Umlaut. Hat man "Vervollständigung ..." im Browser eingeschaltet, so kann man den xn-URL sehen, wenn man nur "http://www.xn" eingibt und vorher schon einmal die Seite mit Umlaut oder xn aufgerufen hatte.
Eine WhoIs-Abfrage der Form whois -h whois.denic.de -- -C ISO-8859-1 umlautdomain.de bzw. whois -h whois.denic.de -- -C UTF-8 umlautdomain.de auf Unicode-basierenden Systemen liefert bei registrierten Domains u. a. die Schreibweise in Punycode.
Browser
Um IDN benutzen zu können, muss ein Browser, der ja auch ein Client ist, dazu fähig sein, den in der URL-Zeile eingegebenen internationalen Domainnamen (z. B. mit Umlauten) in einen ACE-String umzuwandeln.
Liste IDN-fähiger Browser:
- Mozilla ab Version 1.4, Netscape Navigator ab Version 7.1
- Firefox ab Version 0.8
- Konqueror ab KDE 3.2 mit GNU IDN Library
- Opera ab Version 7.11
- Safari ab Version 1.2 (v125)
- Microsoft Internet Explorer kann ab Version 5.0 durch die Installation des Plugins i-nav von VeriSign (siehe Weblinks) (bedingt) IDN-fähig gemacht werden. Mit IE 6 treten jedoch trotz Plugin fehlerhafte Abläufe (z. B. speziell bei Wikipedia) auf. Ab der im Sommer 2005 erscheinenden Version 7 wird es voraussichtlich eine weitgehende IDNA-Unterstützung geben.
Weblinks
- Download: Plugin von VeriSign, um den IE5/6 IDN-fähig zu machen
- DENIC: FAQs zu IDNs
- Häufige Fragen zu IDNs und IDN-Tauglichkeitstest für Browser
- Österreich: Liste der 34 neuen Zeichen (.at)
- Deutschland: Liste der 92 neuen Zeichen (.de)
- Schweiz/Liechtenstein: Liste der 31 neuen Zeichen (.ch und .li)
- RFC 3490 - Internationalizing Domain Names in Applications (IDNA)
- RFC 3491 - Nameprep: A Stringprep Profile for Internationalized Domain Names (IDN)
- RFC 3492 - Punycode: A Bootstring encoding of Unicode for Internationalized Domain Names in Applications (IDNA)
- IDN Info, ShowACE - Erweiterungen für Firefox zum Vorbeugen von Pishing-Attacken
