Sortierung

Sortierung bezeichnet den Vorgang des Ordnens. Davon leiten sich die Worte sortieren (als Tätigkeit), sortiert (als Zustand) und Sortiment (als Oberbegriff) ab.

Beim Sortieren wird über die sortierte Menge nach einem einheitlichen Sortierkriterium eine festgelegte Ordnungsreihenfolge hergestellt. Dies geschieht im allgemeinen aufsteigend (abc..., 123..., klein/mittel/groß...), aber auch absteigende Sortierung (rückwärts) ist möglich (zyx..., 99 98 97..., groß/mittel/klein...) und kann sinnvoll sein.

Zweck der Sortierung ist, durch die hergestellte Ordnung

Ein griffiges Sprichwort besagt: Wer Ordnung hält, ist nur zu faul zum Suchen.
Dabei wird auf den gewonnenen Zeitvorteil beim Suchen im Verhältnis zum einmaligen Aufwand für das Einordnen abgehoben. Offensichtlich wird der Vorteil des Sortierens vor allem beim Suchen in sehr umfangreichen Mengen und wenn dies sehr häufig geschieht, wie z.B. im Lager eines Versandhandels, in einem Lexikon oder in einer Datenbank wie hier bei diesem Artikel in Wikipedia.

Sortieren kann man sowohl Gegenstände als auch Informationen (Daten).

Typisch gegenständliche Sortierungen werden nach Farbe, Größe, Gewicht, Volumen, Material und Typ vorgenommen. Es liegt somit oftmals eine messtechnisch bestimmbare Größe zugrunde, deren Zahlenwert das Sortierkriterium bildet. Andere nicht-messbare Sortierkriterien müssen in der Reihenfolge festgelegt werden, z.B. bei Farben (rot, blau, grün ist nicht besser oder schlechter als blau, grün, rot).

In der Informationsverarbeitung werden meist Namen, Nummern und ähnliche Größen geordnet. Karteien, Listen und Verzeichnisse sind die typischen Ergebnisse eines Sortiervorgangs. Das ideale Beispiel für eine Sortierung ist eine Enzyklopädie in Buchform oder ein Telefonbuch.

Die Informatik kennt verschieden leistungsfähige Sortieralgorithmen, z.B. Bubblesort oder Quicksort.

Inhaltsverzeichnis

Alphabetische Sortierung

Die DIN 5007 beschreibt unter dem Titel „Ordnen von Schriftzeichenfolgen (ABC-Regeln)“ das Sortieren. Die Besonderheiten im deutschsprachigen Raum beschränken sich im Wesentlichen auf die Umlaute Ä/ä, Ö/ö, Ü/ü und die Ligatur ß. Hierauf fußen im weiteren die praktischen Variationsmöglichkeiten.

Ausländische Sonderzeichen werden gegebenenfalls nach spezifischen Bedingungen sortiert.

DIN 5007-1 Sortierung (wird für Wörter verwendet, Beispiel: Lexikon)

DIN 5007-2 Sortierung (wird für Namen verwendet, Beispiel: Telefonbuch)

Österreichische Sortierung (für österreichische Telefonbücher)

Schwedische Sortierung (hier nur als Auszug wiedergegeben)

Englische Sortierung (auch allgemeine Sortierung)

Beispiel

DIN 5007-1
(Lexikon)
DIN 5007-2
(Telefonbuch)
Österreichische
Sortierung
Göbel
Goethe
Goldmann
Götz
Göbel
Goethe
Götz
Goldmann
Goethe
Goldmann
Göbel
Götz


Computersysteme codieren die gespeicherten Zeichenketten meist mittels des ASCII-, seltener noch des EBCDIC-Codes und ordnen die Zeichen (einschließlich Leerzeichen, Satz- und Sonderzeichen) nach dem zugeordneten Zahlenwert dieses Codes.

Datenbankprogramme und Verlagsprogramme (zum Beispiel für Telefonbuchverlage) wenden aber mehr und mehr die richtige nationale Sortierung nach einer der traditionellen Normen an. Dabei gibt es Möglichkeiten, auf die Sortierreihenfolge durch individuelle Kodierung oder Parametrierung Einfluss zu nehmen.

Als neuere Codierung erlangt Unicode eine immer weitere Verbreitung und Unterstützung.

Aktuelles Problem

Ein aktuelles Beispiel dieser Problematik existiert (noch) direkt hier in der Wikipedia:
Die Sortierung bei den Kategorien funktioniert derzeit (5/2005) noch nach Ascii und nicht nach den Regeln des deutschen Telefonbuchs, so dass z.B. ä nach z kommt, z.B. treten bei der Kategorie der Fotografen Kategorie:Fotograf die Namen Häusser, Höpker nach Hz auf, wo sie niemand sucht (nur deshalb ist es ein "Problem"). Wenn die schon geplante Nationalisierung der Wikipedia implementiert ist (ä ist dann wie ae sortiert), ist dieses Problem behoben, und alles wird an der erwarteten Stelle gefunden werden - was für eine Enzyklopädie essentiell ist.

Siehe auch

Ranking, Runden, SQL, MySQL, Umlaut, Ligatur, Rückläufige Sortierung, lexikografische Sortierung, Topologische Sortierung

See also: Sortierung, ASCII, Bubblesort, DIN, Datenbank, EBCDIC, Enzyklopädie, Histogramm, Index (Verzeichnis), Informatik