CSV-Datei

Eine CSV-Datei ist eine Text-Datei, die tabellarisch strukturierte Daten enthält und vorrangig zum Datenaustausch verwendet wird. Das Kürzel CSV steht dabei für Character Separated Values oder Comma Separated Values, weil die einzelnen Werte durch ein spezielles Trennzeichen - in vielen Fällen das Komma - getrennt werden. Ein offizieller Standard für das Dateiformat existiert nicht.

Kommt das Trennzeichen in den Datenelementen vor, so müssen vor und hinter dem Element Anführungszeichen (") stehen. Ist ein Anführungszeichen selbst Teil des Datenelements, so wird es verdoppelt. Das Datenelement wird in diesem Fall auch in Anführungszeichen geschrieben.

Das Trennzeichen muss nicht das Komma sein, auch Semikolon, Doppelpunkt, Tabulator und andere Zeichen sind üblich.

Einzelne Datensätze werden in der Regel durch einen Zeilenumbruch (bei Windows: CR LF = carriage return, line feed; bei Unix: nur LF; bei Mac OS: nur CR) getrennt. In der ersten Zeile stehen oft die Feldnamen.

Das CSV-Format ist unabhängig von Zeichencodierung, Byte-Reihenfolge und Zeilenumbruchszeichen.

Beispiel: Inhalt einer CSV-Datei (hier mit Semikolon als Trennzeichen)

Stunde;Montag;Dienstag;Mittwoch;Donnerstag;Freitag
 1;Mathe;Deutsch;Englisch;Mathe;Kunst
 2;Sport;Französisch;Geschichte;Sport;Geschichte
 3;Sport;"Religion ev;kath";Kunst;Deutsch;Kunst
 

In diesem Beispiel werden die Hochkommata verwendet, um das Semikolon zwischen ev und kath in der letzten Zeile als Text zu kennzeichnen. Das 3. Element dieser Zeile würde nach einem Import also Religion ev;kath lauten.

Beim Import einer solchen Texttabelle in eine Tabellenkalkulation o.ä. muss immer angegeben werden, ob die erste Zeile die Feldnamen enthält (hier: ja), welches das Feldtrennzeichen ist (hier: Semikolon), und wie die Datensätze untereinander getrennt sind (hier: CR LF).

Anderes Beispiel:

ID|Kundennummer|Name|Vorname|Anrede
 1|123|Mustermann|Karl|Herr
 2|453|Mustermann|Sabine|Frau
 3|651|Mustersen|Jens|Pater
 

CSV-Dateien tragen auch oft die Dateiendung .txt statt .csv und können auch in jedem Texteditor erstellt und bearbeitet werden.

Das CSV-Dateiformat wird oft benutzt, um Daten zwischen unterschiedlichen Computerprogrammen auszutauschen (es ist also ein Austauschformat). Die Verwendung des Formates in den von Microsoft Excel verwendeten Formen hat sich als Pseudostandard etabliert. Für neuere Anwendungen wird XML verwendet.

Siehe auch: ASCII

See also: CSV-Datei, ASCII, Austauschformat, Byte-Reihenfolge, Computerprogramm, Datei, Dateiformat, Daten, Datenaustausch, Datensatz