CSV Dateien in Python auslesen

You are here:

Python bietet mehrere Möglichkeiten, CSV-Dateien zu lesen. Zwei verbreitete Ansätze sind die Verwendung des `csv`-Moduls und des `pandas`-Moduls. In diesem Kapitel untersuchen wir beide Methoden.

CSV-Modul

Das `csv`-Modul ist Teil der Python-Standardbibliothek und ermöglicht das einfache Lesen und Schreiben von CSV-Dateien. Um eine CSV-Datei Zeile für Zeile zu lesen, kannst Du den `csv.reader` verwenden:

import csv
with open("beispiel.csv", "r") as datei:
    csv_reader = csv.reader(datei)
    for zeile in csv_reader:
        print(zeile)

In diesem Beispiel wird jede Zeile als Liste von Werten ausgegeben. Um auf einen bestimmten Wert in der Zeile zuzugreifen, verwende den Index:

for zeile in csv_reader:
    print(zeile[1])  # Gibt den zweiten Wert jeder Zeile aus

Um eine CSV-Datei als Dictionary zu lesen, verwende den `csv.DictReader`:

with open("beispiel.csv", "r") as datei:
    csv_reader = csv.DictReader(datei)
    for zeile in csv_reader:
        print(zeile)

Mit `csv.DictReader` wird jede Zeile als geordnetes Dictionary ausgegeben, in dem die Schlüssel die Spaltennamen der CSV-Datei sind. Du kannst auf die Werte in einer Zeile zugreifen, indem Du die entsprechenden Schlüssel verwendest:

for zeile in csv_reader:
    print(zeile["Spaltenname"])  # Gibt den Wert der Spalte "Spaltenname" aus

Pandas-Modul

Das `pandas`-Modul ist eine leistungsfähige Datenanalysebibliothek, die auch das Lesen und Schreiben von CSV-Dateien unterstützt. Um eine CSV-Datei mit `pandas` zu lesen, verwende die Funktion `read_csv()`:

import pandas as pd
daten = pd.read_csv("beispiel.csv")
print(daten)

In diesem Beispiel wird die CSV-Datei in einen `DataFrame` eingelesen, der eine tabellarische Datenstruktur darstellt. Du kannst auf die Werte im `DataFrame` zugreifen, indem Du die Spalten- und Zeilenindizes verwendest:

wert = daten.loc[0, "Spaltenname"]  # Gibt den Wert in Zeile 0 und Spalte "Spaltenname" aus
print(wert)

Um den `DataFrame` als Dictionary zu verwenden, kannst Du die Methode `to_dict()` nutzen:

daten_dict = daten.to_dict("records")  # Konvertiert den DataFrame in eine Liste von Dictionaries
print(daten_dict)

In diesem Kapitel haben wir verschiedene Möglichkeiten untersucht, CSV-Dateien in Python zu lesen, einschließlich des Zugriffs auf einzelne Werte und der Verwendung von Dictionaries. Du hast gelernt, wie Du das `csv`-Modul und das `pandas`-Modul verwenden kannst, um CSV-Dateien effizient zu verarbeiten.