Python bietet mehrere Möglichkeiten, CSV-Dateien zu lesen. Zwei verbreitete Ansätze sind die Verwendung des `csv`-Moduls und des `pandas`-Moduls. In diesem Kapitel untersuchen wir beide Methoden.
CSV-Modul
Das `csv`-Modul ist Teil der Python-Standardbibliothek und ermöglicht das einfache Lesen und Schreiben von CSV-Dateien. Um eine CSV-Datei Zeile für Zeile zu lesen, kannst Du den `csv.reader` verwenden:
import csv
with open("beispiel.csv", "r") as datei:
csv_reader = csv.reader(datei)
for zeile in csv_reader:
print(zeile)
In diesem Beispiel wird jede Zeile als Liste von Werten ausgegeben. Um auf einen bestimmten Wert in der Zeile zuzugreifen, verwende den Index:
for zeile in csv_reader:
print(zeile[1]) # Gibt den zweiten Wert jeder Zeile aus
Um eine CSV-Datei als Dictionary zu lesen, verwende den `csv.DictReader`:
with open("beispiel.csv", "r") as datei:
csv_reader = csv.DictReader(datei)
for zeile in csv_reader:
print(zeile)
Mit `csv.DictReader` wird jede Zeile als geordnetes Dictionary ausgegeben, in dem die Schlüssel die Spaltennamen der CSV-Datei sind. Du kannst auf die Werte in einer Zeile zugreifen, indem Du die entsprechenden Schlüssel verwendest:
for zeile in csv_reader:
print(zeile["Spaltenname"]) # Gibt den Wert der Spalte "Spaltenname" aus
Pandas-Modul
Das `pandas`-Modul ist eine leistungsfähige Datenanalysebibliothek, die auch das Lesen und Schreiben von CSV-Dateien unterstützt. Um eine CSV-Datei mit `pandas` zu lesen, verwende die Funktion `read_csv()`:
import pandas as pd
daten = pd.read_csv("beispiel.csv")
print(daten)
In diesem Beispiel wird die CSV-Datei in einen `DataFrame` eingelesen, der eine tabellarische Datenstruktur darstellt. Du kannst auf die Werte im `DataFrame` zugreifen, indem Du die Spalten- und Zeilenindizes verwendest:
wert = daten.loc[0, "Spaltenname"] # Gibt den Wert in Zeile 0 und Spalte "Spaltenname" aus
print(wert)
Um den `DataFrame` als Dictionary zu verwenden, kannst Du die Methode `to_dict()` nutzen:
daten_dict = daten.to_dict("records") # Konvertiert den DataFrame in eine Liste von Dictionaries
print(daten_dict)
In diesem Kapitel haben wir verschiedene Möglichkeiten untersucht, CSV-Dateien in Python zu lesen, einschließlich des Zugriffs auf einzelne Werte und der Verwendung von Dictionaries. Du hast gelernt, wie Du das `csv`-Modul und das `pandas`-Modul verwenden kannst, um CSV-Dateien effizient zu verarbeiten.