Pandas Series: Was sind Series und wie erstellt man sie?

You are here:

Eine Series ist ein Datenobjekt in Pandas, das eine eindimensionale, indexierte Sequenz von Daten enthält. Die Daten in einer Series können von jedem Pandas-Datentyp sein, wie zum Beispiel ganzzahlige Werte, Gleitkommazahlen, Zeichenfolgen oder boolesche Werte. Die Indizes in einer Series können entweder automatisch generiert werden oder explizit vom Benutzer definiert werden.

Um eine Series in Pandas zu erstellen, kannst Du eine Liste oder ein Array von Daten erstellen und diese an die Series-Funktion von Pandas übergeben. Wenn Du die Indizes nicht explizit angibst, werden sie automatisch generiert und beginnen mit 0 und erhöhen sich um 1 für jede Position in der Series. Hier ist ein Beispiel für die Erstellung einer einfachen Series mit drei Elementen:

import pandas as pd

data = [10, 20, 30]
s = pd.Series(data)
print(s)

Dies gibt folgende Ausgabe aus:

0    10
1    20
2    30
dtype: int64

Wie Du sehen kannst, wurde automatisch ein Index generiert, der auf 0 beginnt und um 1 für jede Position in der Series erhöht wird.

Wenn Du den Index explizit angeben möchtest, kannst Du ein separates Argument an die Series-Funktion übergeben, das eine Liste oder ein Array von Indizes enthält. Hier ist ein Beispiel für die Erstellung einer Series mit drei Elementen und einem benutzerdefinierten Index:

import pandas as pd

data = [10, 20, 30]
index = ['a', 'b', 'c']
s = pd.Series(data, index=index)
print(s)

Dies gibt folgende Ausgabe aus:

a    10
b    20
c    30
dtype: int64

Wie Du sehen kannst, wurden die Indizes in der Series explizit als ‘a’, ‘b’ und ‘c’ angegeben.

Wichtige Erkenntnisse:

Series sind eine wichtige Datenstruktur in Pandas und ermöglichen es Dir, eindimensionale Daten mit einem benutzerdefinierten Index zu speichern.
Du kannst eine Series erstellen, indem Du eine Liste oder ein Array von Daten an die Series-Funktion von Pandas übergeben und den Index entweder automatisch generieren oder explizit definieren.
Series können auf verschiedene Arten manipuliert werden, wie zum Beispiel durch Hinzufügen, Entfernen oder Ändern von Elementen oder durch Verwendung von Funktionen wie Gruppierung, Filterung oder Aggregation.

Abschließend lässt sich sagen, dass Series eine nützliche Datenstruktur in Pandas sind, die es Dir ermöglichen, Daten effektiv zu speichern, zu organisieren und zu manipulieren. Indem Du eine Series mit benutzerdefinierten Indizes erstellst, kannst Du eine intuitive Methode zur Verwaltung und Analyse von Daten in Pandas nutzen. Verwende die vorgestellten Konzepte, um Deine eigene Series in Pandas zu erstellen und die Manipulationsfunktionen in Pandas zu nutzen, um Deine Daten auf kreative und effektive Weise zu analysieren.

Support Seven Courses!

Lorem ipsum dolor sit amet consectetur elit dolor
donate