Excel-Tabellen
Excel-Dateien sind weit verbreitet und werden häufig für die Speicherung und Analyse von Daten in Tabellenform verwendet. Sie bieten umfangreiche Funktionen für die Datenmanipulation und -visualisierung. In diesem Kapitel werden wir uns eingehend mit dem Lesen und Schreiben von Excel-Dateien in Python mithilfe der pandas
-Bibliothek beschäftigen.
Schreiben einer Excel-Datei
Das Speichern von Daten in eine Excel-Datei ist mit der pandas
-Bibliothek sehr einfach. Die Methode df.to_excel()
ermöglicht das Speichern eines DataFrame in eine Excel-Datei:
import pandas as pd
# Daten erstellen
= {
daten "Name": ["Max", "Anna", "Tom"],
"Alter": [24, 30, 22],
"Stadt": ["Berlin", "Hamburg", "München"]
}
= pd.DataFrame(daten)
df
# Excel-Datei speichern
'daten.xlsx', index=False) df.to_excel(
Importieren der Pandas-Bibliothek:
python import pandas as pd
Erstellen von Daten:
- Daten können in Form eines Dictionaries erstellt und anschließend in einen DataFrame konvertiert werden.
= { daten "Name": ["Max", "Anna", "Tom"], "Alter": [24, 30, 22], "Stadt": ["Berlin", "Hamburg", "München"] } = pd.DataFrame(daten) df
Speichern der Daten in eine Excel-Datei:
python # Excel-Datei speichern df.to_excel('daten.xlsx', index=False)
- Argumente:
- Der erste Parameter ist der Dateiname (
'daten.xlsx'
). Wenn kein Pfad angegeben ist, wird die Datei im aktuellen Arbeitsverzeichnis gespeichert. index=False
stellt sicher, dass die Zeilenindizes nicht in die Excel-Datei geschrieben werden. Andernfalls würde eine zusätzliche Spalte mit den Indizes in der Excel-Datei erscheinen.
- Der erste Parameter ist der Dateiname (
- Argumente:
Lesen einer Excel-Datei
Die Methode pd.read_excel()
der Pandas Bibliothek ermöglicht das Einlesen von Daten aus Excel-Dateien in einen DataFrame:
import pandas as pd
# Excel-Datei lesen
= pd.read_excel('daten.xlsx')
df
df
Importieren der Pandas-Bibliothek:
python import pandas as pd
Lesen der Excel-Datei:
python # Excel-Datei lesen df = pd.read_excel('daten.xlsx')
Argumente:
- Der erste Parameter ist der Pfad zur Excel-Datei (
'daten.xlsx'
). Wenn sich die Datei nicht im aktuellen Arbeitsverzeichnis befindet, muss der vollständige Pfad angegeben werden.
- Der erste Parameter ist der Pfad zur Excel-Datei (
Beispiel:
= pd.read_excel('/pfad/zur/datei/daten.xlsx') df
Ausgeben des DataFrame:
python df
- Dies zeigt den Inhalt des DataFrame an, der die Daten aus der Excel-Datei enthält.
Erweiterte Funktionen
Wenn eine Excel-Datei mehrere Blätter (Sheets) enthält, können Sie ein spezifisches Blatt einlesen, indem Sie den sheet_name
Parameter verwenden.
= pd.read_excel('daten.xlsx', sheet_name='Sheet1') df
Sie können auch Daten auf ein spezifisches Blatt schreiben:
'daten.xlsx', sheet_name='Sheet1', index=False) df.to_excel(
Mit ExcelWriter
können Sie mehrere DataFrames in verschiedene Blätter derselben Excel-Datei schreiben:
with pd.ExcelWriter('mehrere_blaetter.xlsx') as writer:
='Blatt1')
df1.to_excel(writer, sheet_name='Blatt2') df2.to_excel(writer, sheet_name
Sie können das Format der geschriebenen Excel-Datei weiter anpassen, z.B. die Breite der Spalten einstellen oder Formatierungen hinzufügen, indem Sie die xlsxwriter
-Engine in Pandas verwenden (anstelle des Standard-Moduls openpyxl
). Dazu muss zunächst das Modul XlsxWriter
installiert werden. Folgen Sie dazu diesen Hinweisen.
with pd.ExcelWriter('formatiert.xlsx', engine='xlsxwriter') as writer:
='Sheet1')
df.to_excel(writer, sheet_name= writer.book
workbook = writer.sheets['Sheet1']
worksheet 'A:A', 20) # Setzt die Breite der Spalte A auf 20 worksheet.set_column(
Zusammenfassung
In diesem Kapitel haben wir gelernt, wie man Excel-Dateien in Python mit der pandas
-Bibliothek liest und schreibt. Diese Fähigkeiten sind essenziell für die Arbeit mit tabellarischen Daten und ermöglichen es Ihnen, Excel-Dateien effizient in Ihre Datenanalyse-Workflows zu integrieren. Wir haben auch einige erweiterte Funktionen behandelt, die Ihnen helfen, komplexere Aufgaben mit Excel-Dateien zu bewältigen.