Auch wenn es eine ausführliche Online-Dokumentation auf der Pandas-Homepage über die Join-Funktionen existiert, trägt diese nicht gerade dazu bei, sich schnell in die unterschiedlichen Methoden und Funktionen einzufinden. Dies liegt insbesondere daran, dass die offizielle Dokumentation sehr umfassend, viele spezielle Anwendungen aufführt. Mit diesem Artikel möchte ich einige wesentliche Aspekte auf den Punkt bringen und eine kleine Heurisitik bereitstellen, um zwischen den verschiedenen Möglichkeiten Daten miteinander zu verknüpfen die richtige auszuwählen.
Datumsinformationen verarbeiten mit datetime und Timestamp
Dieser Beitrag befasst sich mit dem Thema Datumsvariablen und den in Python implementierten Klassen für deren Bearbeitung. Mit den Bibliotheken datetime und pandas stehe 2 zentrale Pakete/Klassen zur Verfügung, über die Kalenderinformationen bearbeitet bzw. extrahiert werden können. Was die elementaren Anwendungen für Datumsvariablen sind, wie sich diese in Python umsetzen lassen und welche Vor- und Nachteile die unterschiedlichen Klassen haben, lesen Sie hier.
Importtechniken in Python
Jede py-Datei mit gültigem Python Code ist auch ein Modul und kann in eine Session importiert werden. Für den Import existieren dabei unterschiedliche Techniken. Je nach Methode kann die gesamte Datei importiert werden, oder nur einzelne Konstrukte aus dieser Datei – also ausgewählte Klassen, Funktionen oder Variablen. In den folgenden Beispielen werden die unterschiedlichen Importtechniken in Python vorgestellt.
Ist Python compiliert oder interpretiert?
Soviel vorweg: Die Frage, ob es sich bei Python um eine Interpreter- oder eine Compilersprache handelt, ist nicht eindeutig zu beantworten. Zum einen weil die Definition von Compiler und Interpreter durch unterschiedlichste Technologien sehr verschwommen ist, zum anderen weil Python Grundelemente beider Sprachtypen besitzt. Die Antwort ‚beides‘ trifft es da vielleicht noch am besten. In diesem Beitrag geht es um die internen Python-Prozesse, wenn Quellcode ausgeführt wird.
Listen in Python
Mengen in Python
Die Arbeiten mit Mengen gehört zu den wesentlichen Anwendungen in der Datenanalyse. In Python ist das zentrale Werkzeug um Mengen zu bearbeiten die Funktion set(). Der resultierende Objekttyp trägt wie die Funktion den Namen set. In diesem Beitrag erfahren Sie mehr über die Arbeit mit Mengen in Python.
Mutable und Immutable Objects
Selektieren von Daten in DataFrames
Spalten / Zeilen erstellen, löschen und sortieren in pandas
Die Python Evolution zum Data-Science Tool
Guido van Rossum veröffentlichte Python im Jahr 1991, in einer Zeit als der Data-Science-Begriff noch nicht geboren war – und auch wenn Python als General-Purpose Sprache vielen Problemklassen zuzuordnen ist, hat sie sich als meistgenutzes Tool im Bereich Data Science etabliert. Doch wie ist es eigentlich zu dieser Entwicklung gekommen?