merge, join und concat in Pandas

Auch wenn es eine ausführliche Online-Dokumentation auf der Pandas-Homepage über die Join-Funktionen existiert, trägt diese nicht gerade dazu bei, sich schnell in die unterschiedlichen Methoden und Funktionen einzufinden. Dies liegt insbesondere daran, dass die offizielle Dokumentation sehr umfassend, viele spezielle Anwendungen aufführt. Mit diesem Artikel möchte ich einige wesentliche Aspekte auf den Punkt bringen und eine kleine Heurisitik bereitstellen, um zwischen den verschiedenen Möglichkeiten Daten miteinander zu verknüpfen die richtige auszuwählen.

Datumsinformationen verarbeiten mit datetime und Timestamp

Dieser Beitrag befasst sich mit dem Thema Datumsvariablen und den in Python implementierten Klassen für deren Bearbeitung. Mit den Bibliotheken datetime und pandas stehe 2 zentrale Pakete/Klassen zur Verfügung, über die Kalenderinformationen bearbeitet bzw. extrahiert werden können. Was die elementaren Anwendungen für Datumsvariablen sind, wie sich diese in Python umsetzen lassen und welche Vor- und Nachteile die unterschiedlichen Klassen haben, lesen Sie hier.

Importtechniken in Python

Jede py-Datei mit gültigem Python Code ist auch ein Modul und kann in eine Session importiert werden. Für den Import existieren dabei unterschiedliche Techniken. Je nach Methode kann die gesamte Datei importiert werden, oder nur einzelne Konstrukte aus dieser Datei – also ausgewählte Klassen, Funktionen oder Variablen. In den folgenden Beispielen werden die unterschiedlichen Importtechniken in Python vorgestellt.

Ist Python compiliert oder interpretiert?

Soviel vorweg: Die Frage, ob es sich bei Python um eine Interpreter- oder eine Compilersprache handelt, ist nicht eindeutig zu beantworten. Zum einen weil die Definition von Compiler und Interpreter durch unterschiedlichste Technologien sehr verschwommen ist, zum anderen weil Python Grundelemente beider Sprachtypen besitzt. Die Antwort ‚beides‘ trifft es da vielleicht noch am besten. In diesem Beitrag geht es um die internen Python-Prozesse, wenn Quellcode ausgeführt wird.

Listen in Python

Listen gehören zu den zentralen Objekttypen in Python und werden aufgrund ihrer Flexibilität und Performance gerne dazu verwendet, komplexe Informationen abzulegen. In diesem Beitrag erfahren Sie, wie mit Listen in Python umzugehen ist.

Mengen in Python

Die Arbeiten mit Mengen gehört zu den wesentlichen Anwendungen in der Datenanalyse. In Python ist das zentrale Werkzeug um Mengen zu bearbeiten die Funktion set(). Der resultierende Objekttyp trägt wie die Funktion den Namen set. In diesem Beitrag erfahren Sie mehr über die Arbeit mit Mengen in Python.

Mutable und Immutable Objects

Eine bedeutende Unterscheidung von Objekten in Python liegt in ihrer Fähigkeit zur Veränderung. Es werden sog. Mutable- (veränderliche) von Immutable- (unveränderliche) Objects unterschieden. Was diese Objekttypen auszeichnet, erfahren Sie in diesem Beitrag.

Selektieren von Daten in DataFrames

Die Selektion von Daten um Subsets zu erstellen oder Werte zu aktualisieren, gehört zu den elementarsten Techniken, mit denen der Data-Scientist umzugehen hat. In diesem Beitrag werden die Methoden der Dateneselktion auf DataFrames vorgestellt.

Die Python Evolution zum Data-Science Tool

Guido van Rossum veröffentlichte Python im Jahr 1991, in einer Zeit als der Data-Science-Begriff noch nicht geboren war – und auch wenn Python als General-Purpose Sprache vielen Problemklassen zuzuordnen ist, hat sie sich als meistgenutzes Tool im Bereich Data Science etabliert. Doch wie ist es eigentlich zu dieser Entwicklung gekommen?