Mengen in Python

Die Arbeiten mit Mengen gehört zu den wesentlichen Anwendungen in der Datenanalyse. In Python ist das zentrale Werkzeug um Mengen zu bearbeiten die Funktion set(). Der resultierende Objekttyp trägt wie die Funktion den Namen set. In diesem Beitrag erfahren Sie mehr über die Arbeit mit Mengen in Python.

Mutable und Immutable Objects

Eine bedeutende Unterscheidung von Objekten in Python liegt in ihrer Fähigkeit zur Veränderung. Es werden sog. Mutable- (veränderliche) von Immutable- (unveränderliche) Objects unterschieden. Was diese Objekttypen auszeichnet, erfahren Sie in diesem Beitrag.

Missing Values in Pandas

Auch wenn sie unerwünscht sind: Missings gehören nunmal häufig zum Datenmanagementprozess. Dieser Beitrag widmet sich daher der Frage, wie in pandas mit Missing-Werten umgegangen wird.

Kreuztabellen in Pandas

Kategoriale Daten werden in der Regel über Auszählungen analysiert. Wie sie einfache Häufigkeits- bis hin zu komplexen Kreuztabellen mit pandas erstellen, erfahren Sie in diesem Beitrag.

Selektieren von Daten in DataFrames

Die Selektion von Daten um Subsets zu erstellen oder Werte zu aktualisieren, gehört zu den elementarsten Techniken, mit denen der Data-Scientist umzugehen hat. In diesem Beitrag werden die Methoden der Dateneselktion auf DataFrames vorgestellt.

Die Python Evolution zum Data-Science Tool

Guido van Rossum veröffentlichte Python im Jahr 1991, in einer Zeit als der Data-Science-Begriff noch nicht geboren war – und auch wenn Python als General-Purpose Sprache vielen Problemklassen zuzuordnen ist, hat sie sich als meistgenutzes Tool im Bereich Data Science etabliert. Doch wie ist es eigentlich zu dieser Entwicklung gekommen?

Der Pythonpath

Damit Module in die Python-Session importiert werden können, müssen sie über den sog. Pythonpath auffindbar sein. Dieser lässt sich auch bezeichnen als Suchpfad für Module. Hier werden 3 Techniken beschrieben, wie der Pythonpath editiert werden kann.

Speichermanagement in Python für R Entwickler

R-Programmierer leben das Paradigma des Unveränderlichen – und begehen dadurch Fehler bei ihren ersten Schritten in Python. Die Rede ist von Mutable und Immutable Objects und dem Objekt- und Speichermanagement der beiden dominierenden Data-Science Programmiersprachen. Erfahren Sie in diesem Beitrag wie unterschiedlich R und Python in ihren internen Prozessen mit Objekten umgehen und was Sie als R-Programmierer über das Objektmanagement wissen sollten, wenn Sie erste Programmiererfahrungen in Python sammeln.