Agiles Projektmanagement in der Data Science

Agile Methoden haben das klassische Projektmanagement abgelöst und Methoden wie Scrum werden insbesondere in der Data-Science angewendet. Wodurch sich Data-Science-Projekte im Speziellen auszeichnen und warum agile Ansätze geeignete Verfahren ihrer Projektsteuerung liefern, erfahren Sie in diesem Beitrag.

*args und **kwargs

Mit dem Sternchenoperator stehen 2 flexible Varianten zur Parameterübergabe an Funktionen zur Verfügung. In diesem Beitrag erfahren Sie, auf welche Weise und zu welchem Zweck *args und **kwargs in Funktionsaufrufen eingesetzt werden.

apply, map und applymap

Mit den Methoden apply, map und applymap können Funktionen in Python vektorwertig angewendet werden. Vektorwertig bedeutet, dass ein Objekt nicht Elementweise angesprochen wird, sondern, dass das gesamte Objekt in einem Prozessschritt transformiert wird. Insbesondere in Data-Science-Anwendungen ist ein vektorwertiger Programmierstil nützlich. In diesem Beitrag erfahren Sie mehr über vektorwertiges Programmieren und darüber, was die 3 Funktionen leisten und worin sie sich unterscheiden.

Ist Python compiliert oder interpretiert?

Soviel vorweg: Die Frage, ob es sich bei Python um eine Interpreter- oder eine Compilersprache handelt, ist nicht eindeutig zu beantworten. Zum einen weil die Definition von Compiler und Interpreter durch unterschiedlichste Technologien sehr verschwommen ist, zum anderen weil Python Grundelemente beider Sprachtypen besitzt. Die Antwort ‚beides‘ trifft es da vielleicht noch am besten. In diesem Beitrag geht es um die internen Python-Prozesse, wenn Quellcode ausgeführt wird.

Listen in Python

Listen gehören zu den zentralen Objekttypen in Python und werden aufgrund ihrer Flexibilität und Performance gerne dazu verwendet, komplexe Informationen abzulegen. In diesem Beitrag erfahren Sie, wie mit Listen in Python umzugehen ist.

Mengen in Python

Die Arbeiten mit Mengen gehört zu den wesentlichen Anwendungen in der Datenanalyse. In Python ist das zentrale Werkzeug um Mengen zu bearbeiten die Funktion set(). Der resultierende Objekttyp trägt wie die Funktion den Namen set. In diesem Beitrag erfahren Sie mehr über die Arbeit mit Mengen in Python.

Mutable und Immutable Objects

Eine bedeutende Unterscheidung von Objekten in Python liegt in ihrer Fähigkeit zur Veränderung. Es werden sog. Mutable- (veränderliche) von Immutable- (unveränderliche) Objects unterschieden. Was diese Objekttypen auszeichnet, erfahren Sie in diesem Beitrag.

Missing Values in Pandas

Auch wenn sie unerwünscht sind: Missings gehören nunmal häufig zum Datenmanagementprozess. Dieser Beitrag widmet sich daher der Frage, wie in pandas mit Missing-Werten umgegangen wird.

Kreuztabellen in Pandas

Kategoriale Daten werden in der Regel über Auszählungen analysiert. Wie sie einfache Häufigkeits- bis hin zu komplexen Kreuztabellen mit pandas erstellen, erfahren Sie in diesem Beitrag.

Selektieren von Daten in DataFrames

Die Selektion von Daten um Subsets zu erstellen oder Werte zu aktualisieren, gehört zu den elementarsten Techniken, mit denen der Data-Scientist umzugehen hat. In diesem Beitrag werden die Methoden der Dateneselktion auf DataFrames vorgestellt.