Data-Science Trainee-Days mit Python

Datum/Zeit
Mo, 5. Oktober 2020–Fr, 9. Oktober 2020
Uhrzeit: 9:00–17:00

Ort

Kategorie
Sprache
Deutsch

Beschreibung

Werden Sie in diesem Intensivtraining zum Data-Scientist mit Python!

In einzigartiger Umgebung lernen Sie an 5 Tagen die Programmiergrundlagen von Python und erfahren, wie Sie Python-Code im produktiven Unternehmensumfeld für Data Science Anwendungen einsetzen. Sie werden einen Einblick in die Multi-Purpose Möglichkeiten von Python erhalten und eine Webapplikation mit Flask entwickeln. Schließlich nutzen Sie Python um Machine Learning Anwendungen mit den gängigen Data-Science Bibliotheken zu erstellen.

Mit dem besonderen Fokus auf den Bereich Datenanalyse vermittelt das Training zunächst die Grundlagen in der Programmiersprache Python. Von der Installation, den wesentlichen Objekttypen und Programmierbasics über einfache Analysen und Visualisierungen erhalten Sie alle Voraussetzungen, um erste Anwendungen in Python selbst zu schreiben. In praxisnahen Beispielen und mit Hilfe von Beispieldaten werden die Inhalte eingeleitet und Live am Quellcode vorgeführt. Kleine Übungen helfen, das Gelernte auszuprobieren und zu vertiefen. Besonderes Augenmerk richtet der Kurs anschließend auf die populäre Python-Bibliothek Pandas und deren Datentypen Series und DataFrame. Hier erlernen die Sie die wichtigsten Techniken aus dem Bereich Datenmanagement.

In einem weiteren Themenblock lernen Sie, wie Python „State-of-the-Art“ in Operativumgebungen eingesetzt wird. Sie werden erfahren, welche Komponenten dabei helfen, Quellcode sicher und übersichtlich zu gestalten und wie diese konkret in Projektstrukturen eingesetzt werden.

Ein weiterer Schwerpunkt der Trainee-Days richtet sich auf den Bereich Machine Learning. Das Themenfeld lässt sich in Klassifikations- und Regressionsprobleme unterteilen, die entweder überwachter oder unüberwachter Natur sein können. An den Trainingstagen 4 und 5 lernen sie die unterschiedlichen Problemklassen mit den bedeutendsten Methoden des Machine Learning zu lösen.

Zunächst lernen Sie Algorithmen für überwachte Klassifikations- und Regressionsszenarien einzusetzen. Jedes der besprochenen Verfahren wird in dem Training zunächst theoretisch eingeleitet, anschließend in Python umgesetzt und schließlich in einer kleinen Übung durch die Teilnehmer ausprobiert. Inhaltliche Fragestellungen, die aufgrund von Beispieldatensätzen formuliert werden, dienen dem Kurs als roter Faden durch die Verfahren. Neben den Algorithmen versucht das Training einen Eindruck von Machine Learning Prozessen zu vermitteln. D.h., es wird aufgezeigt, welche Schritte notwendig sind, um einen Machine Learning Task zu lösen und wie diese konkret umgesetzt werden.

Anschließend werden nicht überwachte Szenarien besprochen. Zu diesem Zählen insbesondere Clusteranalysen und die Hauptkomponentenanalyse. Beide Verfahrensklassen dienen der Dimensionsreduktion und werden häufig in Interaktion mit überwachten Lernmethoden eingesetzt. Wie die Verfahren miteinander kombiniert werden und welche Herausforderungen dabei bestehen, erfahren Sie im Kurs.

Wer sollte teilnehmen?

Softwareentwickler, Data Scientist, Data Engineers, Data Architects, Python-Entwickler, Python-Einsteiger mit und ohne grundlegenden Programmiererfahrungen

Dieser Kurs richtet sich insbesondere an Personen, die noch keine Erfahrung in der Programmiersprache Python gemacht haben, diese aber in Zukunft im Bereich Data Science einsetzen wollen.

Lernziele

  • Kennenlernen der Grundkonzepte und der Philosophie von Python
  • Die Python-Syntax verstehen und anwenden
  • Datenmanagement in Python
  • Projekte in Python anlegen und verwalten
  • Best Practice Ansätze für professionellen Python-Code erlernen
  • Ausblick auf Multi-Purpose Möglichkeiten in Python
  • Methodische Grundlagen des Machine Learning erlernen
  • Techniken des Machine Learning mit Python umsetzen
  • Eigene Prognoseprobleme mit Python lösen
  • Verfahren zur Dimensionsreduktion kennenlernen und einsetzen

Inhalte

Tag 1-2 – Grundlagen, Programmieren mit Python, Datenmanagement mit numpy und pandas

  • Das Konzept und die Philosophie von Python
  • Übersicht Python-Editoren, u.a.: Jupyter, Pycharm, Spyder
  • Python-Projekte anlegen: Ordnerstruktur, Einbinden von Paketen und Modulen
  • Syntaktische Grundlagen: Grunddatentypen, Operatoren, Kontrollstrukturen, Funktionen, Schleifen
  • Grundlagen objektorientierten Programmierens in Python: Klassen, Methoden und Attribute
  • Einführung in numpy
  • pandas
    • Objekttypen: Series und DataFrame
    • Importieren von Daten, Datenmanagement, Aggregationen, deskriptive Statistik

Tag 3 – Python in Produktivumgebungen, Reporting mit Webapplikationen und Microservices

  • Anforderungen von produktiven Python-Code
  • Objektorientierung im Python-Interpreter – Wie sieht produktiver Code aus?
  • Konvetioneller Code nach PEP-8 und dessen Bedeutung in Python
  • Python Projekte anlegen
  • Source- und Binary-Distributionen erstellen
  • Unittesting mit den Bibliotheken unittest und doctest durchführen
  • Aufzeichnen des Programmzustands mit logging
  • Dokumentationen mit Sphinx erstellen
  • Webapplikationen mit Flask für REST-APIs, Reporting von Analytic und Microservices

Tag 4-5: Machine Learning mit Python

  • Grundlagen des Machine Learnings / Data Minings
    • Überblick über Modelle und Methoden, Über das Problem der Prognose
    • Supervised vs. Unsupervised Learning
  • Overfitting, Underfitting und Parametertuning – Techniken der Modellerstellung
    • Grundproblem, einfache Kreuzvalidierung, 3 Fold-Technik, k-Fold-Validierung
  • Klassifikationsverfahren
    • Entscheidungsbäume, Random Forest, Gradient Boosting Machines, Neuronale Netze
    • Evaluation von Klassifikationsverfahren (ROC-Kurven, Cutoff-Wert, Präzision, Sensitivität, Spezifität)
  • Regressionsprobleme
    • Lineare Regression, Regression Trees, Random Forest, Neuronale Netze, regularisierte Regressionen (Ridge Regression, Lasso Regression, Elastic Net)
    • Evaluation von Regressionsproblemen
  • Clusteranalysen
    • k-Nearest Neighbors, k-Means, agglomerative Clusteranalyse, DBSCAN
  • Hauptkomponentenanalyse
    • Grundbegriffe und Anwendungsszenarien, Ausblick auf Rotationsverfahren, Kriterien zur Dimensionsreduktion, Interpretation

Shortfacts

  • Preis: 3.500,- € zzgl. MwSt.
  • Dauer: 5 Tage
  • 2–10 Teilnehmer
  • Kurssprache: Deutsch
  • Training am eigenen Laptop

Was Sie erwartet

  • Teilnehmerzertifikat
  • Umfassende Schulungsunterlagen
  • Unterkunft in mallorquinischen Finca mit besonderem Lernambiente
  • Verpflegung mit Mittagessen, Abendessen, Snacks und Getränken
  • Top ausgestattete Schulungsräume
  • Angenehme Lernatmosphäre durch kleine Gruppen und aufgelockerte Inhalte
  • Hands-On-Training: Praxisorientiert mit anschaulichen Beispieldaten und kleinen Übungen

Buchung

Training bei Data-Science-Architect

  • Erhalt der Buchungsbestätigung
  • Anfahrtsplan
  • Ich frage im Vorfeld alle Teilnehmenden nach Ihrer Erwartung an das Training. Wenn Sie möchten, können Sie mir im Vorfeld dazu Feedback geben.
  • Sie erhalten 4 Wochen vor dem Training: Ankündigung mit Kursbeschreibung, Softwarevoraussetzung, Installationsanleitung, Timetable & optionaler Möglichkeit zur Vorbereitung
  • Sie erhalten 1 Woche vor der Training die im Kurs verwendeten Materialien wie Skripte und Datensätze.
  • Pro Tag 8×45 Min. Lerneinheiten
  • 30 Min. Open Space pro Tag im Anschluss an die Lerneinheiten
  • An das Kursthema angepasstes Verhältnis von Theorie, Praxis und Übungsphasen
  • Event Evaluation
  • Bereitstellung der im Training erstellten Materialien

Buchungsdetails

  • Der 3. Teilnehmer einer Anmeldung nimmt kostenfrei teil
  • Rechnungsstellung erfolgt nach der Veranstaltung

Der Schulungsort Mallorca

Mallorca

Wo lässt sich Python, R und Machine Learning besser kennenlernen als auf der schönsten Insel der Welt? Im Landesinneren der Insel auf einer zum Tagungszentrum ausgebauten Finca werden die Data-Science Trainee-Days angeboten: 5 Tage Schulung mit Programmiereinführung in R oder Python, den zentalen Data Science Tools und Techniken, inkl. einer Einführung in das Machine Learning. Das Highlight-Event für 2020!