Reinforcement Learning

Erfahren Sie in diesem Training alles über das Reinforcement Learning, um es auf Ihre Fragestellungen anzuwenden. Das Training wurde in Kooperation von 3 erfahrenen Data Scientists entwickelt. Diese werden Sie auch während der Schulung begleiten – freuen Sie sich auf 2 spannende Tage!

Das RL ist ein Teilgebiet des ML und stellt in Kombination mit Deep Learning einen Paradigmenwechsel dar. Im Gegensatz zum klassischen Supervised Learning benötigt RL keine gelabelten Trainingsdaten. Stattdessen erfolgt Lernen einzig und allein durch positive Verstärkung bzw. Bestrafung für jede geartete Aktion eines sogenannten Agenten. Wie im natürlichen Lernprozess des Menschen bewegt sich der Agent mittles Trail & Error durch einen Explorationsraum und erhält für jede Aktion ein Feedback seiner Umgebung. Fällt dieses Feedback positiv aus, erhöht es die Auftretenswahrscheinlichkeit dieser Aktion. Ist das Feedback negativ, wird die Auftretenswahrscheinlichkeit reduziert.

Die Dozenten

Andreas Wygrabek – Data-Science-Architect

Andreas Wygrabek

Andreas Wygrabek ist freiberuflicher Data Science Consultant und erfahrener Trainer im Bereich Programmierung und statistischer Methoden. Mit seinem Projekt Data-Science-Achitect bietet er Trainings und Full-Stack-Dienstleistungen im Bereich Data Science an. Seine zentralen Analysetools sind R und Python.

Nicolas Kuhaupt

Nicolas Kuhaupt hat Mathematik studiert und sich schon während des Studiums mit dem Themengebiet Big Data und Data Science beschäftigt. Anschließend war er ein Jahr lang als Big Data Consultant tätig und ist als Research Data Scientist zum Fraunhofer IEE gewechselt. Dort treibt er die Digitalisierung der Energiewende voran.

Dr. Christoph Scholz

Dr. Christoph Scholz studierte Informatik an der Universität Paderborn und arbeitete anschließend als wissenschaftlicher Mitarbeiter am Fachgebiet Wissensverarbeitung an der Universität Kassel. Dort forschte und promovierte er im Bereich Data Mining mit dem Fokus auf Sensordaten. Seit Mai 2015 arbeitet er als wissenschaftlicher Mitarbeiter mit dem Schwerpunkt Machine Learning am Fraunhofer IEE.

Event
Datum/Zeit
Ort
Kategorie

Reinforcement Learning mit Python

Do, 12. Dezember 2019 - Fr, 13. Dezember 2019
Uhrzeit: 9:00 - 17:00
Tagungs- und Schulungszentrum, München

Beschreibung

In diesem Training lernen Sie den Umgang mit Reinforcement Learning in Python kennen und in eigenen Szenarien einzusetzen. Der Algorithmus und dessen unterschiedliche Methoden werden in dem Training zunächst theoretisch eingeleitet und anschließend in Python umgesetzt. 3 Use-Case Szenarien dienen als roter Faden durch die Veranstaltung. In diesen werden unterschiedliche Problemtypen aufgezeigt und ein jeweiliger Lösungsansatz präsentiert. In Übungen erhalten die Teilnehmer Gelegenheit das Gelernte auszuprobieren.

Das Training wird durch 3 Trainer begleitet sodass eine optimale Betreuung der maximal 12 Teilnehmer gewährleistet ist.

Wer sollte teilnehmen?

Data Scientists, Datenanalysten, Statistiker, Mathematiker, Researcher, Informatiker

Grundlegende Programmiererfahrung in Python sollte vorhanden sein.

Grundlegende Erfahrung im Bereich Machine Learning sind von Vorteil, aber keine Voraussetzung.

Lernziele

  • Kennenlernen der methodischen Grundlagen des Reinforcement Learnings
  • Reinforcement Learning mit Python umsetzen
  • Eigene Problemstellungen mit Reinforcement Learning lösen

Inhalte

1. Grundlagen

  •  Motivation RL: Einsatzgebiete, Use Cases
  • Grundlagen RL (Agenten, Environment etc.), Einordnung ML, Greedy-Policy, Exploration, Validierung von RL Algorithmen, Problemtypen (diskret, kontinuierlich), Abgrenzung Algorithmentypen (Model free, Model based, on-Policy, off-Policy)
  • Motivation Q-Tables, Q-Learning, SARSA, Bellman Gleichung, Markov Ketten

2. Erste RL Anwendung / Hands-On-RL

  • Übersicht Frameworks
  • OpenAI Gym
  • Code-Beispiele

3. Deep Q-Networks

  • Einführung Deep Q-Networks
  • Neuronale Netze, Convolutional Neural Networks (CNNs)
  • Erweiterungen: Dueling DQN, Double DQN, Prioritized Experience Replay, Rainbow

4. Policy Optimization Algorithmen

  • Einführung Policy Optimization Algorithmen
  • Deep Deterministic Policy Gradient (DDPG)
  • Übersicht weitere Methoden: Proximal Policy Optimization (PPO), Trust Region Policy Optimization (TRPO)

5. Use Case Implementierung

  • Eigene Simulationsumgebung mit OpenAI Gym entwickeln
  • Experimente starten mit Ray RLlib

6. Outlook

  • Weitere Richtungen im Reinforcement Learning: Hierarchien, Model Based, Exploration, Intrinsic Reward, Imitation Learning
  • Weitere Ressourcen (online Vorlesung, Bücher etc.)

Shortfacts

  • Preis: 2.400,- € zzgl. MwSt.
  • Dauer: 2 Tage
  • 2–12 Teilnehmer
  • Kurssprache: Deutsch
  • Training am eigenen Laptop

Was Sie erwartet

  • 3 erfahrene Data Scientists und Trainer
  • Teilnehmerzertifikat
  • Umfassende Schulungsunterlagen
  • Verpflegung mit Mittagessen, Snacks und Getränken
  • Top ausgestattete Schulungsräume
  • Angenehme Lernatmosphäre durch kleine Gruppen und aufgelockerte Inhalte
  • Hands-On-Training: Praxisorientiert mit anschaulichen Beispieldaten und kleinen Übungen

Buchung

Training bei Data-Science-Architect

  • Erhalt der Buchungsbestätigung
  • Anfahrtsplan + Hotelempfehlungen
  • Wir fragen im Vorfeld alle Teilnehmenden nach Ihrer Erwartung an das Training. Wenn Sie möchten, können Sie uns dazu im Vorfeld Feedback geben.
  • Sie erhalten 4 Wochen vor dem Training: Ankündigung mit Kursbeschreibung, Softwarevoraussetzung, Installationsanleitung, Timetable & optionaler Möglichkeit zur Vorbereitung
  • Sie erhalten 1 Woche vor dem Training die im Kurs verwendeten Materialien wie Skripte und Datensätze.
  • Pro Tag 8×45 Min. Lerneinheiten
  • 30 Min. Open Space pro Tag im Anschluss an die Lerneinheiten
  • An das Kursthema angepasstes Verhältnis von Theorie, Praxis und Übungsphasen
  • Event Evaluation
  • Bereitstellung der im Training erstellten Materialien

Buchungsdetails

  • Der 3. Teilnehmer einer Anmeldung nimmt kostenfrei teil
  • Rechnungsstellung erfolgt nach der Veranstaltung

Der Schulungsort München

München

München hat viel zu bieten: Machine Learning, objektorientierte Programmierung, Python, R und natürlich den Stachus, die Frauenkirche oder die Allianz Arena. Die Trainings finden in der Arnulfstraße statt – unweit der Innenstadt und einigen guten Brauhäusern.