Erfahren Sie in diesem Training alles über das Reinforcement Learning, um es auf Ihre Fragestellungen anzuwenden.
Das RL ist ein Teilgebiet des ML und stellt in Kombination mit Deep Learning einen Paradigmenwechsel dar. Im Gegensatz zum klassischen Supervised Learning benötigt RL keine gelabelten Trainingsdaten. Stattdessen erfolgt Lernen einzig und allein durch positive Verstärkung bzw. Bestrafung für jede geartete Aktion eines sogenannten Agenten. Wie im natürlichen Lernprozess des Menschen bewegt sich der Agent mittles Trail & Error durch einen Explorationsraum und erhält für jede Aktion ein Feedback seiner Umgebung. Fällt dieses Feedback positiv aus, erhöht es die Auftretenswahrscheinlichkeit dieser Aktion. Ist das Feedback negativ, wird die Auftretenswahrscheinlichkeit reduziert.
Reinforcement Learning mit Python
Uhrzeit: 9:00 - 17:00
Beschreibung
In diesem Training lernen Sie den Umgang mit Reinforcement Learning in Python kennen und in eigenen Szenarien einzusetzen. Der Algorithmus und dessen unterschiedliche Methoden werden in dem Training zunächst theoretisch eingeleitet und anschließend in Python umgesetzt. 3 Use-Case Szenarien dienen als roter Faden durch die Veranstaltung. In diesen werden unterschiedliche Problemtypen aufgezeigt und ein jeweiliger Lösungsansatz präsentiert. In Übungen erhalten die Teilnehmer Gelegenheit das Gelernte auszuprobieren.
Das Training wird durch 3 Trainer begleitet sodass eine optimale Betreuung der maximal 12 Teilnehmer gewährleistet ist.
Wer sollte teilnehmen?
Data Scientists, Datenanalysten, Statistiker, Mathematiker, Researcher, Informatiker
Grundlegende Programmiererfahrung in Python sollte vorhanden sein.
Grundlegende Erfahrung im Bereich Machine Learning sind von Vorteil, aber keine Voraussetzung.
Lernziele
- Kennenlernen der methodischen Grundlagen des Reinforcement Learnings
- Reinforcement Learning mit Python umsetzen
- Eigene Problemstellungen mit Reinforcement Learning lösen
Inhalte
1. Grundlagen
- Motivation RL: Einsatzgebiete, Use Cases
- Grundlagen RL (Agenten, Environment etc.), Einordnung ML, Greedy-Policy, Exploration, Validierung von RL Algorithmen, Problemtypen (diskret, kontinuierlich), Abgrenzung Algorithmentypen (Model free, Model based, on-Policy, off-Policy)
- Motivation Q-Tables, Q-Learning, SARSA, Bellman Gleichung, Markov Ketten
2. Erste RL Anwendung / Hands-On-RL
- Übersicht Frameworks
- OpenAI Gym
- Code-Beispiele
3. Deep Q-Networks
- Einführung Deep Q-Networks
- Neuronale Netze, Convolutional Neural Networks (CNNs)
- Erweiterungen: Dueling DQN, Double DQN, Prioritized Experience Replay, Rainbow
4. Policy Optimization Algorithmen
- Einführung Policy Optimization Algorithmen
- Deep Deterministic Policy Gradient (DDPG)
- Übersicht weitere Methoden: Proximal Policy Optimization (PPO), Trust Region Policy Optimization (TRPO)
5. Use Case Implementierung
- Eigene Simulationsumgebung mit OpenAI Gym entwickeln
- Experimente starten mit Ray RLlib
6. Outlook
- Weitere Richtungen im Reinforcement Learning: Hierarchien, Model Based, Exploration, Intrinsic Reward, Imitation Learning
- Weitere Ressourcen (online Vorlesung, Bücher etc.)
Shortfacts
- Preis: 2.400,- € zzgl. MwSt.
- Dauer: 2 Tage
- 2–12 Teilnehmer
- Kurssprache: Deutsch
- Training am eigenen Laptop
Was Sie erwartet
- 3 erfahrene Data Scientists und Trainer
- Teilnehmerzertifikat
- Umfassende Schulungsunterlagen
- Verpflegung mit Mittagessen, Snacks und Getränken
- Top ausgestattete Schulungsräume
- Angenehme Lernatmosphäre durch kleine Gruppen und aufgelockerte Inhalte
- Hands-On-Training: Praxisorientiert mit anschaulichen Beispieldaten und kleinen Übungen
Buchung
Training bei Data-Science-Architect
- Erhalt der Buchungsbestätigung
- Anfahrtsplan + Hotelempfehlungen
- Wir fragen im Vorfeld alle Teilnehmenden nach Ihrer Erwartung an das Training. Wenn Sie möchten, können Sie uns dazu im Vorfeld Feedback geben.
- Sie erhalten 4 Wochen vor dem Training: Ankündigung mit Kursbeschreibung, Softwarevoraussetzung, Installationsanleitung, Timetable & optionaler Möglichkeit zur Vorbereitung
- Sie erhalten 1 Woche vor dem Training die im Kurs verwendeten Materialien wie Skripte und Datensätze.
- Pro Tag 8×45 Min. Lerneinheiten
- 30 Min. Open Space pro Tag im Anschluss an die Lerneinheiten
- An das Kursthema angepasstes Verhältnis von Theorie, Praxis und Übungsphasen
- Event Evaluation
- Bereitstellung der im Training erstellten Materialien
Buchungsdetails
- Der 3. Teilnehmer einer Anmeldung nimmt kostenfrei teil
- Rechnungsstellung erfolgt nach der Veranstaltung
Der Schulungsort München
München hat viel zu bieten: Machine Learning, objektorientierte Programmierung, Python, R und natürlich den Stachus, die Frauenkirche oder die Allianz Arena. Die Trainings finden in der Arnulfstraße statt – unweit der Innenstadt und einigen guten Brauhäusern.