Einführung in die Data Science mit R

Beschreibung

Mit dem Fokus auf die 3 Bereiche Programmierung, Datenmanagement und Machine Learning vermittelt dieser Kurs die Grundlagen von R im Kontext von Data-Science.

Von der Installation, den wesentlichen Objekttypen und Programmiergrundlagen über das Anlegen und Verwalten von Projekten erhalten die Teilnehmenden in diesem Training zunächst alle Voraussetzungen, um erste Anwendungen in R zu schreiben. In praxisnahen Beispielen und mit Hilfe von Beispieldaten werden anschließend Daten eingelesen und analysefertig aufbereitet. Hier erlernen die Teilnehmer die wichtigsten Techniken im Bereich Datenmanagement. Der abschließende Programmpunkt des Kurses ist die Analyse und Prognose von Daten mit Machine Learning Verfahren. Zunächst wird das Themenfeld Machine Learning theoretisch eingeleitet und anschließend in zwei fiktiven Szenarien auf der Grundlage eines Musterdatensatzes direkt in R umgesetzt. Die Analyseszenarien lösen ein Klassifikations- bzw. ein Regressionsproblem.

Wer sollte teilnehmen?

R Interessierte mit und ohne Programmiererfahrung, Data-Scientist, Datenanalysten, Statistiker, Mathematiker, Researcher

Dieser Kurs richtet sich insbesondere an Personen, die noch keine Erfahrung in der Programmiersprache R gemacht haben, diese aber in Zukunft im Bereich Data Science einsetzen wollen.

Lernziele

  • Kennenlernen der Grundkonzepte und der Philosophie von R
  • Die R-Syntax verstehen und anwenden
  • Datenmanagement in R
  • Machine Learning Prozesse verstehen
  • Modell- und Prognoseerstellung mit R umsetzen

Inhalte

  • Das Konzept und die Philosophie von R
  • Kennenlernen von R-Studio
  • Syntaktische Grundlagen: Funktionen, Operatoren, Schleifen, Kontrollstrukturen
  • Datentypen in R: Vektoren, Data-Frames, Matrizen, Arrays
  • tidyverse – Eine Paketsammlung von R-Studio
  • Datenmanagement in R (mit dem Fokus auf dplyr und den Pipe-Operator)
  • Deskriptive Statistik und Aggregationen
  • Machine Learning Prozesse implementieren
  • Entscheidungs- und Regressionsbäume anwenden und interpretieren können
  • Modellevaluation von Klassifikations- und Regressionsproblemen

Shortfacts

  • Empfohlene Dauer: 2-3 Tage
  • 2–10 Teilnehmer
  • Kurssprache: Deutsch oder Englisch
  • Preis: Der Tagessatz variiert zwischen Unternehmen und Forschhungseinrichtung. Nehmen Sie Kontakt auf!
  • Training am eigenen Laptop (Softwarevoraussetzungen und Installationsanleitung erhalten Sie im Vorfeld)

Inklusive

  • Teilnehmerzertifikat
  • Umfassende Schulungsunterlagen
  • Veranstaltungsevaluation + Report als PDF

Inhousetraining bei Data-Science-Architect

Prozess

  • Abstimmung der Inhalte
  • Terminfindung
  • Angebotserstellung
  • Online Evaluation der Teilnehmererwartung
  • Ankündigung mit Kursbeschreibung, Softwarevoraussetzung, Installationsanleitung, Timetable & optionaler Möglichkeit zur Vorbereitung
  • Bereitstellung der Kursmaterialien
  • Pro Tag 8×45 Min. Lerneinheiten
  • 30 Min. Open Space pro Tag im Anschluss an die Lerneinheiten
  • Verhältnis von Theorie, Praxis und Übungsphasen nach Absprache
  • Event Evaluation
  • PDF-Report mit Evaluations-Ergebnissen
  • Bereitstellung der im Training erstellten Materialien
  • Feedbackgespräch

Buchung

Sie haben Fragen zu Inhalten oder Ablauf des Trainings? Gerne informiere ich Sie über die Veranstaltung in Detail.