Über mich

Mein Name ist Andreas Wygrabek – der Data-Science-Architect. Sie können mich über meine Website kontaktieren oder finden mich bei Twitter, Xing und Linkedin. Open-Source Projekte finden Sie auf Github.

Sie sind Recruiter? Hier finden Sie mein technisches Profil als PDF.

Person

Vielen Dank für Ihren Besuch auf meiner Homepage! Ich arbeite als freiberuflicher Data-Science Consultant und Trainer im Bereich Programmierung und statistischer Datenanalyse. Meinen Kunden helfe ich dabei, analytische und technologische Herausforderungen zu meistern und in Geschäftsnutzen umzuwandeln.

Andreas Wygrabek
Andreas Wygrabek
Andreas Wygrabek

Mit dem Projekt data-science-architect biete ich Full-Stack Projektmitarbeit an: Codeentwicklung, Support, Training und Projektmanagement. Die zentralen Werkzeuge in meinen Projekten und Trainings sind die 2 populärsten freien Programmiersprachen zur statistischen Datenanalyse – R und Python.

Portfolio

Analysedienstleistungen, Beratung im Bereich Data Sciene und Training – Mein Portfolio untergliedert sich in 3 Teilbereiche.

Data Science

Entwicklung von Algorithmen und Data-Driven Software.

Data Architecture

Beratung und Projektrealisationen im Bereich Big-Data und den Hadoop-Systemkomponenten.

Trainings / Workshops

Veranstaltungen im Bereich Programmierung, Statistik und Algorithmenentwicklung.

Hintergrund

Mein beruflicher Werdegang umfasst eine langjährige Tätigkeit in einem der führenden deutschsprachigen Data-Science Beratungsunternehmen und eine Tätigkeit bei der Fraunhofer-Gesellschaft am Standort Kassel. Als Data-Scientist vereine ich statistisch- methodisches Know-How mit IT-Kenntnissen.

  • > 9 Jahre Erfahrung in der Programmierung mit R
  • > 5 Jahre Erfahrung in der Programmierung mit Python
  • > 2 Jahre Erfahrung im Umgang mit Hadoop-Systemkomponenten
  • Expertise im Bereich Statistik und Methodik (Erfahren Sie Details in meinem technischen Profil)
  • Data-Science Integration in Unternehmensprozesse über Web-Applikationen mit html, CSS und JavaScript.
  • Inhouse- und Offsite-Trainings / Workshops in Software und Methodik
  • IT-Projektmanagement (klassisches Projektmanagement sowie agile Methoden)

Profil

Machen Sie sich ein Bild von meinem Einsatz-Profil. Bei Fragen stehe ich Ihnen gerne zur Verfügung.

Programmieren

R +++
Python +++
SQL ++
Web-Entwicklung: Html/CSS ++
JavaScript ++

Methoden

Machine Learning / Data Mining +++
Deep Learning +++
Multivariate Statistik +++
Zeitreihenanalyse +++
Inferenzstatistik +++

Big-Data Technologien

Spark +++
Hadoop ++
MongoDB ++
Impala ++
Cassandra +

Frameworks/Libraries

mlr / caret +++
keras / tensorflow +++
H2O +++
MlLib +++
shiny / htmlwidgets +++
leaflet ++

Weitere Technologien

Version Control (Git, SVN) +++
Atlassian Jira +++
SPSS +++
Grafana ++
SAS +

Projekte & Referenzen

Hier finden Sie einen Auszug bisheriger Projekte, die ich durchgeführt habe oder an denen ich maßgeblich beteiligt war. Gerne bespreche ich die Referenzprojekte mit Ihnen persönlich.

Prognose- und Risikomodellierung für mögliche Kreditausfälle bei einer Bankgesellschaft.

Position:

Algorithmus-Entwickler / Projektleitung

Technologien, Methoden:

R, H2O, Spark, Deep Learning, Gradient Boosting Machines, Ensemble Modelling, Stacking Blending, Clusteranalysis (K-means)

Erstellen einer Shiny Applikation

Die Applikation dient dem Qualitätsmanagement eines Medizinprodukteherstellers als führendes BI-Tool.

Eine generische Plotfunktion aus dem Report habe ich als Open-Source R-Paket veröffentlicht. Download unter: https://github.com/dascar/ReportPlot

Position:

Shiny Developer

Technologien, Methoden:

R, Shiny, htmlwidgets, Git, Jira

Implementierung von ETL-Prozessen

Automatisierung von Workflows, Datencleaning, automatisierte Plausibilisierung der Daten während der Aufbereitung, Anlegen der Datenbankschemata auf einem Microsoft SQL-Server, importieren der Daten in die Datenbank, implementieren von Datenintegritätschecks.

Position:

Entwickler / Projektleitung

Technologien, Methoden:

R, SQL, Microsoft-SQL-Server, RStudio-Server, Git, Jira

Hochrechnung und Prognose der Energieeinspeisung in das Elektrizitätsnetz durch erneuerbare Energieerzeugeranlagen

Position:

Software-Entwickler/ Algorithmus-Entwickler

Technologien, Methoden:

Python, H2O, Deep Learning, Spark, Hadoop, MongoDB

Auswertung einer klinischen Studie

Forschungsgegenstand der Studie war der Einfluss psychischer Erkrankungen von Eltern auf die Gesundheit ihrer Kinder.

Position:

Analyseleiter

Technologien, Methoden:

R, Inferenzstatistik, Multivariate Statistik

Erstellen einer Web-Appliation mit Leaflet

Die Applikation visualisiert die globale Sonneneinstrahlung sowie die Energieerzeugung von erneuerbaren Energieanlagen.

Position:

Web Entwickler

Technologien, Methoden:

JavaScript, Leaflet, Highcharts, jQuery, HTML, CSS, Python, GeoJSON

Preisprognosen im Energiesektor

Proof of Concept für Preisprognosen im Energiesektor durch die automatisierte NLP-Verarbeitung und DataMining-Analyse von Meldungen einer Nachrichtenagentur.

Position:

Algorithmus-Entwickler

Technologien, Methoden:

Python, Keras, Deep Learning, Recurrent Neural Networks, Time Series Forecast

Integration von R in Business-Umgebungen

  • Aufsetzen von Server-Client Umgebung für R-Studio
  • Einbinden von Version Control System (Git)
  • Funktion- and Prozessdokumentation
  • Aufsetzen und anpassen von Projektmanagement-Software(Jira)
  • Training / Support

Role:

Projektleitung, System-Architect, System-Administrator

Technologies, Methods:

RStudio-Server, Git, Jira, Linux

„Andreas Wygrabek unterstützt eoda als führenden Full-Stack Data-Science-Anbieter bei der Durchführung von Python-Trainings. Mit ihm können wir noch flexibler auf Anfragen reagieren und unseren Kunden dabei die gewohnt hohe Qualität mit bewährten Methoden und die neusten Python-Themen bieten.“

Heiko Miertzsch, Geschäftsführer eoda GmbH

I really appreciated the combination of theoretical background and practical application of methods. It provided me with a lot of inspiration and tools for further usage in my career. – Participant in the course ”Statistical Methods in R” at Universität Bremen

I understood – all – the covered topics well, which was the goal of this workshop. The lecturer knows the topic very well and gave the participants enough space to rethink the current step. Questions were encouraged and answered appropriately. – Participant in the course ”Introduction to Data Science with R” at Universität Bremen

Dr. Diana Ebersberger, BYRD Bremen Early Career Researcher Development

Das Leibniz-Instituts für Atmosphärenphysik ist eines der deutschen Zentren für die Erforschung der mittleren Atmosphäre. Schwerpunkte sind die Erforschung der Mesosphäre und unteren Thermosphäre, Kopplung der atmosphärischen Schichten und die Langfristige Veränderungen in der mittleren Atmosphäre.

Am IAP hat Andreas Wygrabek 2 Python-Trainings durchgeführt. Eine Einführung in Python sowie einen fortgeschrittenes Programmiertraining mit dem Titel: Parallelisieren und objektorientierte Programmierung mit Python.

Bastian Sommerfeld, Wissenschaftlicher Mitarbeiter am IAP

Philosophie

Kooperation

Offene Kommunikation und transparente Lösungen – Ergebnisse und Quellcode werden vollständig an meine Kunden weitergegeben.

Datenethik

Datenanalysen unterstützen Entscheidungen und helfen dabei, Prozesse zu optimieren. Sie richten sich nie gegen Menschen.

State-of-the-Art

Neue Technologien werden verfolgt und – wenn sie einen Projektnutzen bringen – eingesetzt.

Unabhängigkeit

Meine zentralen Technologien sind Open-Source und ich arbeite völlig herstellerneutral.

Agilität

Dynamik, auslieferbare und interpretierbare Ergebnisse charakterisieren meine Projekte. Wenn möglich arbeite ich nach Scrum.

Nutzen-Fokus

Ob in Forschung oder Wirtschaft – Datenanalysen sind kein Selbstzweck sondern schaffen Nutzenaspekte.

Branchenübergreifend

Meine Spezialisierung liegt in der Data Science, in den dort genutzten statistischen Methoden und der Programmierung. Gerne bringe ich dies mit Ihrer Domain Knowledge zusammen.

Methodenvielfalt

Jedem Problem sein Algorithmus – Meine eingesetzten Methoden stammen aus dem Machine Learning, der Multivariaten Statistik, Inferenzstatistik und Zeitreihenanalyse.

Beratermentalität

Als Berater komme ich in eine Einrichtung, helfe bei Projekten / durch ein Training und gehe wieder – kein Vendor-Lock-in, keine langfristigen Lizenzen.

Unterstützenswert

AlgorithmWatch ist eine gemeinnützige Organisation mit dem Ziel, Prozesse algorithmischer Entscheidungsfindung zu betrachten und einzuordnen, die eine gesellschaftliche Relevanz haben – die also entweder menschliche Entscheidungen vorhersagen oder vorbestimmen, oder Entscheidungen automatisiert treffen.

netzpolitik.org ist eine Plattform für digitale Freiheitsrechte und setzt sich für digitale Freiheiten und Offenheit ein. In netzpolitik.org lässt sich nachvollziehen, wie Politik das Internet durch Regulierung verändert und wie das Netz Politik, Öffentlichkeiten und alles andere verändert.

Für jede Gesellschaft ist Edward Snowden ein Vorbild für Zivilcourage. Ihm gebührt Unterstützung gegen die Verfolgung durch amerikanische Justizbehörden – insbesondere durch deutsches Asyl. Eine Anhörung Snwodens durch die deutsche Politik hat bisweilen nicht stattgefunden.