Über mich

Mein Name ist Andreas Wygrabek – der Data-Science-Architect. Sie können mich über meine Website kontaktieren oder finden mich bei Twitter, Xing und Linkedin.

Person

Vielen Dank für Ihren Besuch auf meiner Homepage! Ich arbeite als freiberuflicher Data-Science Consultant und Trainer im Bereich Programmierung und statistischer Datenanalyse. Meinen Kunden helfe ich dabei, analytische und technologische Herausforderungen zu meistern und in Geschäftsnutzen umzuwandeln.

Andreas Wygrabek
Andreas Wygrabek
Andreas Wygrabek

Mit dem Projekt data-science-architect biete ich Full-Stack Projektmitarbeit an: Codeentwicklung, Support, Training und Projektmanagement. Die zentralen Werkzeuge in meinen Projekten und Trainings sind die 2 populärsten freien Programmiersprachen zur statistischen Datenanalyse – R und Python.

Portfolio

Analysedienstleistungen, Beratung im Bereich Data Sciene und Training – Mein Portfolio untergliedert sich in 3 Teilbereiche.

Data Science

Entwicklung von Algorithmen und Data-Driven Software.

Data Architecture

Beratung und Projektrealisationen im Bereich Big-Data und den Hadoop-Systemkomponenten.

Trainings / Workshops

Veranstaltungen im Bereich Programmierung, Statistik und Algorithmenentwicklung.

Hintergrund

Mein beruflicher Werdegang umfasst eine langjährige Tätigkeit in einem der führenden deutschsprachigen Data-Science Beratungsunternehmen und eine Tätigkeit bei der Fraunhofer-Gesellschaft am Standort Kassel. Als Data-Scientist vereine ich statistisch- methodisches Know-How mit IT-Kenntnissen.

  • > 9 Jahre Erfahrung in der Programmierung mit R
  • > 5 Jahre Erfahrung in der Programmierung mit Python
  • > 2 Jahre Erfahrung im Umgang mit Hadoop-Systemkomponenten
  • Expertise im Bereich Statistik und Methodik (Erfahren Sie Details in meinem technischen Profil)
  • Data-Science Integration in Unternehmensprozesse über Web-Applikationen mit html, CSS und JavaScript.
  • Inhouse- und Offsite-Trainings / Workshops in Software und Methodik
  • IT-Projektmanagement (klassisches Projektmanagement sowie agile Methoden)

Profil

Machen Sie sich ein Bild von meinem Einsatz-Profil. Bei Fragen stehe ich Ihnen gerne zur Verfügung.

Programmieren

R +++
Python +++
JavaScript ++
Web-Entwicklung: Html/CSS ++
SQL ++

Methoden

Machine Learning / Data Mining +++
Deep Learning +++
Multivariate Statistik +++
Zeitreihenanalyse +++
Inferenzstatistik +++

Big-Data Technologien

Spark +++
Spark Streaming +++
Jupyter / Zeppelin +++
Hadoop ++
Hive ++
MongoDB ++
Impala ++
Cassandra ++
Storm +

Frameworks/Libraries

caret +++
Keras +++
tensorflow +++
H2O +++
MlLib +++
shiny +++
htmlwidgets ++
leaflet ++
highcharts +

Weitere Technologien

Version Control (Git, SVN) +++
Atlassian Jira +++
SPSS +++
Grafana ++
SAS +

Referenzen

Hier finden Sie einen Auszug bisheriger Projekte, die ich durchgeführt habe oder an denen ich maßgeblich beteiligt war. Ich bitte um Verständnis, dass die Auftraggeber namentlich nicht erwähnt sind. Gerne bespreche ich die Referenzprojekte mit Ihnen persönlich.

Forecast and risk modelling for potential loan defaults

Role:

Algorithm Developer / Project Lead

Technologies, Methods:

R, H2O, Spark, Deep Learning, Gradient Boosting Machines, Ensemble Modelling, Stacking Blending, Clusteranalysis (K-means)

Upscaling und forecasting of energy feed in from renewable energy sources

Role:

Software Developer / Algorithm Developer

Technologies, Methods:

Python, H2O, Deep Learning, Spark, Hadoop, MongoDB

Building a R-Package with translated commands of SPSS-Syntax.

More information and download here.

Role:

Main Developer / Package Maintainer

Technologies, Methods:

R, SPSS, Roxygen2, Devtools, Git, Jira

Building a shiny application

The application is used as the leading bi- and reporting tool for the qualitymanagement department of a medical devices manufacturer

Role:

Shiny Developer

Technologies, Methods:

R, Shiny, htmlwidgets, Git, Jira

Building a Web-Application with Leaflet

The application visualizes the global sun radiation and power generation from renewable sources.

Role:

Web Developer

Technologies, Methods:

JavaScript, Leaflet, Highcharts, jQuery, HTML, CSS, Python, GeoJSON

Proof of concept for price forecasts

The prices refer to energy prices and the forecast was based on Deep Learning Models

Role:

Project Lead, Algorithm Developer

Technologies, Methods:

Python, Keras, Deep Learning, Recurrent Neural Networks, Time Series Forecast

Integration of R in operational business environment

  • Set-up Server-Client Environment for R-Studio
  • Connection to Version Control System (Git)
  • Function and process documentation
  • Set-up project management tool (Jira)
  • Training / Support

Role:

Project Lead, System Architect, System Administrator

Technologies, Methods:

RStudio-Server, Git, Jira

Philosophie

Kooperation

Offene Kommunikation und transparente Lösungen – Ergebnisse und Quellcode werden vollständig an meine Kunden weitergegeben.

Datenethik

Datenanalysen unterstützen Entscheidungen und helfen dabei, Prozesse zu optimieren. Sie richten sich nie gegen Menschen.

State-of-the-Art

Neue Technologien werden verfolgt und – wenn sie einen Projektnutzen bringen – eingesetzt.

Unabhängigkeit

Meine zentralen Technologien sind Open-Source und ich arbeite völlig herstellerneutral.

Agilität

Dynamik, auslieferbare und interpretierbare Ergebnisse charakterisieren meine Projekte. Wenn möglich arbeite ich nach Scrum.

Nutzen-Fokus

Ob in Forschung oder Wirtschaft – Datenanalysen sind kein Selbstzweck sondern schaffen Nutzenaspekte.

Branchenübergreifend

Meine Spezialisierung liegt in der Data Science, in den dort genutzten statistischen Methoden und der Programmierung. Gerne bringe ich dies mit Ihrer Domain Knowledge zusammen.

Methodenvielfalt

Jedem Problem sein Algorithmus – Meine eingesetzten Methoden stammen aus dem Machine Learning, der Multivariaten Statistik, Inferenzstatistik und Zeitreihenanalyse.

Beratermentalität

Als Berater komme ich in eine Einrichtung, helfe bei Projekten / durch ein Training und gehe wieder – kein Vendor-Lock-in, keine langfristigen Lizenzen.

Unterstützenswert

AlgorithmWatch ist eine gemeinnützige Organisation mit dem Ziel, Prozesse algorithmischer Entscheidungsfindung zu betrachten und einzuordnen, die eine gesellschaftliche Relevanz haben – die also entweder menschliche Entscheidungen vorhersagen oder vorbestimmen, oder Entscheidungen automatisiert treffen.

netzpolitik.org ist eine Plattform für digitale Freiheitsrechte und setzt sich für digitale Freiheiten und Offenheit ein. In netzpolitik.org lässt sich nachvollziehen, wie Politik das Internet durch Regulierung verändert und wie das Netz Politik, Öffentlichkeiten und alles andere verändert.

Für jede Gesellschaft ist Edward Snowden ein Vorbild für Zivilcourage. Ihm gebührt Unterstützung gegen die Verfolgung durch amerikanische Justizbehörden – insbesondere durch deutsches Asyl. Eine Anhörung Snwodens durch die deutsche Politik hat bisweilen nicht stattgefunden.