Für alle Data Science Projekte ist die Ist-Aufnahme der bereits vorhandenen Datenbestände ein erster wichtiger Schritt. Hier ist zu klären welche Daten vorliegen und mit welcher Qualität. Aus dieser Information können die weiteren Daten festgelegt werden, die für das Projekt wahrscheinlich erforderlich sind. Dies ist ein iterativer Prozess der im Projektverlauf mehrmals durchlaufen werden muss.
Mit dieser ersten Analyse ist eine erste Kosten- und Zeitplanung möglich.
Für die Projektdurchführung hat sich der Regelkreis nach der CRISP-DM (Cross-Industry Standard Process) sehr gut bewährt.
Sind nun die Randbedingen geklärt kann mit dem Projekt gestartet werden. Hier beginnt die eigentliche Arbeit des Data Scientist. Folgende Hauptpunkte sind nun abzuarbeiten:
1. Verständnis der Daten schaffen
2. Vor- und Aufbereitung der Daten
3. Modellieren mit Hilfe der unterschiedlichen Verfahren
4. Bewertung und Überprüfung der Ergebnisse
5. Bereitstellung und Anwendung der Ergebnisse im produktiven Betrieb
Diese 5 Punkte werden mit den Standard Softwaretools und Methoden des Data Scientist abgearbeitet. Erfahrungen liegen mit den folgenden Softwaretools vor.
Meine Aufgaben in den verschiedenen durchgeführten Projekten waren neben Projektleitung das Einbringen meiner Kernkompetenzen in die Projekte.
- GoogleCEOSOFTWARE-HERSTELLER
Menlo Park, CA, USA
September 1998 - Heute (25 Jahre und 3 Monate)Wenn ich Ihnen heute mein Leben beschreiben sollte, würde ich sagen, dass vor allem die Begegnungen wichtig für mich waren...
Do you really want to delete this item?
Do you really want to delete this item?
Do you really want to delete this item?
Do you really want to delete this item?