Lang ist es her – und es kam anders als vorhergesagt. Wir blenden zurück: 2012 veröffentlichten die «Pioniere der Datenwissenschaft» Thomas H. Davenport und D.J. Patil in der Harvard Business Review einen Artikel mit dem Titel «Data Scientist: The Sexiest Job of the 21st Century». Darin schrieben sie, dass Data Scientist der attraktivste Beruf des 21. Jahrhunderts sei. Dass diejenigen mit den richtigen Fähigkeiten sechsstellige Gehälter erzielen würden.
Umberto Michelucci ist Er leitet dort auch Weiterbildungsprogramme in Data Engineering and Applied Data Science und Machine Learning. Er besitzt ein PhD in Machine Learning in Physik sowie einen akademischen Titel in Pädagogik.
Michelucci veröffentlicht regelmässig Artikel in peer-reviewed wissenschaftlichen Journals und ist Gründer des Schweizer KI-Unternehmens TOELT LLC. Auch ist er Autor von fünf Lehrbüchern über Deep Learning, Statistik und wissenschaftliches Schreiben.
Davenport und Patil priesen Datenwissenschaftlerinnen und -wissenschaftler als eine «neue Generation» unverzichtbarer Akteure in Unternehmen.
Vom Traum zur Realität: Der harte Wettbewerb um Data-Science-Jobs
Natürlich wollte nun jede und jeder dabei sein. Das führte zu einem Ansturm von Lernenden in der Datenwissenschaft. Menschen mit den unterschiedlichsten Hintergründen wollten etwas über Data Science lernen.
Viele Interessierte nahmen fälschlicherweise an, dass Data Science eine rein technische Disziplin sei. Dass man ähnlich wie bei der Standard-Softwareentwicklung Methoden und Ansätze untersuche. Habe man diese verstanden, könne man sie methodisch anwenden.
Sie irrten. Mit der Zeit wurde es immer schwieriger, einen Job als Data Scientist zu ergattern. Die verheissungsvollen sechsstelligen Gehälter rückten in weite Ferne. Neulinge, die versuchen, Fuss zu fassen, sehen sich einer zunehmend harten Konkurrenz gegenüber: hochqualifizierten Fachkräften mit Doktortiteln in Statistik, Informatik oder Mathematik, die sich auf Data Science und Maschinelles Lernen spezialisiert haben.
Data Science ist ein breites Feld: Es geht darum, aus Daten Erkenntnisse zu gewinnen. Sie nutzt zahlreiche Tools, Techniken und Methoden, um Muster zu erkennen, Probleme zu lösen und Entscheidungen zu unterstützen. Data Science integriert dabei Bereiche wie Statistik, Datenanalyse, Datenvisualisierung und Programmierung.
Maschinelles Lernen Maschinelles Lernen (ML) ist ein Bereich der Künstlichen Intelligenz. Dabei erkennen Algorithmen aus Daten Muster und treffen Vorhersagen, ohne explizit programmiert zu werden. Maschinelles Lernen und Data Science unterscheiden sich in ihrem Fokus.
Beim ML geht es darum, Algorithmen zu entwickeln, die automatisch Muster erkennen und Vorhersagen treffen. Data Science ist ein breiteres Feld. Es umfasst die Analyse von Daten, den Einsatz statistischer Methoden und Programmierung, um Erkenntnisse zu gewinnen.
Die Stellenbeschreibungen wurden immer anspruchsvoller. Nur die wenigsten konnten diese Anforderungen noch erfüllen. Wie kam es dazu?
Die Evolution des Data Scientists: mehr als nur Zahlen und Code
Zu Beginn war Data Science ein technisch anspruchsvolles Feld, das hauptsächlich aus komplexer Programmierung bestand. Schon die Implementierung einfacher Algorithmen erforderte einen enormen Aufwand, da effiziente Programmbibliotheken noch nicht zur Verfügung standen. Erst 2015 erschien TensorFlow, eine von Google entwickelte Python-Bibliothek für neuronale Netzwerke. Da auch ich mit dieser ersten Version gearbeitet habe, kann ich Ihnen sagen, dass die Verwendung keinen Spass gemacht hat. PyTorch, die konkurrierende Bibliothek von Meta, folgte erst 2016. Sie markierte einen weiteren Schritt in Richtung effizienterer Tools.
Der steinige Weg zu effizienten Tools
Zuvor war die Arbeit mit neuronalen Netzwerken ein Albtraum. Alles musste mühsam von Hand aufgebaut werden. Dadurch wurde Data Science zu einem hochtechnischen Feld mit einem starken Fokus auf Programmierung. Auch in den Anfängen von TensorFlow und PyTorch war der Prozess weit entfernt von Einfachheit; der Grossteil der Arbeit bestand im Schreiben von Code, weniger im Interpretieren der Ergebnisse.
Der Fokus lag fast ausschliesslich auf den Tools. Bildungsinstitute boten dazu zahlreiche Kurse an – einige waren gut, einige aussergewöhnlich schlecht. Alle fokussierten auf die Programmier-Aspekte von Data Science – ein Schwerpunkt, der leider auch heute noch stark vertreten ist.
Im Grunde wurden Datenwissenschaftlerinnen und -wissenschaftler in erster Linie als technische Expertinnen und Experten angesehen. Ihr Arbeitsalltag bestand darin, komplexe Codes zu schreiben, Modelle von Grund auf neu zu erstellen und die technischen Aspekte der Datenverarbeitung zu verwalten. Sie konzentrierten sich auf Programmierung, Datenbearbeitung und die Entwicklung massgeschneiderter Algorithmen.
Um zukünftige Data Scientists besser auf die Anforderungen vorzubereiten, entwickelten die Universitäten neue Bachelor- und Master-Studiengänge. Diese fokussierten auf Data Science oder – im Sinne des aktuellen Trends – auf Künstliche Intelligenz.
Datenwissenschaft ist mehr als Computerprogrammierung
Viele dieser Programme begingen den Fehler, sich zu stark auf technische Fähigkeiten zu fokussieren. Sie brachten angehende Datenwissenschaftlerinnen und -wissenschaftler hervor, die zwar programmieren konnten, jedoch schlecht auf die realen Anforderungen des Marktes vorbereitet waren.
Um dies zu verdeutlichen, vergleichen wir es mit der Holzbearbeitung: Sägen und Hämmern sind zwar grundlegende handwerkliche Fertigkeiten, doch Holzbearbeitung umfasst weitaus mehr als nur den Umgang mit Werkzeugen. Es geht um Planung, Design und ein tiefes Verständnis der Materialien.
Ähnlich verhält es sich in der Datenwissenschaft: Sie ist weit mehr als nur Computerprogrammierung. Die Studierenden erlernten den Umgang mit den technischen Werkzeugen. Dann aber wurde ihnen allmählich und schmerzhaft bewusst, dass andere, weniger technikzentrierte Aspekte der Datenwissenschaft immer wichtiger wurden.
Mit der zunehmenden Anwendung von Data Science und Maschinellem Lernen in Wissenschaft und Industrie wurde allmählich klar: Es ist entscheidender, zu verstehen, wie und warum bestimmte Algorithmen eingesetzt werden, als sich auf die Wahl der Bibliothek oder Programmiersprache zu konzentrieren.
Weg vom Code, hin zur Wirkung: Data Science als Innovationstreiberin
Ob man PyTorch oder TensorFlow für neuronale Netzwerke verwendete, wurde zunehmend zweitrangig. Vielmehr wurde es immer wichtiger zu analysieren, welche Art von Netzwerk man benutzte. Und wie man die Vertrauenswürdigkeit der Ergebnisse sicherstellte. Es galt vermehrt, herauszufinden, ob sich die Algorithmen in realen Szenarien richtig verhielten, statt einfach nur exotische Algorithmen zu implementieren.
Die entscheidenden Fragen waren nun: Welcher Algorithmus passt zu welchem Problem? Welche Einschränkungen bringt er mit sich? Diese Aspekte rückten in den Vordergrund, während die technischen Details der Implementierung zunehmend in den Hintergrund traten.
Heute ist es von zentraler Bedeutung, ein trainiertes Modell in die Praxis zu bringen. Man muss es den Kundinnen und Kunden zugänglich machen und damit echten Mehrwert schaffen.
Es reicht nicht aus, lediglich Modelle zu entwickeln. Es ist ebenso wichtig, sicherzustellen, dass diese Modelle praktische Probleme lösen und der Organisation einen messbaren Mehrwert bieten.
Machine Learning Operations: Die neue Ära der Datenwissenschaft
Genau diesen speziellen Herausforderungen widmet sich Machine Learning Operations (MLOps). Das ist ein noch junges Feld. MLOps entstand erstmals 2015. Man bedenke: Während das Internet bereits seit 35 Jahren existiert, ist MLOps noch keine zehn Jahre alt. Aufgrund des rasanten Fortschritts in diesem Bereich muss MLOps nahezu jedes Jahr neu gedacht und weiterentwickelt werden. Nur so kann es mit den neuesten Technologien und Methoden Schritt halten.
Immer mehr fortschrittliche Tools und automatisierte Plattformen für Maschinelles Lernen sind auf den Markt gekommen. Leistungsstarke Bibliotheken wie TensorFlow und PyTorch wurden stetig verbessert. Dank neuen grossen Sprachmodellen (LLMs) sank der Bedarf an manueller Codierung und Modellerstellung erheblich.
Vielfältigere Bildungshintergründe sind gefragt
Diese Tools haben die Implementierung anspruchsvoller Algorithmen und Prozesse erleichtert. Dadurch können sich Data Scientists heute verstärkt auf Aufgaben auf höherer Ebene fokussieren.
Diese Entwicklung öffnet das Feld für Menschen mit vielfältigeren Bildungshintergründen. Die Rolle des Data Scientists hat sich in den letzten Jahren deutlich gewandelt: Sie verlagert ihren Schwerpunkt von der Codierung und technischen Aufgaben hin zu einer breiteren Betonung der Interpretation datengesteuerter Erkenntnisse. Sie setzt stärker auf die Zusammenarbeit mit funktionsübergreifenden Teams. Gleichzeitig nutzen Data Scientists verstärkt fortschrittliche Tools wie automatisierte Plattformen für Maschinelles Lernen und grosse Sprachmodelle.
Teamwork, strategisches Denken, Kommunikation: All das wird wichtiger
Heute agieren Datenwissenschaftlerinnen und -wissenschaftler innerhalb von Organisationen zunehmend als strategische Partnerinnen und Partner. Sie arbeiten verstärkt in funktionsübergreifenden Teams wie etwa mit Unternehmensleitungen, Produktmanagerinnen und Marketingexperten. Denn es gilt, komplexe Datenerkenntnisse in umsetzbare Geschäftsstrategien umzumünzen. Vermehrt sind sie es, die Ergebnisse an nichttechnische Stakeholder kommunizieren. Sie machen datengesteuerte Erkenntnisse einem breiteren Publikum zugänglich.
Darüber hinaus tragen Data Scientists heute die Verantwortung, die ethische Nutzung von Daten sicherzustellen. Sie müssen Verzerrungen (Biases) in Modellen verstehen und mildern. Sie wahren die Transparenz bei datenbasierten Entscheidungen.
Dieser Wandel hat Datenwissenschaftlerinnen und -wissenschaftler zu wichtigen Entscheidungstragenden gemacht. Sie arbeiten nicht nur mit Daten, sondern beeinflussen auch aktiv die strategische Ausrichtung ihrer Organisationen. Das tun sie, indem sie Datenstrategien an Geschäftszielen ausrichten.
Data Scientists spielen heute eine Schlüsselrolle bei der Förderung von Innovation und dem Erhalt von Wettbewerbsvorteilen in Organisationen. Das tun sie, indem sie Daten als wertvolles Kapital einsetzen.
Diese Skills sind gefragt: Was erfolgreiche Data Scientists heute ausmacht
Dies führt zur Frage nach dem idealen Bildungsweg, um Data Scientist zu werden. Natürlich sind technische Fähigkeiten wie Python-Programmierung und Software-Entwicklung wichtig – sie bilden die Basis, ähnlich wie Schlittschuhlaufen für eine Eiskunstläuferin. Doch das reine Beherrschen von Python macht noch keinen Data Scientist. Genauso wie das Schlittschuhfahren allein niemanden zum Eiskunstläufer macht.
Für Data Scientists ist es zunehmend wichtiger, Statistik und Methoden zu studieren, die über die grundlegende Modellentwicklung und Programmierung hinausgehen. Ebenso sind heute starke Schreib- und Kommunikationsfähigkeiten nötig. Erfolgreiche Data Scientists sind heute in erster Linie Wissenschaftlerinnen und Wissenschaftler. Sie müssen das gesamte Spektrum der Fähigkeiten beherrschen, das diese Rolle ausmacht.
Meine Empfehlung: Betrachten Sie Programmierung als Basis, fügen Sie dann ein solides Verständnis von Statistik und Mathematik hinzu, gefolgt von Software-Entwicklung. Runden Sie das Ganze schliesslich mit guten Kommunikations- und Schreibfähigkeiten ab. Kombinieren Sie alle diese Elemente. Damit haben Sie die Grundlage für eine erfolgreiche Datenwissenschaftlerin oder einen erfolgreichen Datenwissenschaftler.
Lebenslang lernen – mit Tempo und Neugier
Datenwissenschaftler zu werden – und dabei betone ich «Wissenschaftler» im Titel – ist eine lebenslange Reise, die nie wirklich endet. Sie werden nie aufhören zu lernen, noch werden Sie jemals alle Fähigkeiten beherrschen oder alles wissen. Denn das Feld entwickelt sich in rasantem Tempo weiter: Neue Methoden, Algorithmen, Hardware und Programmiersprachen tauchen ständig auf.
Um am Puls der Zeit zu bleiben, ist ständiges Lernen unerlässlich. Data Scientist zu sein , ist weit mehr als ein 9-to-5-Job – es ist eine fortwährende Herausforderung, geprägt von unstillbarer Neugier und dem stetigen Drang, sich weiterzuentwickeln und anzupassen.
Sich in der Data-Science-Community zu engagieren und an Open-Source-Projekten mitzuwirken, kann angehende Data Scientists dazu inspirieren, aktiv verbunden zu bleiben, wertvolle Erfahrungen zu sammeln und einen Beitrag zum breiteren Feld der Datenwissenschaft zu leisten.
Meine Leitsätze an angehende Data Scientists:
Wichtig: Geniessen Sie die Reise – denn die Leidenschaft, die Sie in Ihre Arbeit investieren, wird Ihren Erfolg massgeblich vorantreiben.
Veröffentlicht am: 24. September 2024
Struktur, Relevanz, Flexibilität – unser Lernansatz: Die von Umberto Michelucci geleitete Weiterbildung im Bereich Data Science basiert auf drei Säulen: Didaktik, Inhalt und Relevanz. Es geht um weit mehr als nur das Abhaken aktueller Trends; für diese komplexen Themen ist ein gut strukturierter Bildungsprozess entscheidend.
In seinem Programm legt Umberto Michelucci auch grossen Wert auf Flexibilität: Es ist so gestaltet, dass die Teilnehmenden ihre Kurse mit Familie, Beruf und Privatleben vereinbaren können. Die Teilnehmenden erhalten fachkundige Begleitung und profitieren von wertvollen Networking-Möglichkeiten, um das Lernerlebnis zu bereichern.
Zusätzlich legen wir grossen Wert auf Flexibilität: Unser Programm unterstützt die Teilnehmenden mit fachkundiger Begleitung und bietet exzellente Networking-Möglichkeiten, um das Lernerlebnis zu bereichern.
Bilden Sie sich weiter: Informieren Sie sich hier über die Weiterbildungsbereiche Applied Data Intelligence und Data Engineering and Applied Data und Machine Learning.
Welche Weiterbildung passt zu mir? Der Weiterbildungs-Finder verschafft Ihnen den Durchblick.
Online-Infoveranstaltung: Wir informieren über Weiterbildungen im Themenfeld Applied Data Intelligence am Montag, 7. Oktober 2024, und am Montag, 4. November 2024, jeweils von 17–18 Uhr.
Besuchen Sie weitere (Online-)Info-Veranstaltungen der HSLU!
Informatik-Blog abonnieren: In diesem Blog erfahren Sie mehr über Trends aus der Welt der Informatik. Wir bieten Einsichten in unser Departement und Porträts von IT-Vordenkerinnen, Visionären und spannenden Menschen: Jetzt abonnieren.
Aktuelles aus unserem Departement auf LinkedIn. 👀 Jetzt folgen!
Kommentare
0 Kommentare
Danke für Ihren Kommentar, wir prüfen dies gerne.