bool(false)

Wie werde ich Data Scientist? So gelingen erste Lernschritte

Wie werde ich Data Scientist? So gelingen erste Lernschritte
Immer mehr Daten und Vernetzungen: Im CAS Big Data Analytics lernt man, wie Datenmanagement echten Nutzen bringt.

Das CAS Big Data Analytics trifft den Nerv der Zeit. Blicken Sie hinter die Kulissen des Kurses: Ein Teilnehmer berichtet, wie ihm der Kurs einen optimalen Einstieg in die Datenwissenschaft bot. Und wie er im Selbststudium weiterlernt.

Von Ueli Schweizer

Bald schon sind jedes Ding und jeder Mensch irgendwie mit dem Internet verbunden. Das generiert immer mehr Daten. Doch was soll mit all diesen Daten gemacht werden? Wie soll daraus etwas entstehen, das echten Nutzen bietet?

Hier kommt der Data Scientist oder die Datenwissenschaftlerin ins Spiel. Er oder sie verarbeitet, sortiert und visualisiert die Daten. Daraus ziehen sie Rückschlüsse auf Verhalten, Motive oder Verkaufszahlen.

Um das zu lernen, habe ich das CAS Big Data der Hochschule Luzern – Informatik besucht. Es gibt den Teilnehmenden in einem kompakten Lehrgang grundlegende Kenntnisse zur Verarbeitung von Daten mit. Wie das vor sich geht? Lesen Sie weiter: Ich biete Ihnen hier einen Blick hinter die Kulissen.

Ein Überblick über die Technologien bildet die Grundlage

Wer sich neu mit dem Thema Big Data Analytics befasst, kann sich in der enormen Vielzahl von Programmen, Werkzeugen, Technologien und Anbietern schnell verirren. Ohne Grundkenntnisse verliert man rasch den Überblick. Darum behandeln die Dozierenden im Kurs zuerst die Grundlagen der verschiedenen Technologien.

Grosse Palette an Programmen, Werkzeugen und Technologien: Im CAS Big Data Analytics lernt man sie  besser kennen. (Bild: Hochschule Luzern/Trivadis AG)

So habe ich gelernt, warum Cloudtechnologien die Verarbeitung von enormen Datenmassen erst möglich gemacht haben. Ich erfuhr, welche Tools wo eingesetzt werden können. Oder wie es möglich ist, sich in ein paar Minuten in einem Server irgendwo auf der Welt einzumieten. Mit dem neuen Wissen darüber, welche Werkzeuge man nutzt, geht’s dann los mit dem Bearbeiten der verschiedenen Daten.

Sind die Daten so aufbereitet, dass man mit ihnen arbeiten kann, lernt man, wie diese mit verschiedenen Methoden visualisiert werden, damit man sie besser versteht. Die Visualisierungen ermöglichen es, die gewünschten Analysen zu erstellen oder Muster aus den Daten zu erkennen. Diese einzelnen Techniken fügen sich dann nach und nach zu einer ganzen Big-Data-Plattform zusammen. Damit lassen sich die verschiedenen Arten von Daten aus unterschiedlichen Quellen verarbeiten.

Für ein hilfreiches, methodisches Vorgehen haben wir im CAS die CRISP-Methode kennen gelernt: Mit ihr lässt sich die Herangehensweise an ein Big-Data-Projekt in verschiedene Phasen und Schwergewichte gliedern. Das sieht man in der nachfolgenden Darstellung.

So funktioniert die CRISP-Methode. Sie ist ein weit verbreitetes Vorgehensmodell im Data Mining. (Bild: Wikipedia)
 

Gut gefüllter Rucksack mit Tools

Diese Grundkenntnisse bilden die Basis, um sich mit einer Big-Data-Plattform zu befassen. Die Dozierenden können indes nicht jeden einzelnen Aspekt davon behandeln. Sie sind daher im CAS nicht auf grundlegende Kenntnisse in Mathematik, Statistik oder Algorithmen eingegangen. Auch erfordert jeder individuelle Anwendungsfall eine eigene Analyse: Data-Analystinnen und -Analysten müssen die dafür benötigten Tools jeweils neu evaluieren. Der Kurs lieferte mir das Rüstzeug dazu. Ich habe nun einen gut gefüllten Rucksack an neuem Wissen und kann beim Entwurf und bei der Auswahl der Tools mitreden.

Selbststudium während und nach dem Lehrgang

Nach dem CAS ist vor dem CAS: Die Dozierenden vermitteln den Teilnehmenden einen guten Überblick, der ihnen hilft, sich im Big-Data-Dschungel zurechtzufinden. Wer sich in ein Thema vertiefen möchte, sollte eine Programmiersprache wie Python, R, SQL oder Scala erlenen.

Der Kurs vermittelt einen guten Überblick, der einem hilft, sich im Big-Data-Dschungel zurechtzufinden.

Eine gute Möglichkeit dazu bieten Online-Lernplattformen wie zum Beispiel Udemy. Dort bekommt man gegen eine kleine Gebühr Zugriff auf ein komplettes Selbststudium mit Videoanleitung, Codebeispielen, Software, weiterführenden Links und Support. Die Kurse sind so aufgebaut, dass man die Theorie danach gleich in der Praxis ausprobiert. Sie führen Schritt für Schritt durch die Codebeispiele und vermitteln ein besseres Verständnis für die Thematik. Ich habe mir auf diese Weise zum Beispiel vertiefte Kenntnisse in Machine Learning, Python und R-Studio erarbeitet.

Ideale Ergänzung zum CAS: Kurse auf Online-Lernplattformen helfen, Wissenslücken zu schliessen. (Printscreen Udemy, U. Schweizer)

Immer am Ball bleiben und lebenslang lernen

Das CAS Big Data Analysis gibt den Teilnehmenden einen guten Einblick in die Themengebiete und die komplexen Architekturen, die für die Arbeit mit Big Data benötigt werden. Es ist hilfreich, wenn die Teilnehmenden ein gewisses technisches Verständnis dafür mitbringen. Auch ist es nützlich, wenn sie die Basistechniken von Programmiertools und Programmiersprachen beherrschen. Ausserdem sind eine gewisse Neugierde und wenig Berührungsängste vor Technologie und Analytik von Vorteil.

Eine gewisse Neugierde und wenig Berührungsängste vor Technologie und Analytik sind von Vorteil.

In der schnelllebigen Welt der Datenverarbeitung hat man aber nie ausgelernt. Es gilt, immer am Ball zu bleiben und fortlaufend dazuzulernen. Dazu hilft es, regelmässig die gängigen Newsportale zu konsultieren. Ich informiere mich beispielsweise gerne bei KDnuggets und halte mich so auf dem Laufenden.

An unsere Leserinnen und Leser: Wie halten Sie sich beruflich auf dem Laufenden? Bilden Sie sich online weiter, und was empfehlen sie dabei?

Ueli Schweizer

Blickt hinter die Kulissen: Ueli Schweizer ist Productmanager Digital Products bei der Thermoplan AG in Weggis. Mit seinem Team verbindet er weltweit Kaffeemaschinen mit der Cloud. Das Know-how, das er sich an der Hochschule Luzern im CAS Big Data Analytics erworben hat, hilft ihm bei seiner Arbeit, Daten effizienter zu verarbeiten, besser zu verstehen und zu nutzen. Er hat das CAS 2020 besucht und bloggte damals für unseren Weiterbildungs-Blog aus dem Unterricht heraus.

Weiterkommen mit Weiterbildung: Das CAS Big Data Analytics vermittelt Ihnen praxisbezogen die wesentlichen Aspekte von Big Data und Analytics. Lernen Sie, wie Sie nahezu in Erkenntnisse aus strukturierten und unstrukturierten, internen und externen Datenbeständen gewinnen und die richtigen Schlüsse ziehen.

Im Fachkurs Big Data im Gesundheitswesen  lernen Sie, mit Big-Data-Technologien historische Daten als Entscheidungsgrundlagen zu analysieren und Tarife objektiv festzulegen

Nächste Info-Veranstaltung: Die nächste Online-Information über die Weiterbildungsangebote des Informatikdepartements der Hochschule Luzern findet am 3. Februar um 18 Uhr statt. Dabei erhalten Sie auch weitere Informationen zum CAS Big Data Analytics .

Gefällt Ihnen unser Informatik-Blog? Hier erhalten Sie Tipps und lesen über Trends aus der Welt der Informatik. Wir bieten Einsichten in unser Departement und Porträts von IT-Vordenkerinnen, Visionären und spannenden Menschen: Abonnieren Sie jetzt unseren Blog!

Im Weiterbildungs-Blog stöbern: Was lernen unsere CAS-Teilnehmenden? Was machen sie beruflich? In unserem Weiterbildungs-Blog erfahren Sie mehr. Hier bloggen aktuelle CAS-Teilnehmende aus ihren Weiterbildungsprogrammen heraus. Wir unterstützen und fördern die Bloggenden aktiv in diesem Qualifikationsschritt.

Beitrag teilen

  • Mail
  • Kommentare

    0 Kommentare

    Kommentar verfassen

    Danke für Ihren Kommentar, wir prüfen dies gerne.

    Pin It on Pinterest