bool(false)

Der Master des Data-Science-Wettkampfs

Der Master des Data-Science-Wettkampfs
Dunkle Materie, Covid-19, Vogelgesänge – auf dem Portal Kaggle gibt es die unterschiedlichsten Daten und Machine-Learning-Wettbewerbe.

­Yasmin Billeter

Die Online-Community für Datenanalyse Kaggle bietet spannende Wettkämpfe und bis zu siebenstellige Siegesprämien – Suchtfaktor inklusive. «Master» und Data-Science-Experte Tobias Mérinat zeigt auf, wo dabei noch grosses Potenzial für die Wirtschaft liegt.

In seiner Freizeit spielte Tobias Mérinat früher Hellseher. Er versuchte vorauszusagen, wer eine Versicherung zu einem bestimmten Tarif kaufen wird, wie die Umsätze der Restaurants sich entwickeln und ob eine mobile Anzeige angeklickt wird. Mérinat hat keine übersinnlichen Fähigkeiten: Er ist Data Scientist. Für seine Prognosen nutzt er Algorithmen. Den Baustoff – die Daten – fand er auf der Website Kaggle: Dort stellen Forschungseinrichtungen und Unternehmen Aufgaben, die sie selbst nicht lösen können. Expertinnen und Experten aus der ganzen Welt versuchen dann, eine Antwort zu finden. Sie treten in einem Wettbewerb um den besten Algorithmus an – wer gewinnt, bekommt meist eine Geldprämie. Teilweise werden bis zu fünf-, sechs- oder siebenstellige Siegesprämien ausgeschrieben.

Auf Kaggle gibt es diverse Wettbewerbe, bei denen die Community Machine Learning Modelle entwickelt.

Mittlerweile ist Tobias Mérinat zweifacher Vater. In seiner Freizeit hat er keine Zeit mehr für Machine-Learning-Wettbewerbe. «Sie sind extrem aufwändig und machen süchtig», sagt er und schmunzelt. Lieber spielt der 43-Jährige Lego mit seinen Kindern. Die Familie ist ihm wichtig: Er hat auch einen Papi-Tag pro Woche. Die Arbeit im Homeoffice kommt ihm entgegen. Daten zielgerichtet zu analysieren ist jetzt seine Aufgabe beim Algorithmic Business Research Lab.

Machine-Learning-Wettbewerbe ebneten mir den Weg von der Theorie in die Praxis.

An seine Anfänge mit Kaggle-Wettbewerben erinnert er sich gerne: «Sie ebneten mir den Weg von der Theorie in die Praxis: Hier konnte ich Data Science und Machine Learning vertieft anwenden.» Mérinat nahm an zig Wettbewerben teil. Am Anfang überall, später nach Interesse und dort, wo er am meisten lernen konnte.

Er nahm aktiv Teil an der Community und darf sich dank seiner Erfolge KaggleCompetitions-Master nennen. Auf dem Weg dorthin verdiente er virtuelle Medaillen und konkurrierte auf Live-Ranglisten um den Ruhm der Datenwissenschaftlerinnen und -wissenschaftler.

Kaggle ist nicht die reale Machine-Learning-Welt.

Er mied jene Wettbewerbe, bei denen abzusehen war, dass die Teilnehmenden um Promille kämpfen würden – «wie beim Skirennfahren». Das habe mit der Realität wenig zu tun. Und hier sieht er auch das Problem: «Kaggle ist nicht die reale Machine-Learning-Welt. Es ist ein Ausschnitt. Es entstehen hochgezüchtete Lösungen, die extrem genau, aber nicht operationalisierbar sind.»

Lernen von den Besten

In der richtigen Welt müsse ein Unternehmen zuerst ein geschäftsrelevantes Problem beschreiben, saubere Daten beschaffen und festlegen, wie Erfolg gemessen wird. Das sei gar nicht immer so einfach und oft der grössere Teil der Arbeit, so Mérinat. Hier sieht er eine Chance, von Kaggle zu lernen: «Wenn ein Unternehmen sich die Mühe macht und Kosten von 80’000 bis 200’000 US-Dollar in Kauf nimmt, um einen Wettbewerb zu platzieren, muss dies zentral für sein Geschäft sein und einen signifikanten Nutzen bringen.»

Es entstehen extrem hochgezüchtete Lösungen.

Als logische Konsequenz: «Indem wir Machine-Learning-Wettbewerbe von Kaggle analysieren, erhalten wir einen guten Indikator dafür, welche Datenproblemen in welchen Branchen und Industriezweigen vorhanden sind. Zudem erfahren wir, welche Branchen Kaggle nutzen respektive überhaupt kennen.» Mérinat machte also das, was er ohnehin gut kann: Daten ordnen und sie nutzbar machen. Einen Einblick erhalten Sie nachfolgend:

Erkenntnisse aus der Kaggle-Studie von Tobias Mérinat:

Welche Branchen setzen auf Machine-Learning-Wettbewerbe?

Welche Themen bilden die Machine-Learning-Wettbewerbe ab?

Die Studie zeigt, dasss Machine Learning bereits in den meisten Branchen eingesetzt wird. Die Branchen mit dem breitesten Einsatz sind Forschung, Internetwerbung, Medizin, Finanzwesen, Consulting und Versicherungen.

Kaggle-Wettbewerbe sind ein Indikator dafür, mit welchen zentralen und schwierigen Datenproblemen sich die Big Player der verschiedenen Industriesektoren befassen.

Die Themen wo Machine Learning am meisten eingesetzt wird, sind Krankheitsdiagnostik, Objekterkennung und Naturwissenschaften. Gut vertreten sind auch branchenübergreifende Themen wie Vorhersage von Verkaufspreisen oder Volumen, Recommender Systems und Konversion. Objekterkennung ist eine etablierte Methode, die bereits branchenübergreifend eingesetzt wird.

Tobias Mérinat betont, dass die Wettbewerbe kein umfassendes Abbild davon seien, wo Machine Learning generell eingesetzt werden kann. Sie seien jedoch ein guter Indikator, mit welchen zentralen und schwierigen Datenproblemen sich die Big Player der verschiedenen Industriesektoren befassen. Die Studie zeigt zum Beispiel, dass Banken relativ breite Interessen vertreten und es sich leisten können, diese mit Wettbewerben zu verfolgen. Im Bereich industrielle Produktion hingegen wurden fast keine Wettbewerbe ausgeschrieben. Das erstaunt Mérinat: «Hier gäbe es ebenfalls viel Potenzial, weil bei Produktionsprozessen viele Daten aufgezeichnet werden.»

Tipps für die Data-Science-Reise

All jenen, welche den Einstieg in die Data-Science-Welt suchen, kann Tobias Mérinat Kaggle sehr empfehlen. «Ich habe dort unglaublich viel gelernt. Auch Tricks, die ich vorher in keinem Buch gefunden und in keiner Vorlesung gehört habe.» Firmen würde er die Plattform nicht uneingeschränkt empfehlen. «Wenn ein Unternehmen bereit ist, soviel Geld für einen Wettbewerb zu investieren, würde es besser bei unserem Team anklopfen. Wir entwickeln anwendbare und effiziente Lösungen.»

Tobias Mérinat

Unser Datenexperte: Tobias Mérinat setzt als Machine Learning Engineer beim Algorithmic Business Research Lab (ABIZ) mit Leidenschaft datenbasierte Industrieprojekte um. Er hat im internationalen Ranking von Kaggle den Titel Competitions-Master erreicht.

Die Online-Community für Datenanalyse: Kaggle bietet Dienstleistungen rund um das Thema Big Data, Machine Learning und Data Mining. Der Hauptzweck von Kaggle ist die Organisation von Data-Science-Wettbewerben. Dort werden in der Regel Tausende von Beiträgen eingereicht. Sowohl Einzelpersonen als auch komplette Teams konkurrieren dabei um lukrative Preise. Kaggle gehört mittlerweile zu Google.

Sie verfügen über spannende Datensätze, jedoch nicht über die Algorithmen, welche die Daten ordnen und nutzbar machen? Das ABIZ-Forschungsteam unterstützt Industrie- und Kooperationspartner bei der Entwicklung von Geschäftsmodellen und Dienstleistungen auf der Basis komplexer Algorithmen (Algorithmic Business) im Rahmen der digitalen Transformation. Nebst Forschung und Entwicklung bietet das Team folgende Dienstleistungen an: Beratungen betreffend Digital Business, Vor-Ort-Schulungen, Audits und Coaching in den Bereichen künstliche Intelligenz, Maschinelles Lernen, Bildverarbeitung und Datenanalyse.

Bilden Sie sich weiter: mit dem CAS Artificial Intelligence/Künstliche Intelligenz (AI/KI) KI verstehen, innovativ anwenden und hinter den Hype blicken!

Künstliche Intelligenz an der Hochschule Luzern: KI ist ein Schwerpunkt an der Hochschule Luzern. Seit Frühling 2020 läuft der Bachelor-Studiengang Artificial Intelligence & Machine Learning.

Gefällt Ihnen unser Informatik-Blog? Hier erhalten Sie Tipps und lesen über Trends aus der Welt der Informatik. Wir bieten Einsichten in unser Departement und Porträts von IT-Vordenkerinnen, Visionären und spannenden Menschen: Abonnieren Sie jetzt unseren Blog!

Beitrag teilen

  • Mail
  • Kommentare

    0 Kommentare

    Kommentar verfassen

    Danke für Ihren Kommentar, wir prüfen dies gerne.

    Pin It on Pinterest