Data Intelligence & Big Data,

Forschung & Dienstleistung

«Wir werden das Machine Learning direkt innerhalb von Datenbanken optimieren»

«Wir werden das Machine Learning direkt innerhalb von Datenbanken optimieren»
«Unser Ziel ist, dass wir maschinelles Lernen direkt in der Datenbank mit SQL machen können», das sagt unser Experte Michael Kaufmann über seine Forschungsarbeit.

von Gabriela Bonin

Prognosen von unseren Expertinnen und Experten: Teil 8

Welche Neuerungen stehen im Bereich Data Intelligence und Big Data an? Unser Experte Michael Kaufmann spricht in diesem Interview darüber, wie wir die Effizienz steigern werden und warum Analysen dank hochkomplexer Berechnungen in SQL tausend Mal schneller sein können.

Herr Kaufmann, was ist in diesem Jahr in Ihrem Bereich Data Intelligence und Big Data zu erwarten?

Das entsprechende Forschungsthema wird bei uns am Departement Informatik neu Datenbanken und Big Data heissen. Unser Ziel ist, dass wir maschinelles Lernen direkt in der Datenbank mit SQL machen können. Dies hat einige Vorteile: Datensätze können viel grösser als der Arbeitsspeicher sein und Daten können in der Datenbank drinbleiben. Das dient unter anderem dem Datenschutz und der Effizienz; zudem laufen die Algorithmen auf allen Systemen, die eine Standard-SQL-Schnittstelle unterstützen, also auch Hive und Drill für Skalierbarkeit für Big Data mit Terabytes an Daten.

Wir konzentrieren uns nun auf In-Database Machine Learning.  Ich betreue mehrere Bachelor-Thesen in diesem Bereich und werde Projekte dazu akquirieren.

Was wird es in Ihrem Fachgebiet auch im kommenden Jahrzehnt noch nicht geben?

Eine Datenbank, welche ein Yottabyte an Daten enthält (1YB = 1024 Bytes = 1012 Terabytes).

Worauf werden wir noch sehr lange warten müssen?

Auf ein Werkzeug oder eine Library, welches alle gängigen Machine-Learning-Algorithmen in Standard-SQL auf allen gängigen SQL-Systemen hochperformant umsetzen kann. Wir arbeiten in unserer Forschung daran.

Was ist der grösste Irrtum von Laiinnen und Laien in Ihrem Fachgebiet?

Laien und auch einige Informatikerinnen und Informatiker täuschen sich, wenn sie denken, die Datenbanksprache SQL sei eine «einfache» Sprache. Wohl gelingt der Einstieg in SQL schnell, da die Grundlagen einfach sind. Man kann aber in SQL hochkomplexe Berechnungen anstellen, beispielsweise Machine Learning wie lineare Regression, Hauptkomponentenanalyse oder K-Means Clustering. Zudem ist die Optimierung alles andere als trivial – so kann die gleiche Analyse bis zu tausend Mal schneller sein, je nachdem, wie das SQL-Skript geschrieben wird. Das gelingt unter anderem mit Hilfe von Indizes, Materialized Views, Denormalisierung und den Verzicht auf Funktionsaufrufe über Suchparameter.

Was wird 2021 die grösste Knacknuss?

An Gelder heranzukommen für die Forschung. Der Aufwand für die Akquise steht in keinem Verhältnis zum Ertrag mehr. Interessant kann sein, die Forschung mit Studierendenarbeiten zu verbinden. So gewinnen beide Seiten: Die Studierenden vertiefen sich in interessante Projekte, und die Forschenden kommen einen Schritt weiter.

Was fasziniert Sie an Ihrem Thema und warum stehen Sie dafür ein?

Mich faszinieren die Verbreitung und Relevanz, welche Datenbanksysteme heute haben. Die meisten Apps, beinahe alle betrieblichen Informationssysteme und die meisten Webseiten haben heute ein Datenbanksystem im Hintergrund. Dies ist auch der Grund, warum wir die Ausbildung in Datenbanken in jedem Studiengang am Departement Informatik als Kernmodul unterrichten. Datenbanken bilden die Grundlage für jede wesentliche Applikation, sei es auf dem Smartphone, im Web oder im Unternehmen.

Zur Serie «Prognosen»: Expertinnen und Experten der Hochschule Luzern – Informatik geben einen Ausblick auf Entwicklungen in ihrem Fachgebiet.
An unsere Leserinnen und Leser: Welche Prognosen machen Ihnen Freude oder Sorge? Welche Entwicklungen streben Sie im Bereich Data Intelligence und Big Data an?

Veröffentlicht am 13.1.2021

Michael Kaufmann
Michael Kaufmann

Unser Experte für Data Intelligence und Big Data: Michael Kaufmann ist Dozent für Datenbanken an der Hochschule Luzern – Informatik. Er unterrichtet in den Fächern Database Systems, Databases & Security sowie Database Management for Data Scientists. Seit 2016 ist er im Stiftungsrat der FMsquare Foundation in Rain LU. In den Jahren 2016 bis 2019 koordinierte er das Forschungsteam Data Intelligence an unserem Departement. Er hat ein Jahrzehnt Erfahrung in Datenanalyse und Datenbanken von Schweizer Finanzdienstleistern.

Angebote für Partnerfirmen: Unsere Forschenden entwickeln Methoden und Systeme für das Management und die Analyse von Big Data. Aktuell werden verschiedene Algorithmen für In-Database Machine Learning in SQL implementiert, was für Partner verschiedene Vorteile hat. Diese werden als Software programmiert, bei Partnerfirmen unter reellen Bedingungen getestet und qualitativ oder quantitativ ausgewertet. Die gewonnenen Erkenntnisse erlauben es, Algorithmen laufend zu verbessern und neue Produkte oder Prozesse für Wirtschafts- und Forschungspartner zu entwickeln.

Holen Sie sich einen Bachelor oder Master: Im Master-Lehrgang Applied Information and Data Science lernen Sie das Potenzial von Daten zu verstehen und professionell zu nutzen. Durch den Master of Science in Engineering im Profil Data Science erwerben Sie das Wissen und die Fertigkeiten, wie Daten erfasst, gespeichert und prozessiert werden, um sie in wertvolle Informationen und umsetzbares Wissen zu transformieren. Der Studiengang Bachelor in Artificial Intelligence & Machine Learning ist tief in der Informatik verwurzelt, bietet aber auch eine breite interdisziplinäre Mischung aus angewandten Technologien, betriebswirtschaftlichen Fähigkeiten, Sozialbewusstsein und Projektarbeit. Für den Bachelor in Informatik absolvieren Sie ein vielfältiges Informatik-Studium. Eine ganze Palette an Majors sowie viele wählbare Module eröffnen Ihnen die ganze Welt der Informatik.

Bilden Sie sich weiter: Das MAS Business Intelligence vermittelt Entscheidungsträgerinnen und -trägern das nötige Rüstzeug für datenbasierte Geschäftsentscheide und eindeutig messbare Resultate. Im CAS Business Intelligence & Analytics lernen die Kursteilnehmenden, wie sie kompetent und systematisch mit geschäftsrelevanten Informationen umgehen. Im CAS Big Data Analytics werden die wesentlichen Aspekte von Big Data und Analytics praxisbezogen vermittelt und aus Managementsicht vertieft. Im CAS Digital Analytics in Marketing lernen Sie, Webseiten, Apps und digitale Marketing-Kampagnen Ihres Unternehmens mittels Software zu tracken, die Daten zu analysieren und die daraus gewonnenen Erkenntnisse im Webseiten- und Marketing-Management zielorientiert in Massnahmen umzusetzen.

Gefällt Ihnen unser Informatik-Blog? Hier erhalten Sie Tipps und lesen über Trends aus der Welt der Informatik. Wir bieten Einsichten in unser Departement und Porträts von IT-Vordenkerinnen, Visionären und spannenden Menschen: Abonnieren Sie jetzt unseren Blog!

Kommentare

0 Kommentare

Kommentar verfassen

Danke für Ihren Kommentar, wir prüfen dies gerne.

Pin It on Pinterest