Die Swiss Conference on Data Science (SDS) bringt Führungskräfte und Experten aus Wissenschaft und Wirtschaft zusammen, um Ideen auszutauschen und Innovationen bei Produkten und Dienstleistungen voranzutreiben. Auch in diesem Jahr werden wieder Forschungsbeiträge aus dem IKM an der Konferenz präsentiert.
An der Swiss Data Science darf ich meine Forschung zu Polarisierung vorstellen. Polarisierung ist ein zweischneidiges Schwert. Einerseits werden polarisierende Inhalte mehr angeklickt und dessen Bedeutung wird als wichtiger eingeschätzt. Andererseits können polarisierende Inhalte der Kundenbeziehung schaden oder gar einen sogenannten «Shit-Storm» auslösen. Polarisierung beinhaltet einen emotionalen und inhaltlichen Aspekt. Letzterer wurde in 2’337 online Artikeln mit der Methode Topic Modelling untersucht. Die online Artikel wurden gesammelt, wenn einer der vier Markennamen SRF, Weltwoche, Aargauer Zeitung oder Tages-Anzeiger darin erwähnt wurde. Die ersten beiden Marken polarisieren eher, die anderen nicht.
Die Resultate zeigen, dass Polarisierung mit Topic Modelling gemessen werden kann. Wörter, die sich auf die beiden polarisierenden Marken beziehen, sind auf der Themenmodell wie auch der Themencluster Ebene zu finden. Bei den nicht polarisierenden Marken ist dies nicht der Fall. Polarisierende Themen beziehen sich auf a) SRF, b) Facebook und Instagram und c) Putin, Russen und Sotschi.
Dieses Jahr freue ich mich auf die Präsentationen zu den verschiedenen Anwendungsbeispielen von Large Language Modells (LLMs) sowie deren Qualitätsmessung. Auch freue ich mich alte Bekannte zu sehen und neue Personen kennen zu lernen.
Twitch ist derzeit die führende Streaming-Plattform mit einer umfangreichen Bibliothek an Inhalten und einer großen Nutzerbasis aus Streamern und Zuschauern. Angesichts dessen kann die Suche nach Inhalten oder Künstlern, denen man folgen möchte, eine Herausforderung sein. Empfehlungssysteme spielen eine entscheidende Rolle bei der Erleichterung dieser Erkundung. In dieser Studie, welche in Zusammenarbeit mit Jean Pool Pereyra und Sandro Hernández von der Universität Bern entstanden ist, haben wir ein Empfehlungssystem namens TWITCHCOMM entwickelt, das neue Nutzer mit ähnlichen Interessen vorschlagen soll. Die Daten, die zum Training des Empfehlungssystems verwendet wurden, stammen von SNAP. Unser Algorithmus verwendet einen topologischen Ansatz, der auf Verknüpfungen, insbesondere auf gegenseitigen Beziehungen, zwischen Knoten (Benutzern) basiert, um Gemeinschaften innerhalb des Datensatzes zu identifizieren. Je nachdem, ob ein Benutzer Teil des Datensatzes oder eine externe Entität ist, wird anschließend eine Liste von Empfehlungen innerhalb seiner Gemeinschaft erstellt, wobei entweder ein Link-Vorhersagealgorithmus oder ein Popularitätsalgorithmus verwendet wird. Dieser Empfehlungsalgorithmus ist in eine Anwendungsarchitektur integriert, die durch einfache Abfrage des Benutzernamens eines Twitch-Kontos effizient Empfehlungen liefert.
In diesem Jahr bin ich daran interessiert, führende Forscher, Branchenexperten und andere Datenbegeisterte zu treffen. Außerdem möchte ich an Präsentationen zu Forschungsarbeiten, Workshops und Gelegenheiten zum Netzwerken und Ideenaustausch teilnehmen.
Der diesjährige Beitrag für die Swiss Data Science 2024 von Guang Lu, Dominik Georgi und mir behandelt das Problem, dass es in Peer-to-Peer-Sharingplattformen mit heterogenem Produktangebot schwierig ist, eine zuverlässige Vorhersage zu machen, wann welche Produktekategorien nachgefragt werden. Solche Forecasts wären jedoch essenziell, um Nachfrage sowie Angebot zu aktivieren oder um relevante Marketingaktivitäten zu gestalten. So ist es durch die grosse Anzahl an unterschiedlichen Produktgruppen und deren individuellen Nachfragetreibern (wie Saisonalitäten, Wetter, …) als auch der (an den Peer / Plattform-User) outgesourcten Abhängigkeit von sowohl Nachfrage wie auch Angebot schwierig für klassische Forecasting-Algorithmen, brauchbare Resultate zu liefern. Um diesen Aspekten Rechnung zu tragen, haben wir Graph neuronale Netzwerke aus den Disziplinen der Traffic Prediction wie auch der Next-Basket-Prediction verwendet. Wir zeigen dabei, dass sich der Einsatz dieser domänenübergreifenden Methoden lohnt, da beide Ansätze fähig sind, gewisse Marktdynamiken einzufangen und so brauchbare Resultate zu liefern.
Ich freue mich darauf, den Kolleginnen und Kollegen unsere Arbeit vorzustellen und mein Netzwerk für künftige Forschungen und Kooperationen zu erweitern.
Ich freue mich dabei auf die SDS 2024, nicht nur unsere Resultate zu präsentieren und spannende Diskussionen zu haben, sondern bin auch gespannt, an welchen Problemen die Community an diesem Jahr gearbeitet hat.
Hier berichten die IKM-Forschenden über ihre Highlights der Swiss Conference on Data Science (SDS).
Kommentare
0 Kommentare
Danke für Ihren Kommentar, wir prüfen dies gerne.