Grosse KI Sprachmodelle, sogenannte Large Language Models (LLMs) und synthetische Daten versprechen neue Wege für die Marktforschung. Doch wie effektiv sind LLMs wirklich? Ein Roundtable beleuchtet Chancen, Grenzen und konkrete Anwendungsfälle – von Ad-Optimierung bis zu künstlich erzeugten Personas.
Grosse KI Sprachmodelle, sogenannte Large Language Models (LLMs) simulieren menschliche Antworten auf Umfragefragen, Social Media Beiträge, semi-strukturierten Interviews oder imitieren Fokusgruppengespräche. Diese Daten sind künstlich erzeugt, sogenannte synthetische Daten. Einer ihrer Hauptvorteile ist die Möglichkeit in silico Stichproben, also synthetische Stichproben, zu einem Bruchteil der Kosten und viel schneller als bei der Durchführung von Umfragen und Interviews zu generieren.
In der Lucerne AI Community (LAC) diskutierten Expert:innen den Einsatz von LLMs um synthetischen Daten zu generieren. Die Ergebnisse zeigen: Es gibt spannende Ansätze, aber auch klare Grenzen.
Synthetische Daten kommen in vielen Bereichen zum Einsatz:
Erfolgreiche Projekte verbessern oft Prozesse. Ein Beispiel: Ein einfacher Konfigurator für ein Sportprodukte steigerte den Umsatz um bis zu 7 %. Der LLM-basierte Konfigurator übernahm die Ideenfindung, doch die Entscheidung lag beim Menschen.
Misserfolge – etwa schwache synthetische Personas – werden seltener geteilt. Ein Supermarkt konnte trotz grosser Datenmengen keine brauchbaren Personas erzeugen. Auch Prognosen scheiterten, weil die Daten zu verschieden waren.
Geringfügige Änderungen an der Prompt-Formulierung, die für den Menschen nahezu irrelevant sind, führen zu sehr unterschiedlichen LLM-Ergebnissen. Diese „Prompt-Brittleness“ erschwert die Arbeit und führt zu Fragen der Qualität und Validität von synthetischen Daten.
Eine weitere Herausforderung ist die Investitionsbereitschaft von Akteuren, um Probleme zu lösen, wie das Beispiel von gefälschtem Wein zeigt. Weder Produzenten noch Konsumenten sind gewillt die Kosten einer Authentifizierungslösung zu tragen, die die Zusammensetzung und Herkunft des verkauften Weins festzustellt, obschon sich beide Parteien einig sind, dass das Problem dringlich ist.
Die Teilnehmenden fordern Qualitätskontrollen auf allen Ebenen – nicht nur am Ende. Diese finden aktuell stichprobenartig und auf unterschiedliche Art und Weise statt. Die Übertragung von Testkonzepte aus der Softwareentwicklung wie z.B. Unit-, Integrations-, Akzeptanztests bieten nützliche und vielversprechende Ansatzpunkte. Zertifizierungen und Benchmarks wurden kritisch diskutiert. Die zentrale Frage bleibt: Wer setzt die Standards?
LLMs und synthetische Daten bieten grosses Potenzial für die Marktforschung aber auch andere Anwendungsfelder. Der Nutzen ist aktuell jedoch schwierig zu bewerten da strukturierte, einheitliche Qualitätsbewertungen fehlen.
Kontaktieren Sie uns für einen unverbindlichen Austausch oder eine Beratung zur Qualitätsbewertung von synthetischen Daten.


Researcher & Lecturer, Co-Head ad interim Applied AI Research Lab
Kommentare
0 Kommentare
Danke für Ihren Kommentar, wir prüfen dies gerne.