De Insights Association, de Amerikaanse branchevereniging voor marktonderzoek en data-analyse, publiceerde richtlijnen voor het gebruik van synthetische data en synthetische respondenten binnen haar bestaande gedragscode. Daarmee erkent de organisatie dat een technologie die enkele jaren geleden nog experimenteel was, inmiddels zo serieus wordt genomen dat bestaande beroepsregels opnieuw tegen het licht moeten worden gehouden.
▼
De belangrijkste les zit niet in de richtlijnen zelf, maar in wat ze blootleggen. Synthetische respondenten en AI-gegenereerde datasets vinden steeds vaker hun weg naar onderzoek en analyses. Tegelijkertijd zijn veel praktische, ethische en methodologische vragen nog volop onderwerp van discussie. De technologie ontwikkelt zich sneller dan de afspraken eromheen.
Welke toestemming geldt voor synthetische modellen?
Een van de vragen die de Insights Association aansnijdt, gaat over de herkomst van de data waarop synthetische modellen worden gebouwd. Die modellen worden doorgaans getraind op gegevens die oorspronkelijk voor een ander doel zijn verzameld. De mensen achter die data wisten vaak niet dat hun antwoorden later zouden worden gebruikt om gedrag, voorkeuren of meningen te simuleren.
Voor de markt leidt dat tot een belangrijke vraag: op welke data zijn de synthetische modellen die wij gebruiken of inkopen eigenlijk gebaseerd, en is die data ook voor dat doel verkregen? Naarmate synthetische toepassingen vaker worden ingezet, wordt die vraag relevanter voor onderzoekers, opdrachtgevers en leveranciers.
Synthetisch betekent niet automatisch risicoloos
De richtlijnen maken ook duidelijk dat synthetische data niet automatisch vrij zijn van privacy- of ethische risico's. Hoewel een synthetische respondent geen echt persoon is, worden de onderliggende modellen wel gevoed met bestaande datasets. Vooroordelen, onnauwkeurigheden of gevoelige patronen uit die data kunnen daardoor worden overgenomen en versterkt. Daarmee verschuift de discussie van de technologie zelf naar de kwaliteit van de data waarop die technologie is gebouwd. Een synthetisch model is uiteindelijk niet beter dan de gegevens waarmee het is getraind.
Transparantie wordt belangrijker
Marktonderzoek en data-analyse zijn afhankelijk van vertrouwen. De Insights Association waarschuwt dat dit vertrouwen onder druk kan komen te staan wanneer opdrachtgevers of respondenten niet weten hoe inzichten tot stand zijn gekomen. Daarom pleit de organisatie voor meer transparantie. Onderzoekers zouden duidelijk moeten aangeven of bevindingen afkomstig zijn van menselijke respondenten, synthetische respondenten of een combinatie van beide. Niet als detail in de kleine lettertjes, maar als vast onderdeel van de methodebeschrijving.
De richtlijnen bieden geen definitief antwoord op alle vragen rond synthetische data. Ze maken wel duidelijk dat de sector een nieuwe fase ingaat. De discussie verschuift van wat technisch mogelijk is naar wat verantwoord, uitlegbaar en betrouwbaar genoeg is om in de praktijk te gebruiken.
Meer leren over onderzoeksmethoden, datakwaliteit en de impact van AI op onderzoek? Bekijk het opleidingsaanbod van D&IN Academy, waaronder trainingen op het gebied van marktonderzoek, data-analyse en rapportage.