Zijn onderzoeksbureaus de dataleveranciers van het AI-tijdperk?

AI-systemen hebben een honger naar betrouwbare menselijke data die voorlopig niet lijkt te worden gestild. Grote taalmodellen worden getraind op tekst, maar voor nauwkeurige, diverse en gevalideerde menselijke input zijn ze afhankelijk van een andere bron: de onderzoekssector. Die sector bezit precies wat AI-ontwikkelaars zoeken. Of ze die positie ook weten te benutten, wordt de komende jaren duidelijk.

Wat AI nodig heeft

De markt voor AI-trainingsdata werd in 2025 gewaardeerd op 3,2 miljard dollar en groeit naar verwachting naar 16,3 miljard dollar in 2033. Die groei wordt niet alleen gedreven door generatieve AI. De volgende generatie AI-systemen bestaat uit zogenoemde agenten: systemen die zelfstandig beslissingen nemen, acties uitvoeren en zich aanpassen op basis van nieuwe informatie. Naast historische trainingsdata hebben zij een continue stroom van accurate, contextuele menselijke data nodig.

Synthetische data biedt daarvoor onvoldoende houvast. Onderzoek laat zien dat AI-systemen die sterk leunen op synthetische data na verloop van tijd minder goed kunnen aansluiten op menselijk gedrag en menselijke voorkeuren. Echte menselijke data blijft daarom een belangrijk anker.

De troef van de onderzoekssector

Onderzoeksbureaus doen al decennia exact wat AI-ontwikkelaars nu urgent nodig hebben. Ze verzamelen data op gecontroleerde wijze, met toestemming, transparant gedocumenteerd en methodologisch gevalideerd. Voor die combinatie van kwaliteit, herkomst en toestemming duikt steeds vaker de term verified human data op.

Grote bedrijven als Kantar, Ipsos, YouGov en Cint investeren ondertussen in platformen, panels en datakwaliteit die op grotere schaal inzetbaar zijn dan traditionele onderzoeksprojecten alleen. Daarmee bouwen zij aan infrastructuur die mogelijk ook buiten het klassieke onderzoek steeds waardevoller wordt.

Van inzicht naar infrastructuur

Het gaat hier om meer dan een geleidelijke aanpassing. Een onderzoeksbureau dat vandaag een rapport levert aan een opdrachtgever, verkoopt een eindproduct. Een bureau dat zijn paneldata, toestemmingsarchitectuur en methodologische kwaliteitscontroles beschikbaar maakt als datalaag voor AI-systemen, verkoopt infrastructuur. Dat zijn verschillende verdienmodellen, met verschillende waarderingen op de markt.

De EU AI Act kan die positie verder versterken. Vanaf 2 augustus 2026 geldt het volledige compliance-framework voor hoog-risico AI-systemen. Dat vereist onder meer dat trainingsdata een gedocumenteerde herkomst heeft, representatief is en vrij is van systematische fouten. Bureaus die al jaren werken met opt-in panels, gedocumenteerde steekproefmethoden en transparante dataverzameling beschikken daardoor over een uitgangspositie die moeilijker te evenaren is voor webscrapers en aanbieders van synthetische data.

De kans en de uitdaging

De positie is er. De infrastructuur om er gebruik van te maken, is dat vaak nog niet. Data die nu is verspreid over projectarchieven, CRM-systemen en losse paneldatabases, is niet direct toegankelijk voor AI-ontwikkelaars die op API-snelheid werken. Bureaus die hun data willen positioneren als infrastructuur, moeten investeren in toegankelijkheid, documentatie en integratie.

Daarbij speelt ook de vraag over eigenaarschap. Paneldata is verzameld met toestemming van respondenten voor specifieke doeleinden. Het hergebruik van die data voor AI-training vereist een zorgvuldige juridische en ethische afweging, zeker onder de AVG.

Voor onderzoeksbureaus in Nederland en de Benelux ligt hier desondanks een reële kans. Ze hoeven niet te concurreren met de techbedrijven die AI bouwen. Ze kunnen leveren wat AI-bedrijven zelf moeilijk kunnen produceren: betrouwbare, gevalideerde en goed gedocumenteerde menselijke data. Inclusief de toestemming en documentatie die Europese regelgeving steeds nadrukkelijker vraagt.