9 Verkiezing Voorspellingen van 15 Maart 2017 op Basis van Google Data

by Bart van der Meer maart 13, 2017

Kan je via Google de verkiezingen voorspellen? Een interessant vraagstuk. Dat zou een behoorlijke gamechanger zijn.

Wat als dat kan op een zeer eenvoudige manier? Niet door ingewikkelde berekeningen, maar door simpelweg enkele termen in te voeren en de uitslag te zien. Dat zou bizar zijn.

Het is Google al eerder gelukt! Bijvoorbeeld bij de Amerikaanse verkiezingen tussen Clinton en Trump volgens Macleans: Google Predicted Donald Trump Would Win The Election.

Wij hebben daarom 9 zeer simpele manieren opgezet om een voorspelling te doen via Google. Na 15 maart kunnen we zien of 1 van deze voorspellingen accuraat is gebleken. Het doel van dit experiment is vooral eenvoud.

Hieronder laten we je de uitslagen zien met een korte samenvatting van de manier waarop die voorspelling tot stand is gekomen. Alle partijen en lijsttrekkers zijn meegenomen, maar wanneer een partij 0 zetels haalt, wordt deze niet weergegeven.

Uiteraard is dit een experiment en zijn er talloze (terechte) opmerkingen te maken over de onderzoeksopzet. We hebben bijvoorbeeld geen rekening gehouden met het feit of het zoekvolume een positieve of negatieve indicatie geeft over een partij of lijsttrekker. We hebben bewust gekozen voor eenvoud boven ingewikkelde formules.

Let op: Dit artikel is geschreven voor het conflict met Turkije.

[update 16-3-2017 naar aanleiding van de daadwerkelijke uitslag onderdaan de pagina]

Voorspelling op Basis van Zoekvolumes

Hieronder staat de voorspelde zetelverdeling* via de volgende formule:

  • Tel het zoekvolume van de naam van de partij + de naam van de lijsttrekker bij elkaar op.
  • Tel vervolgens het zoekvolume van alle partijen bij elkaar op om het totale volume te krijgen.
  • Deel dit aantal door 150 zetels en je weet hoeveel zoekvolume er per zetel nodig is.
  • Deel het totale zoekvolume van de partij door het zoekvolume wat nodig is per zetel en voilĂ . Het aantal zetels per partij staat er.

*De zoekvolumes zijn zaterdag 11 maart bekeken en door Google voorspeld voor de week erop.

Hieronder de uitslag:

PartijnaamExact MatchPhrase MatchBroad Match
VVD475413
GroenLinks36269
D6624295
PvdA1378
SP877
PVV7727
CDA61014
Partij voor de Dieren323
ChristenUnie22
50 Plus243
SGP13
Denk10
VNL
Piratenpartij4
FvD7
Artikel 124
Geenpeil4

Exact Match Zoekvolumes

We hebben alle zoekopdrachten op namen van de partijen of lijsttrekkers meegenomen. Denk bijvoorbeeld aan: SP, Socialistische Partij, Emile Roemer, Roemer.

Een zoekopdracht als SP standpunten of SP poster wordt niet meegenomen.

Phrase Match Zoekvolumes

Iedereen die op de namen van de partijen of lijsttrekkers Googelt, telt mee. Dat is inclusief woorden die ervoor of erachter worden getypt.

Bijvoorbeeld: VVD, Volksvrijheid voor Democratie en Mark Rutte. Een zoekopdracht als VVD standpunten of VVD poster wordt wel meegenomen.

Broad Match Zoekvolumes

Iedereen die op de namen van de partijen of lijsttrekkers Googelt, telt mee. Dat is inclusief woorden die ervoor of erachter worden getypt, synoniemen of woorden die erop lijken.

Bijvoorbeeld: PVV, Partij voor de Vrijheid, Geert Wilders en Wilders. Een zoekopdracht als PVV standpunten of PVV poster wordt wel meegenomen. Maar de kans is aanwezig dat zoekopdrachten naar de nummer 2, 3 of verder op de lijst ook worden meegenomen. Het is zeer lastig in te zien welke zoekopdrachten hier wel of niet onder vallen.

Voor deze data hebben we het gemiddelde van de afgelopen 12 maanden genomen.

Broad Match Zoekvolumes Bestaande Partijen

Daarnaast hebben we nog 1 voorspelling gedaan op basis van de brede zoekvolumes met daarbij alleen de bestaande partijen.

PartijnaamAantal zetels
PVV43
CDA23
VVD20
GroenLinks15
PvdA12
SP11
D669
Partij voor de Dieren5
50 Plus4
SGP4
ChristenUnie3

Standpunten Zoekvolumes

We vonden het zelf een interessant vraagstuk of je op basis van het aantal mensen wat googelt op het woord standpunten een voorspelling kan doen. Daarom hebben we de partijnaam + het woord standpunten voor iedere partij ingevoerd. Het totale zoekvolume van alle resultaten hebben we opgeteld en gedeeld door 150 zetels.

Vervolgens hebben we per partij het totale zoekvolume gedeeld door het zoekvolume wat nodig is voor 1 zetel. Zo konden we de totale zetelverdeling in kaart brengen.

Deze data is gebaseerd op de afgelopen 12 maanden via een broad match. Daarnaast staat de broad match data gebaseerd op de dataset van alleen de maand januari. Afsluitend staat de data gebaseerd op een phrase match, die is voorspeld op de komende week.

Hieronder het aantal zetels per partij.

Partijnaam12 Maanden (Broad)Januari (Broad)Phrase Match
PVV35141
D6623338
VVD191891
PvdA15189
CDA131424
SP13142
GroenLinks111811
SGP780
ChristenUnie540
Denk420
PvdD344
VNL110
Piratenpartij110
50 Plus110
FvD010

Google Trends

Naast de zoekvolumes biedt Google ook de mogelijkheid om Google trends in te zien. Wat in ieder geval opvalt: onze berekeningen komen helemaal niet overeen met de trends die Google zelf toont (Google trends over de verkiezingen). Dit terwijl de data uit dezelfde datasets voortkomen.

We gaan ervan uit dat Google op een veel complexere en veel preciezere manier de data verzamelt, combineert en weergeeft.

Partijnaam

We hebben gekeken naar de zetelverdeling wanneer er wordt gekeken naar de positie in Google trends op 11 maart. Iedere partij krijgt een aantal punten vanuit Google. Deze hebben we opgeteld en gedeeld door 150 zetels.

Vervolgens zijn de punten per partij gedeeld door het aantal punten dat nodig is per zetel. Daarmee houd je het aantal zetels per partij over.

Bij de partijnaam is gekeken naar de meest ingevoerde term, de afkorting of de volledig uitgeschreven versie. Bijvoorbeeld: PVDD of Partij voor de Dieren.

De partij met de sterkste trend is het CDA, deze partij is genomen als ijkpunt.

Hieronder de uitslag:

PartijnaamAantal zetels
CDA27
D6626
VVD20
GroenLinks20
PVV16
PvdA12
Piratenpartij9
SGP6
Partij voor de Dieren5
ChristenUnie5
Voor Nederland4
Geenpeil1
50Plus1

Lijsttrekker

Hieronder dezelfde verdeling, maar dan op basis van de zoektrend op de naam van de lijsttrekker. Hierbij is de meest populaire naam gebruikt en namen die te algemeen zijn zoals Klein hebben we uitgesloten.

De lijsttrekker met de sterkste trend is Wilders. Deze is in alle trends gebuikt als ijkpunt.

PartijnaamAantal zetels
Wilders (PVV)38
Rutte (VVD)17
Baudet (Forum voor Democratie)17
Klaver (GroenLinks)16
Ancilla (Piratenpartij)13
Kuzu (DENK)5
Buma (CDA)8
Pechtold (D66)7
Simons (Artikel 1)5
Thieme (Partij voor de Dieren)4
Jan Roos (VNL)4
Asscher (PvdA)4
Roemer (SP)4
Krol (50 Plus)2
van der Staaij (SGP)2
Segers (ChristenUnie)2
Dijkgraaf (Geenpeil)1

Conclusie

Of we echt de verkiezingen kunnen voorspellen zal 16 maart blijken. We zullen hieronder de uitslagen vergelijken met de daadwerkelijke uitslag.

Laten we eerlijk zijn: we verwachten het niet. Dit experiment is meer voor de lol, maar toch. Je weet maar nooit…

[Update 16-3-2017 10:30]

De conclusie is helder. Ons experiment is jammerlijk mislukt. Zo erg zelfs dat het posten van de resultaten hier weinig toevoegt.

Alle voorspellingen zaten er tientallen zetels naast. Niet echt accuraat te noemen.

Het was een leuk experiment. Jammer dat het niet gelukt is.

Tijdens de volgende verkiezingen of voorspellingen gaan we er meer energie insteken.

Dat betekend dat de formule(s) ingewikkelder zullen worden, maar hopelijk daarmee de uitslag beter kloppend.

Wat we precies willen voorspellen staat nog niet vast.

Social Shares

Leave a Comment

Your email address will not be published. Required fields are marked *