9 Verkiezing Voorspellingen van 15 Maart 2017 op Basis van Google Data
Kan je via Google de verkiezingen voorspellen? Een interessant vraagstuk. Dat zou een behoorlijke gamechanger zijn.
Wat als dat kan op een zeer eenvoudige manier? Niet door ingewikkelde berekeningen, maar door simpelweg enkele termen in te voeren en de uitslag te zien. Dat zou bizar zijn.
Het is Google al eerder gelukt! Bijvoorbeeld bij de Amerikaanse verkiezingen tussen Clinton en Trump volgens Macleans: Google Predicted Donald Trump Would Win The Election.
Wij hebben daarom 9 zeer simpele manieren opgezet om een voorspelling te doen via Google. Na 15 maart kunnen we zien of 1 van deze voorspellingen accuraat is gebleken. Het doel van dit experiment is vooral eenvoud.
Hieronder laten we je de uitslagen zien met een korte samenvatting van de manier waarop die voorspelling tot stand is gekomen. Alle partijen en lijsttrekkers zijn meegenomen, maar wanneer een partij 0 zetels haalt, wordt deze niet weergegeven.
Uiteraard is dit een experiment en zijn er talloze (terechte) opmerkingen te maken over de onderzoeksopzet. We hebben bijvoorbeeld geen rekening gehouden met het feit of het zoekvolume een positieve of negatieve indicatie geeft over een partij of lijsttrekker. We hebben bewust gekozen voor eenvoud boven ingewikkelde formules.
Let op: Dit artikel is geschreven voor het conflict met Turkije.
[update 16-3-2017 naar aanleiding van de daadwerkelijke uitslag onderdaan de pagina]
Voorspelling op Basis van Zoekvolumes
Hieronder staat de voorspelde zetelverdeling* via de volgende formule:
- Tel het zoekvolume van de naam van de partij + de naam van de lijsttrekker bij elkaar op.
- Tel vervolgens het zoekvolume van alle partijen bij elkaar op om het totale volume te krijgen.
- Deel dit aantal door 150 zetels en je weet hoeveel zoekvolume er per zetel nodig is.
- Deel het totale zoekvolume van de partij door het zoekvolume wat nodig is per zetel en voilĂ . Het aantal zetels per partij staat er.
*De zoekvolumes zijn zaterdag 11 maart bekeken en door Google voorspeld voor de week erop.
Hieronder de uitslag:
Partijnaam | Exact Match | Phrase Match | Broad Match |
VVD | 47 | 54 | 13 |
GroenLinks | 36 | 26 | 9 |
D66 | 24 | 29 | 5 |
PvdA | 13 | 7 | 8 |
SP | 8 | 7 | 7 |
PVV | 7 | 7 | 27 |
CDA | 6 | 10 | 14 |
Partij voor de Dieren | 3 | 2 | 3 |
ChristenUnie | 2 | 2 | |
50 Plus | 2 | 4 | 3 |
SGP | 1 | 3 | |
Denk | 10 | ||
VNL | |||
Piratenpartij | 4 | ||
FvD | 7 | ||
Artikel 1 | 24 | ||
Geenpeil | 4 |
Exact Match Zoekvolumes
We hebben alle zoekopdrachten op namen van de partijen of lijsttrekkers meegenomen. Denk bijvoorbeeld aan: SP, Socialistische Partij, Emile Roemer, Roemer.
Een zoekopdracht als SP standpunten of SP poster wordt niet meegenomen.
Phrase Match Zoekvolumes
Iedereen die op de namen van de partijen of lijsttrekkers Googelt, telt mee. Dat is inclusief woorden die ervoor of erachter worden getypt.
Bijvoorbeeld: VVD, Volksvrijheid voor Democratie en Mark Rutte. Een zoekopdracht als VVD standpunten of VVD poster wordt wel meegenomen.
Broad Match Zoekvolumes
Iedereen die op de namen van de partijen of lijsttrekkers Googelt, telt mee. Dat is inclusief woorden die ervoor of erachter worden getypt, synoniemen of woorden die erop lijken.
Bijvoorbeeld: PVV, Partij voor de Vrijheid, Geert Wilders en Wilders. Een zoekopdracht als PVV standpunten of PVV poster wordt wel meegenomen. Maar de kans is aanwezig dat zoekopdrachten naar de nummer 2, 3 of verder op de lijst ook worden meegenomen. Het is zeer lastig in te zien welke zoekopdrachten hier wel of niet onder vallen.
Voor deze data hebben we het gemiddelde van de afgelopen 12 maanden genomen.
Broad Match Zoekvolumes Bestaande Partijen
Daarnaast hebben we nog 1 voorspelling gedaan op basis van de brede zoekvolumes met daarbij alleen de bestaande partijen.
Partijnaam | Aantal zetels |
PVV | 43 |
CDA | 23 |
VVD | 20 |
GroenLinks | 15 |
PvdA | 12 |
SP | 11 |
D66 | 9 |
Partij voor de Dieren | 5 |
50 Plus | 4 |
SGP | 4 |
ChristenUnie | 3 |
Standpunten Zoekvolumes
We vonden het zelf een interessant vraagstuk of je op basis van het aantal mensen wat googelt op het woord standpunten een voorspelling kan doen. Daarom hebben we de partijnaam + het woord standpunten voor iedere partij ingevoerd. Het totale zoekvolume van alle resultaten hebben we opgeteld en gedeeld door 150 zetels.
Vervolgens hebben we per partij het totale zoekvolume gedeeld door het zoekvolume wat nodig is voor 1 zetel. Zo konden we de totale zetelverdeling in kaart brengen.
Deze data is gebaseerd op de afgelopen 12 maanden via een broad match. Daarnaast staat de broad match data gebaseerd op de dataset van alleen de maand januari. Afsluitend staat de data gebaseerd op een phrase match, die is voorspeld op de komende week.
Hieronder het aantal zetels per partij.
Partijnaam | 12 Maanden (Broad) | Januari (Broad) | Phrase Match |
PVV | 35 | 14 | 1 |
D66 | 23 | 33 | 8 |
VVD | 19 | 18 | 91 |
PvdA | 15 | 18 | 9 |
CDA | 13 | 14 | 24 |
SP | 13 | 14 | 2 |
GroenLinks | 11 | 18 | 11 |
SGP | 7 | 8 | 0 |
ChristenUnie | 5 | 4 | 0 |
Denk | 4 | 2 | 0 |
PvdD | 3 | 4 | 4 |
VNL | 1 | 1 | 0 |
Piratenpartij | 1 | 1 | 0 |
50 Plus | 1 | 1 | 0 |
FvD | 0 | 1 | 0 |
Google Trends
Naast de zoekvolumes biedt Google ook de mogelijkheid om Google trends in te zien. Wat in ieder geval opvalt: onze berekeningen komen helemaal niet overeen met de trends die Google zelf toont (Google trends over de verkiezingen). Dit terwijl de data uit dezelfde datasets voortkomen.
We gaan ervan uit dat Google op een veel complexere en veel preciezere manier de data verzamelt, combineert en weergeeft.
Partijnaam
We hebben gekeken naar de zetelverdeling wanneer er wordt gekeken naar de positie in Google trends op 11 maart. Iedere partij krijgt een aantal punten vanuit Google. Deze hebben we opgeteld en gedeeld door 150 zetels.
Vervolgens zijn de punten per partij gedeeld door het aantal punten dat nodig is per zetel. Daarmee houd je het aantal zetels per partij over.
Bij de partijnaam is gekeken naar de meest ingevoerde term, de afkorting of de volledig uitgeschreven versie. Bijvoorbeeld: PVDD of Partij voor de Dieren.
De partij met de sterkste trend is het CDA, deze partij is genomen als ijkpunt.
Hieronder de uitslag:
Partijnaam | Aantal zetels |
CDA | 27 |
D66 | 26 |
VVD | 20 |
GroenLinks | 20 |
PVV | 16 |
PvdA | 12 |
Piratenpartij | 9 |
SGP | 6 |
Partij voor de Dieren | 5 |
ChristenUnie | 5 |
Voor Nederland | 4 |
Geenpeil | 1 |
50Plus | 1 |
Lijsttrekker
Hieronder dezelfde verdeling, maar dan op basis van de zoektrend op de naam van de lijsttrekker. Hierbij is de meest populaire naam gebruikt en namen die te algemeen zijn zoals Klein hebben we uitgesloten.
De lijsttrekker met de sterkste trend is Wilders. Deze is in alle trends gebuikt als ijkpunt.
Partijnaam | Aantal zetels |
Wilders (PVV) | 38 |
Rutte (VVD) | 17 |
Baudet (Forum voor Democratie) | 17 |
Klaver (GroenLinks) | 16 |
Ancilla (Piratenpartij) | 13 |
Kuzu (DENK) | 5 |
Buma (CDA) | 8 |
Pechtold (D66) | 7 |
Simons (Artikel 1) | 5 |
Thieme (Partij voor de Dieren) | 4 |
Jan Roos (VNL) | 4 |
Asscher (PvdA) | 4 |
Roemer (SP) | 4 |
Krol (50 Plus) | 2 |
van der Staaij (SGP) | 2 |
Segers (ChristenUnie) | 2 |
Dijkgraaf (Geenpeil) | 1 |
Conclusie
Of we echt de verkiezingen kunnen voorspellen zal 16 maart blijken. We zullen hieronder de uitslagen vergelijken met de daadwerkelijke uitslag.
Laten we eerlijk zijn: we verwachten het niet. Dit experiment is meer voor de lol, maar toch. Je weet maar nooit…
[Update 16-3-2017 10:30]
De conclusie is helder. Ons experiment is jammerlijk mislukt. Zo erg zelfs dat het posten van de resultaten hier weinig toevoegt.
Alle voorspellingen zaten er tientallen zetels naast. Niet echt accuraat te noemen.
Het was een leuk experiment. Jammer dat het niet gelukt is.
Tijdens de volgende verkiezingen of voorspellingen gaan we er meer energie insteken.
Dat betekend dat de formule(s) ingewikkelder zullen worden, maar hopelijk daarmee de uitslag beter kloppend.
Wat we precies willen voorspellen staat nog niet vast.