Regelmatig zullen we de komende weken de resultaten van nieuwe peilingen zien. Een advies vooraf: raak niet in extase of paniek. Een peiling staat ook maar op zich, en er zijn verschillende redenen waarom alle peilingen (en dat zijn er in de VS nogal wat) verschillende resultaten laten zien.
In de eerste plaats gaat het om een steekproef. Er wordt maar een klein gedeelte van de kiezers benaderd, dus de uitkomst is maar een schatting. De steekproefomvang is meestal klein, dus de zogenaamde
margin for error
is groot. Bovendien zitten we nog ver van de verkiezingsdatum (8 november), en kan er in de tussentijd nog van alles gebeuren.
Daarnaast speelt de geografische spreiding. Betreft het een peiling voor een specifieke staat (liefst nog een
swing state
, daarover later meer), dan zegt de uitkomst iets over die staat alleen. Dat lijkt een inkopper, maar zo moeten we wel naar de voorspellingen van de
popular vote
kijken. Vanwege het Amerikaanse kiessysteem (per staat en meestal
winner-takes-all
), moeten we ook naar de resultaten per staat kijken en is de verdeling van alle stemmen minder relevant. Bush won in 2004 terwijl de meeste stemmen naar zijn tegenstander gingen.
De meeste staten hebben een duidelijke meerderheid Democraten of Republikeinen. Ik durf er mijn hemd om te verwedden dat Hawaii en Maryland Democratisch zullen stemmen en Wyoming en Alabama Republikeins. De resultaten liggen in deze staten vrijwel vast, en vanwege het feit dat alle kiesmannen toegewezen worden aan degene die de meerderheid krijgt, zullen kleine verschuivingen in de verdeling geen invloed hebben op de einduitkomst. Alle aandacht gaat uit naar de staten waar de verdeling ongeveer 50/50 is, en ik zal me in het vervolg ook specifiek richten op peilingen in deze zogenaamde
swing states
: Florida, Pennsylvania, Michigan, Ohio, North Carolina, Colorado, Virginia, Wisconsin, Minnesota, Nevada.
Dan het moeilijkste punt: de methodologie van de opiniepeilers. Gaat het om een persoonlijk telefonisch onderzoek of om een geautomatiseerde call (de
robocall
)? Wordt er alleen naar vaste telefoons gebeld of ook naar mobiele? Worden gegevens verzameld via het internet, en is de deelname gevraagd of vrijwillig? Als er vervolgonderzoek wordt gedaan, worden dan dezelfde personen ondervraagd of een nieuwe aselecte groep? Hoe zijn de verschillende demografieën in de steekproef vertegenwoordigd, en hoe wordt hiervoor gecorrigeerd in de predictie?
En tot slot: hoe kunnen we door middel van al deze individuele voorspellingen een totaalbeeld krijgen? Er zijn twee uitstekende sites die een gecombineerd model maken op basis van de individuele peilingen. De New York Times publiceert dagelijks voorspellingen in de sectie The Upshot. En oud-NYT medewerker Nate Silver is zijn
eigen website
begonnen, waar mooie interactieve grafieken zijn te zien, begeleid door de brongegevens, een gedegen uitleg over de aanpak en moeilijkheden, en discussies. Je zou verwachten dat deze twee superpeilingen dicht bij elkaar zouden staan, maar zelfs dat is niet het geval, wat maar aangeeft hoe moeilijk het is om uit al deze data een goede voorspelling te genereren.
Wat beide sites wel laten zien is hoe het sentiment door de tijd heen verandert. We zien in juni de effecten van het FBI-onderzoek op Clintons e-mails, de conventies en de reactie van Trump op Khizr Khan, het luwen van de conventie-euforie, en we gaan nu met spanning kijken naar het komende debat op 26 september en de invloed daarvan op de peilingen – maar dus het liefst via de twee superpeilers.