Nella rete dei sondaggi.

Nella scena politica italiana, da alcuni anni a questa parte, si è imposta nei media l’abitudine a “tastare il polso dell’elettorato” attraverso sondaggi di opinione. Dalla caduta del fascismo ad oggi si è sempre sentito il peso dei sondaggi (che Lilli Gruber ha sagacemente definito “la prosecuzione della politica con altri mezzi”¹), eppure da alcuni mesi a questa parte l’attenzione alle rilevazioni dei sondaggi ha raggiunto il parossismo.

C’è forse una duplice motivazione per tale fenomeno. Una può essere il fatto che negli anni precedenti Mani Pulite, i governi crollavano con una certa facilità, spesso si andava al voto anticipato e quindi l’arco di tempo tra un’elezione e l’altra era troppo breve per elaborare sondaggi solidi.

L’altra causa risiede forse nella questione che i sondaggi, per una serie di ragioni di cui si parlerà oltre, davano una visione molto falsata del panorama politico, una visione secondo la quale la Democrazia Cristiana era sempre in svantaggio rispetto al PCI, mentre alle urne vinceva quasi tutte le tornate.

La diffidenza verso i sondaggi dovrebbe sempre essere mantenuta, se non altro perché essi soffrono di alcuni punti deboli, alcuni dei quali matematicamente ineliminabili, altri conseguenti alle modalità con cui il sondaggio d’opinione viene effettuato; altri, infine dovuti alle circostanze politiche e sociali del paese ove vengono svolti.

Chi scrive non studia statistica, ma si è cimentato da autodidatta nell’indagine dei meccanismi che determinano la correttezza o l’imprecisione di un sondaggio.

La percentuale d’errore: Per la stessa formula matematica in base alla quale sono composti, i sondaggi d’opinione soffrono di un margine d’errore congenito che si aggira intorno al 3%. Tale margine di imprecisione può essere diminuito in maniera significativa solo allargando il campione².

L’ampiezza del campione: I sondaggi politici, in Italia, vengono solitamente condotti su un campione di 1000 intervistati³. Presso i sondaggisti è diffusa l’opinione che una cifra simile possa essere ben rappresentativa degli umori dell’elettorato italiano. Questa tesi è stata fonte di aspre critiche, e in effetti è abbastanza aleatoria.

Intanto bisogna chiarire che un campione di 1000 intervistati è appena sufficiente ad esprimere i decimi di punto di una percentuale. Banalmente, se 37 persone su 1000 optano per una risposta, il loro peso percentuale sarà del 3,7%. Fin qui tutto bene, ma cosa succede se sul campione totale di 1000 intervistati alcuni dovessero asserire di essere indecisi o di volersi astenere? Tale componente rischia di modificare pesantemente l’esito del sondaggio, con un campione così ristretto.

Gli indecisi e lo scarto: Infatti, dalla cifra totale va eliminato il gruppo di persone che asserisce di essere indecisa o di volersi astenere. Quindi se nel campione dei 1000 originari solo 800 rispondessero optando per uno dei partiti, bisognerebbe arrotondare la percentuale in base alla cifra di chi ha risposto; per cui i 37 del precedente esempio, su un campione di 800 persone sicure nel proprio voto, non costituirebbero più il 3,7%, ma il 4,625%. A questo punto si dovrebbe arrotondare, ma anche arrotondando con criterio, e cioè per eccesso i valori superiori e per difetto quelli inferiori allo scarto del 0,050%, il risultato potrebbe avvantaggiare o svantaggiare, seppur lievemente, una parte o l’altra. Inoltre la somma totale delle percentuale dei vari partiti potrebbe risultare inferiore o superiore al 100%.

Il conteggio di chi non risponde: Non solo nel campione originario la scrematura degli indecisi e degli astenuti porta a imprecisioni (seppur lievi): dalla cifra va anche eliminato il numero degli intervistati che non accetta di rispondere. Si tratta di un problema grave, perché da un lato costringe il sondaggista a sottrarre dalla cifra indicata di 1000 intervistati coloro che rifiutano di dare risposte di alcun tipo; dall’altro pone all’agenzia di sondaggi un interrogativo molto difficile da sciogliere: accontentarsi di questa cifra poco comoda, che può facilmente dare adito ad imprecisioni, oppure integrare nuovi intervistati nel sondaggio, in modo da tornare ai 1000 originari? E come selezionare questo nuovo campione? E se anche tra costoro ci fossero persone che rifiutano di rispondere?
Si tratta di problemi di difficile soluzione; anche perché, per correttezza statistica, un secondo campione complementare al primo, dovrebbe essere consultato per intero, e potrebbe molto facilmente non raggiungere o superare la cifra stabilita di intervistati.

La composizione del campione: Un ulteriore problema è dato dai criteri che portano alla stessa composizione del campione. Generalmente, gli individui vengono selezionati in maniera estremamente scrupolosa in base all’età e, quando possibile, in base al reddito. Ma occorre ricordare che i sondaggi elettorali avvengono nella grande maggioranza dei casi contattando gli elementi del campione utilizzando telefoni fissi. Naturalmente, chi non dispone di un telefono fisso in casa non verrà mai raggiunto dal sondaggio. Può sembrare una considerazione sciocca, ma quanti studenti fuori sede, pur avendo una connessione ad internet, non dispongono di un telefono fisso? Costoro (e non sono una parte irrilevante dei “giovani” di oggi) presumibilmente non verrebbero contattati.

Le differenze regionali: Come si sa, il Porcellum è una legge elettorale federalista, che obbliga i partiti a superare la soglia dell’8% in almeno una regione per accedere al senato. Questo sbarramento, come quello nazionale del 4%, ha valore per l’intera alleanza, non per i singoli partiti; non solo: una quota dei seggi deve essere ripartita tra i partiti della coalizione di maggioranza relativa della singola regione; dunque il calcolo della ripartizione dei seggi è enormemente complesso, e deriva sia dal radicamento su un certo tipo di territorio da parte di un partito sia dalle alleanze e dalle coalizioni.

Per paradosso, un partito che prenda il 2% a livello nazionale, e che quindi di per sé non entrerebbe in parlamento, potrebbe accedervi se aderisse ad una coalizione più ampia, oppure potrebbe entrare al senato se riuscisse a superare l’8% in una regione pur rimanendo sul 2% a livello nazionale.

Per questo, i sondaggi elettorali che non riportino la ripartizione dei seggi possono dare un’idea falsata della reale composizione del parlamento. Stesso discorso, però, per i sondaggi che si prendano la briga di effettuare una simile ripartizione: come determinare la coalizione vincente in ogni singola regione? E come determinare quale partito possa superare la soglia di sbarramento regionale?

Le risposte: Secondo alcuni, “l’Uomo è libero perché può mentire”. Questo aspetto della natura umana (senza scendere in discorsi filosofici in merito) influenza naturalmente in maniera decisiva i sondaggi. È risaputo che molte persone sono portate ad una scarsa coerenza dal punto di vista elettorale, oppure si vergognano sinceramente delle proprie scelte.

È quanto succedeva tra anni ’60 e anni ’80 ad un partito di maggioranza relativa come la Democrazia Cristiana. E infatti tutti i sondaggi effettuati nel corso di quel periodo erano inficiati dalle risposte degli elettori che non corrispondevano all’effettivo esito elettorale.

Nella politica degli ultimi anni, hanno sofferto di questo deficit sia partiti di destra che di sinistra. È noto che una parte degli elettori del PDL in corso di sondaggio, tendevano a indicare preferenza per altri partiti (in primo luogo Lega e UdC, ma anche AN); discorso simile per il PD, in cui parte degli elettori asseriva di votare a destra o a sinistra del partito.

Per quanto in parte ridimensionato dall’inasprimento del confronto politico degli ultimi anni, questo fenomeno esiste ancora, ed è ravvisabile, ad esempio, nel rilievo dato nei sondaggi a partiti come La Destra e SEL, che non hanno quasi mai raggiunto le percentuali indicate dai sondaggisti⁴.

Per concludere, l’uso spesso propagandistico che si fa dei sondaggi serve di solito ai segretari dei maggiori partiti o ai leaders dei grandi movimenti per influenzare le scelte di voto degli elettori (fu palese il caso di Veltroni nel 2008 nei confronti della Sinistra Arcobaleno), e sconfiggere i propri avversari più piccoli nella competizione elettorale. In altri termini, sono spesso serviti a rimarcare un bipolarismo e un bipartitismo che l’elettorato italiano, come queste elezioni dimostrano, stenta ad accettare.

Valerio Cianfrocca

1=Lilli Gruber a Otto e Mezzo, 14 gennaio 2013.

2=Si veda la pagina di Wikipedia dedicata all’argomento.

3=Dai sondaggi Ipsos, dell’Istituto Piepoli, di Luigi Crespi, a quelli svolti dai telegiornali e dalle varie testate giornalistiche, la cifra di 1000 intervistati come “campione base” è stata comunemente accettata come valida; solo per questioni più delicate, come ad esempio per quanto riguarda le preferenze sui candidati alle primarie di coalizione vengono impiegati “campioni allargati”, multipli della stima dei 1000 iniziali.

4=SEL, ad esempio, pur essendo da sempre quotata tra il 4,5% e il 5,5%, con punte del 6,5% in determinati sondaggi e in determinati periodi (ad esempio durante la campagna elettorale per le primarie del PD), nella pratica nei confronti elettorali dal 2009 al 2011 si è sempre barcamenata tra il 3% delle regionali del 2010 e il 4,1% delle provinciali del 2011.

2 commenti Aggiungi il tuo

Marco Chiuppesi ha detto:

15 gennaio 2013 alle 22:32

Sul conteggio di chi non risponde: “accontentarsi di questa cifra poco comoda, che può facilmente dare adito ad imprecisioni, oppure integrare nuovi intervistati nel sondaggio, in modo da tornare ai 1000 originari? E come selezionare questo nuovo campione? E se anche tra costoro ci fossero persone che rifiutano di rispondere?
Si tratta di problemi di difficile soluzione; anche perché, per correttezza statistica, un secondo campione complementare al primo, dovrebbe essere consultato per intero, e potrebbe molto facilmente non raggiungere o superare la cifra stabilita di intervistati.”

In realtà in genere il campione è stratificato per dimensioni in modo che replichi (rispetto alle dimensioni considerate rilevanti: ad es. sesso, fasce di età, etc.) la distribuzione della popolazione di riferimento. Non c’è bisogno di avere un “nuovo campione” per intero: basta che, se una persona x1 si rifiuta di rispondermi, questa venga sostituita nel campione da una nuova persona x2, selezionata casualmente tra quelle che corrispondono alle stesse caratteristiche di x1. Se il sondaggista non ha liste in partenza, procede all’inverso, per “completamento”: rileva i dati rispetto alle dimensioni di segmentazione durante l’intervista, e mano mano colma le varie “caselline” col numero di rispondenti necessario per ogni tipologia. Sicuramente dovrà fare molte più interviste di quelle usate poi per costruire il campione: se gli servivano 10 casalinghe quarantenni e le ha intervistate tutte, e ha bisogno di ancora un operaio trentenne, ogni ulteriore casalinga quarantenne che gli risponde è inutile.
Controllando le note metodologiche dei vari sondaggi su http://www.sondaggipoliticoelettorali.it/ (dove per legge tutti i sondaggi elettorali divulgati dai mezzi d’informazione devono essere archiviati) trovi indicato per ogni sondaggio stratificato il numero di rifiuti/sostituzioni, per cui per arrivare al famigerato campione di 1000 persone se ne interpellano magari più di 3500. Il problema vero è che i non rispondenti potrebbero in realtà introdurre una distorsione non casuale (ad esempio, se chi vota per la lista Y fosse per qualche motivo tendenzialmente più portato a non rispondere rispetto a chi vota per la lista Z, nel sondaggio finale “con sostituzioni” la prima lista sarà sottorappresentata e la seconda sovrarappresentata…)
Il Bradipo ha detto:

16 gennaio 2013 alle 17:08

Sono d’accordo con quello che hai scritto, infatti volevo porre l’accento proprio sul fatto che ogni integrazione comporta una distorsione. Sono contento che tu mi abbia illustrato il metodo (a quanto pare non privo di imprecisioni) che viene usato per compensare i dati mancanti. (spero che però sulla percentuale di indecisi restiamo d’accordo).
Ricordo di non essere un addetto ai lavori né uno studioso di scienze politiche, per cui l’articolo scritto si basa in buona parte su un lavoro di indagine e apprendimento da autodidatta.
Spero di aver reso il problema alla portata di tutti (sia pur schematizzando) proprio in virtù della mia ignoranza di partenza, che ho provato a colmare.
In ogni caso ti ringrazio per l’integrazione.