Tempo di lettura: 3 minuti

La Statistica

Sai ched’è la statistica? È ’na cosa
che serve pe’ fa’ un conto in generale
de la gente che nasce, che sta male,
che more, che va in carcere e che sposa.
Ma pe’ me la statistica curiosa
è dove c’entra la percentuale,
pe’ via che, lì, la media è sempre eguale
puro co’ la persona bisognosa.
Me spiego: da li conti che se fanno
secondo le statistiche d’adesso
risurta che te tocca un pollo all’anno:
e, se nun entra ne le spese tue,
t’entra ne la statistica lo stesso
perché c’è un antro che ne magna due.

(Trilussa, Sonetti Romaneschi)

Il grande poeta Trilussa non poteva spiegare meglio in dialetto romanesco il concetto di media.

La media riesce a racchiudere in sé un grande senso di ingiustizia o giustizia sociale, dipende dal punto da cui si guarda.

È un concetto che conosciamo fin da piccolissimi: quando mia figlia aveva pochi anni, 2 o 3 non ricordo, voleva sempre dividere le cose con gli altri, ad esempio le caramelle contenute in un sacchetto, e diceva a me e alla sorella: “Facciamo un po’ per ciascuno, metà a te, metà a te e metà a me” … mumble, mumble… aveva qualche problema con le frazioni, ma l’idea di dare a ognuna di noi tre la stessa quantità di caramelle denotava un certo desiderio di equità, lo stesso che probabilmente avrebbe voluto Trilussa quando ha raccontato la questione del pollo, ma che non trovava nel mondo reale del suo tempo.

Il calcolo della media (aritmetica! vi sono vari tipi di medie, ma qui ci riferiremo sempre a quella aritmetica) è noto a tutti: si considera l’ammontare dei valori osservati (ad esempio, nella poesia di Trilussa, i polli mangiati in un anno da tutta la “gente”) e lo si divide per la numerosità della popolazione osservata, trovando così un valore che riassuma in sé tutte le caratteristiche della distribuzione di quel bene sulla popolazione.

Ovviamente ha senso calcolare la media quando su una popolazione si osservano caratteri quantitativi: se l’osservazione riguardasse il colore degli occhi, come si potrebbe calcolare il colore medio? Mentre è sensato parlare di altezza media delle persone, di reddito medio delle famiglie, di voto medio degli alunni di una classe in una verifica.

Ma più che addentrarci sul calcolo della media, risulta interessante porre attenzione sulle sue proprietà:

  1. la media è sempre compresa tra i valori minimo e massimo osservati; si dice anche che è compresa nel campo di variazione della distribuzione
  2. la somma delle differenze di tutti i valori osservati dalla media è nulla; significa che gli scarti negativi compensano tutti quelli positivi.

Se ogni unità statistica della popolazione possedesse esattamente il valor medio calcolato, cioè il carattere osservato fosse equidistribuito, l’ammontare complessivo del fenomeno osservato non cambierebbe; questa proprietà deriva direttamente dalla definizione di media data da Chisini, un grande matematico italiano morto nel 1967 che ha molto studiato la statistica, ed è strettamente legato al tema della giustizia sociale.

La media è quindi un indice di posizione e si può anche considerare il baricentro della distribuzione che rappresenta; sarà molto interessante osservare dove si colloca tale valore all’interno dei campi di variazione di distribuzioni diverse.

Poiché per noi è impossibile rilevare i dati a cui si riferisce Trilussa sul numero di polli mangiati in un anno dalla “gente” della sua epoca, possiamo analizzare distribuzioni generate in modo casuale per osservare le proprietà della media descritte; in particolare sarà evidente che la media è il baricentro della distribuzione e che la somma degli scarti dalla media è sempre nulla.

Si può procedere con la costruzione di una applicazione Python che:

  • generi un certo numero di valori casuali inserendoli in una lista
  • determini il minimo e il massimo di tali valori, provveda a sommarli uno ad uno e a rappresentarli su di una linea come piccoli punti grigi
  • calcoli la loro media e la rappresenti con un punto rosso tra i dati che essa riassume
  • calcoli la somma degli scarti di ciascun valore dalla media per verificare che tale somma sia nulla.

Ecco il codice Python e una prova di elaborazione ottenuta nella IDLE (Integrated Development and Learning Environment) in cui vengono generati numeri casuali compresi tra 0 e 200, per cui ci si aspetta che il valor medio risulti attorno al valore 100; la numerosità dei dati generati è stata impostata a 50.

Mi occupo di informatica da circa 40 anni con vari ruoli: studentessa
nella specializzazione Informatica dell'istituto tecnico industriale
quando ancora per programmare si perforavano le schede, poi
programmatrice sui mitici BCS dell'Olivetti, successivamente
Insegnante Tecnico-pratica nella stessa mia scuola. Posso quindi
affermare di essere stata testimone dell'evoluzione dell'informatica
sia dal punto di vista hardware che software.
Mi affascinano molto gli aspetti cognitivi dell'apprendimento e
quindi tutto quanto abbia a che fare con la didattica
dell'Informatica. Ho infatti collaborato con docenti dei vari gradi di
scuola per realizzare progetti informatici, sperimentando approcci
di vario tipo, anche unplugged, e sono stata formatrice per gli
aspetti della didattica digitale nei corsi per docenti neoassunti.
Per passione, ho collaborato come volontaria in un coderdojo.
Mi piace ricordare che la mia prima vera insegnante di informatica
è stata la mia mamma grazie al suo lavoro di sarta e di
ricamatrice.