La curva normale è in assoluto la formula più importante del calcolo della probabilità ed ha numerose applicazioni in molti ambiti. È inoltre ricca di curiosità affascinanti ed aneddoti storici, che la rendono una delle più belle ed intriganti formule della matematica.
IN BREVE
Cosa intendiamo con curva “normale”?
Quando pensiamo ad una situazione o ad una quantità “normale” ci vengono in mente i concetti di consuetudine e regolarità. Qualcosa, insomma, che segue un suo ordine naturale senza stravolgimenti inaspettati. È più o meno questo il punto di partenza che ci serve per capire il concetto di normalità statistica. Consideriamo un altro concetto chiave: quello di errore. Supponiamo di avere 1000 travi di legno che ci vengono consegnate: il nostro compito è quello di controllare se effettivamente sono della lunghezza prestabilita, ovvero di un metro. La tecnica migliore sembra essere quella di usare un metro (per comodità assumiamo che abbia errore di misura pari a zero, cioè che riesca idealmente a rilevare l’esatta misura di ogni trave) e di misurare ogni trave; per comodità, annotiamo su un foglio la differenza tra la lunghezza ideale (1 m) e la lunghezza misurata col metro, chiamando tale quantità “errore”. Ci aspettiamo che la maggior parte degli errori sia piuttosto bassa (circa 1 mm), ma che ci siano anche alcuni errori più evidenti (tipo 1 cm), dovuti magari ad errori di fabbricazione.
Errori piccoli ed errori grandi: da Platone a Gauss
Questo concetto degli errori presentato prima è stato intuito per la prima volta dal famoso filosofo greco Platone, che sul Fedone disse: “Non ti sei mai accorto che in tutte le cose gli estremi sono rari mentre gli aspetti intermedi sono frequenti, anzi numerosi?”. Circa 2200 anni dopo, il celeberrimo matematico tedesco Gauss concretizzò questo concetto nella teoria degli errori, nel volume “Teoria del moto di corpi celesti che si muovono percorrendo sezioni coniche intorno al sole”. Studiando il moto degli astri, infatti, si accorse che le variazioni di posizione piccole erano molto comuni, quelle grandi erano molto rare. È per questo che la famosa formula della distribuzione normale venne denominata “Gaussiana” o appunto “curva degli errori”. Viene chiamata anche “campana di Gauss” per la sua forma che ricorda simpaticamente una campana: eccone un primo esempio di rappresentazione grafica. Come si nota, gli errori grandi (come +3 oppure -4) hanno probabilità bassissime, prossime allo zero, mentre errori bassi come +0.5 o -0.3 sono molto più probabili.
Variabile casuale: che significa?
Come viene tradotto in termini matematici questo concetto? Prima di tutto occorre chiarire il significato di variabile aleatoria (o casuale). Semplificando molto, possiamo dire che si tratta di una variabile che, dato un esperimento aleatorio (cioè casuale) che può avere diversi esiti possibili, assegna ad ogni possibile esito una certa probabilità. Esistono molte variabili di questo tipo a seconda della natura dell’esperimento: ad esempio se lanciamo una moneta regolare esiste una variabile casuale che si chiama Bernoulliana che assegna ai due esiti possibili Testa e Croce una probabilità pari a 1/2 (ovvero il 50%), quindi P(T)=1/2 e P(C)=1/2. Se invece lanciamo n monete regolari a 6 facce c’è un’altra variabile che si chiama Binomiale e così via. Queste variabili si chiamano discrete quando hanno un numero finito di esiti possibili, mentre altre come la normale hanno un insieme potenzialmente infinito di esiti possibili, ad esempio l’altezza di una persona (in questo caso si parla di variabili continue). In questo caso la probabilità di un esito è 1/infinito, quindi praticamente 0; è per questo che si usa la probabilità per intervalli, anche se qui per semplicità ammettiamo un valore diverso da 0.
La curva normale: definizione e proprietà
La variabile casuale normale o distribuzione normale Gaussiana è quindi una variabile continua che descrive gli esperimenti di misurazione: di un errore, di una altezza e così via. Questa è la sua formula:
\(\)\[ f(x,\mu,\sigma)=\frac{1}{\sigma\sqrt{2\pi}} · e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2} \]\(\)
Anche se sembra qualcosa di mostruosamente complesso, la sua interpretazione non è così complicata. Prima di tutto occorre ricordare che, come tutte le variabili casuali, restituisce il valore della probabilità di un certo esito: in questo caso l’esito è x, ad esempio se x=1.70m abbiamo che f(1.70m)=probabilità(1.70m)=3% significa che la probabilità che una persona sia alta un metro e settanta è pari al 3%. Gli altri due valori di “input” della funzione sono μ e σ, la media e la varianza: il primo è chiamato parametro di scala e definisce quanto la curva è spostata verso destra o verso sinistra, il secondo è chiamato parametro di forma e indica quanto la curva è schiacciata o “appuntita”. Ecco alcuni esempi.
Come si può notare, la media rappresenta il valore più probabile, ovvero il valore dove la curva è centrata e raggiunge il piccolo di probabilità massimo, mentre la varianza indica quanto la curva è schiacciata. Più cresce la media, più la curva viene traslata verso destra, più cresce la varianza e più si schiaccia la curva, dando maggior incertezza ai valori di probabilità.
La normale standardizzata: un caso particolare
Così come a battaglia navale ogni quadratino è identificato da due quantità, ovvero il numero e la lettera, allo stesso modo ogni normale è definita dai due parametri media e varianza. Esiste una normale per così dire “speciale” che viene chiamata curva normale standardizzata o curva normale standard, che ha media pari a 0 e varianza pari a 1. Eccone la formula ed il rispettivo grafico.
\(\)\[ f(x,0,1)=\frac{1}{1*\sqrt{2\pi}} · e^{-\frac{1}{2}\left(\frac{x-0}{1}\right)^2} \]\(\)
Viene largamente usata in statistica inferenziale, specialmente in intervalli di confidenza e test d’ipotesi, in quanto si fa convergere, per comodità, una quantità ad una distribuzione di frequenza nota (la normale ma anche molte altre). Quindi per avere una funzione “standard” si è deciso per convenzione di usare questo caso particolare di normale. In genere, per standardizzare una variabile casuale, ovvero far sì che abbia media 0 e varianza 1, si sottrae per la media e si divide per la radice della varianza.
Un teorema indispensabile
Il teorema del limite centrale è forse il teorema più importante che dobbiamo alla normale, è usatissimo in statistica e praticamente indispensabile per molte formule. Dice infatti che la somma di molte variabili casuali indipendenti e dotate della medesima distribuzione convergono alla normale, a prescindere dalla loro distribuzione. Tale teorema implica anche che alcune distribuzioni aleatorie possono essere approssimate dalla normale sotto determinate condizioni: facciamo un esempio. La T di Student è una particolare variabile aleatoria che dipende da un solo parametro (che chiamiamo “n” o “gradi di libertà”); ebbene, se n tende all’infinito, la T di Student tende proprio ad una normale standard, ed è una proprietà asintotica fondamentale. Dal grafico si nota come al variare di n le curve (colorate) tendono alla curva Gaussiana standard (in nero).
Tavola di Galton: matematica e poesia
Una straordinaria dimostrazione della bellezza di questo teorema è la famosa tavola di Galton: si tratta semplicemente di una scatola, in cui alla base sono fissati dei chiodi disposti a formare dei triangolini, contenente delle palline nella parte alta.Se si gira la scatola mettendola in verticale le palline scendono superando casualmente ogni chiodo incontrato o a destra o a sinistra. Infine, le palline si depositano sul fondo della scatola disponendosi secondo un modo che approssima la curva normale. Ma perché?
Se ci pensate bene, ogni pallina che incontra un chiodo può andare alla sua destra o alla sua sinistra, con probabilità 1/2 ciascuna, e se vi ricordate questo esperimento segue la distribuzione Bernoulliana vista precedentemente; ma le palline sono tante (supponiamo siano “n”) e la somma di n Bernoulliane equivale alla distribuzione Binomiale. Ebbene, il teorema del limite centrale afferma che una Binomiale tende alla normale se n tende ad infinito. Più alto sarà n, migliore sarà l’approssimazione alla normale, e ciò è anche intuitivo perché se avessimo poche palline il risultato sarebbe a dir poco scadente.
Fonte
- Diverse derivazioni della distribuzione normale
Dipartimento di Matematica, Università di Trento - La distribuzione normale
Università degli studi di Chieti e Pescara