Moda, media e mediana sono delle caratteristiche di un qualunque set di dati statistico e permettono di esprimere le proprietà di un’indagine statistica in modo sintetico. Sono classificati come indici statistici di posizione.
IN BREVE
Indice
MODA, MEDIA E MEDIANA: A COSA SERVONO?
Moda, media e mediana sono indici statistici di posizione che consentono di valutare l’ordine di grandezza di un insieme di dati statistici e per localizzare la distribuzione. Vengono utilizzati per riassumere le informazioni di un insieme di dati, rilevati, ad esempio, attraverso un’indagine statistica.
La media
La media è l’indice di posizione più utilizzato per fare un’analisi di un set di dati; esistono diversi tipi di media che possono essere utilizzate nell’analisi di un fenomeno. La definizione generale di media venne proposta dal matematico italiano Oscar Chesini: dato un campione di \( n \) elementi, \( (x_1,x_2, \cdots, x_n) \), e una funzione \( f \) di \( n \) variabili, si definisce media quel valore \( M \) tale che, sostituendolo a tutte le variabili fa sì che il valore della funzione rimanga inalterato, ovvero \( f(x_1,x_2, \cdots, x_n) = f(M,M, \cdots,M) \). Tutte le medie più comuni si ottengono come casi particolari di questa definizione, utilizzando una particolare \( f \).
La media aritmetica
La media aritmetica è la tipologia di media più comunemente usata e viene calcolata sommando tutti i valori ottenuti e poi dividendo per il numero dei valori stessi:
$$ M_a=\frac{1}{n} \cdot \sum_{i=1}^{n} x_i; $$
La media aritmetica ponderata (o media pesata) viene utilizzata se i valori a disposizione hanno un “peso”, ovvero un’importanza, diverso; viene calcolata sommando tutti i valori a disposizione moltiplicati per il loro peso e poi dividendo per la somma dei pesi:
$$ M_{a, pond}= \frac{ \sum_{i=1}^{n} x_i f_i}{\sum_{i=1}^{n} f_i},$$
dove \( f_i \) è il peso del termine \( i-esimo \).
La media aritmetica gode di diverse proprietà. Tra le più importanti si ricordano:
- \( \sum_{i=0}^{n} (x_i-M_a)=0 \);
- La media aritmetica è un operatore lineare: \( M[ax+b]=aM_x+b \), dove \( M_x \) è la media aritmetica del carattere \( x \).
Ad esempio, dati i numeri \( x_1=5, x_2=8, x_3=10, x_4=3 \), la media aritmetica si calcola nel seguente modo:
$$ M_a=\frac{5+8+10+3}{4}=6,5. $$
La media geometrica
La media geometrica di \( n \) elementi si calcola facendo la radice \( n-esima \) del prodotto degli \( n \) elementi:
$$ M_g= \sqrt[n]{\prod_{i=1}^{n} x_i}. $$
Nel caso in cui si voglia attribuire un peso agli elementi, si può ricorrere al calcolo della media geometrica ponderata:
$$ M_{g, pond}= \sqrt[\sum_{i=1}^{n} f_i]{\prod_{i=1}^{n} x_i^{f_i}}, $$
dove \( f_i \) è il peso del termine \( i-esimo \).
La media geometrica si utilizza quando si hanno a disposizione valori positivi e quando i valori considerati vengono moltiplicati piuttosto che sommati, ad esempio nel calcolo del tasso di interesse o di crescita. Una caratteristica di questa tipologia di media è che i valori piccoli sono molto più influenti dei valori grandi, nel calcolo totale.
Ad esempio, dati i numeri \( x_1=5, x_2=8, x_3=10, x_4=3 \), la media geometrica si calcola nel seguente modo:
$$M_g=\sqrt[4]{5 \cdot 8 \cdot 10 \cdot 3}=\sqrt[4]{1200}=5,9. $$
La media armonica
La media armonica di \( n \) elementi è definita come il reciproco della media aritmetica dei reciproci dei singoli valori:
$$M_h=\frac{n}{\sum_{i=1}^{n}\frac{1}{x_i}}.$$
Nel caso in cui si voglia attribuire un peso agli elementi, si può ricorrere al calcolo della media armonica ponderata:
$$M_h=\frac{ \sum_{i=1}^{n} f_i}{\sum_{i=1}^{n}\frac{f_i}{x_i}},$$
dove \( f_i \) è il peso del termine \( i-esimo \).
La media armonica risente notevolmente degli elementi di modulo minore e risente meno dei termini che si discostano molto dalle altre osservazioni, chiamati outlier.
Ad esempio, dati i numeri \( x¬_1=5, x_2=8, x_3=10, x_4=3 \), la media armonica si calcola nel seguente modo:
$$M_h=\frac{4}{\frac{1}{5}+ \frac{1}{8}+\frac{1}{10}+\frac{1}{3}}=3,03.$$
La media di potenza
La media di potenza (o generalizzata) è una generalizzazione delle medie pitagoriche e si calcola facendo la radice \( k-esima\) della media aritmetica delle potenze di esponente \( k \) degli \( n \) valori osservati:
$$M_p= \biggl(\frac{1}{n} \cdot \sum_{i=1}^{n} x_i^k \biggr)^{\frac{1}{k}}.$$
Le altre tipologie di media sono casi particolari della media di potenza: per \( k=1 \) si ottiene la media aritmetica; per \( k=-1 \) si ottiene la media armonica; per \( k \rightarrow 0 \) si ottiene la media geometrica; per \( k=2 \) si ottiene la media quadratica; \( \cdots \).
Nel caso in cui si voglia attribuire un peso agli elementi, si può ricorrere al calcolo della media di potenza ponderata:
$$M_p=\biggl(\frac{1}{\sum_{i=1}^{n} f_i} \cdot \sum_{i=1}^{n} f_i \cdot x_i^k \biggr)^{\frac{1}{k}},$$
dove \( f_i \) è il peso del termine \( i-esimo \).
La moda
La moda di una distribuzione di frequenza X è il valore, se esiste, che compare più frequentemente e viene spesso indicata con il simbolo \(v_0 \). Può succedere che una distribuzione sia bimodale, ovvero vi sono due valori che compaiono con la medesima frequenza (oppure trimodale se sono tre, e così via); questa caratteristica sta ad indicare che la distribuzione potrebbe non essere omogenea. Nel caso di una distribuzione gaussiana, il valore della moda coincide con quello della mediana e della media. Ad esempio, considerando un set di dati: \( x_1=5, x_2=8, x_3=10, x_4=3, x_5=10, x_6=7 \), la moda è \( 10 \).
La mediana
In statistica la mediana è il valore che si trova nella posizione centrale del set di dati disposti in ordine crescente o decrescente. Nel caso in cui si abbiano un numero dispari di valori, la mediana è semplicemente il valore centrale, ovvero quello in posizione \( \frac{n+1}{2} \); nel caso in cui si abbiano a disposizione un numero pari di valori, allora la mediana sarà data dalla media aritmetica dei due dati centrali, ovvero tra i dati in posizione \( \frac{n}{2} \) e \( \frac{n+1}{2} \). Inoltre la mediana è il valore per cui la frequenza relativa cumulata vale \( 0,5 \). Ad esempio, considerando un set di dati: \( x_1=5, x_2=8, x_3=10, x_4=3, x_5=10, x_6=7 \), la mediana, poiché si hanno un numero pari di termini, è data dalla media aritmetica tra \( 7 \) e \( 8 \), ovvero \( \frac{7+8}{2}=7,5 \). Considerando un set di dati in numero dispari: \( x_1=5, x_2=8, x_3=10, x_4=3, x_5=7 \), la mediana sarà il termine che si trova nella posizione centrale dopo aver disposto i dati in ordine crescente o decrescente, ovvero \( 7 \).