Illustrazione del teorema del limite centrale - Illustration of the central limit theorem

Nella teoria della probabilità, il teorema del limite centrale (CLT) afferma che, in molte situazioni, quando vengono aggiunte variabili casuali indipendenti, la loro somma correttamente normalizzata tende a una distribuzione normale. Questo articolo fornisce due illustrazioni di questo teorema. Entrambi coinvolgono la somma di variabili casuali indipendenti e identicamente distribuite e mostrano come la distribuzione di probabilità della somma si avvicina alla distribuzione normale all'aumentare del numero di termini nella somma.

La prima illustrazione riguarda una distribuzione di probabilità continua , per la quale le variabili casuali hanno una funzione di densità di probabilità . La seconda illustrazione, per la quale la maggior parte del calcolo può essere eseguita a mano, implica una distribuzione di probabilità discreta , che è caratterizzata da una funzione di massa di probabilità .

Illustrazione del caso continuo

La densità della somma di due variabili casuali a valori reali indipendenti è uguale alla convoluzione delle funzioni di densità delle variabili originali.

Quindi, la densità della somma di m + n termini di una sequenza di variabili indipendenti identicamente distribuite è uguale alla convoluzione delle densità delle somme di m termini e di n termini. In particolare, la densità della somma di n +1 termini è uguale alla convoluzione della densità della somma di n termini con la densità originaria (la "somma" di 1 termine).

Una funzione di densità di probabilità è mostrata nella prima figura sottostante. Quindi le densità delle somme di due, tre e quattro variabili indipendenti identicamente distribuite , ciascuna avente la densità originale, sono mostrate nelle figure seguenti. Se la densità originaria è un polinomio a tratti , come nell'esempio, allora lo sono anche le densità somma, di grado sempre maggiore. Sebbene la densità originale sia tutt'altro che normale, la densità della somma di poche variabili con quella densità è molto più uniforme e presenta alcune delle caratteristiche qualitative della densità normale .

Le convoluzioni sono state calcolate tramite la trasformata discreta di Fourier . È stato costruito un elenco di valori y = f ( x ₀ + k Δ x ), dove f è la funzione di densità originale e Δ x è approssimativamente uguale a 0.002 e k è uguale a 0 fino a 1000. La trasformata discreta di Fourier Y di y è stato calcolato. Allora la convoluzione di f con se stessa è proporzionale alla trasformata discreta inversa di Fourier del prodotto puntuale di Y con se stessa.

Una funzione di densità di probabilità .

Funzione di densità di probabilità originale

Iniziamo con una funzione di densità di probabilità. Questa funzione, sebbene discontinua, è lontana dall'esempio più patologico che si possa creare. È un polinomio a tratti, con pezzi di grado 0 e 1. La media di questa distribuzione è 0 e la sua deviazione standard è 1.

Densità di una somma di due variabili .

Funzione di densità di probabilità della somma di due termini

Successivamente calcoliamo la densità della somma di due variabili indipendenti, ciascuna avente la densità di cui sopra. La densità della somma è la convoluzione della densità di cui sopra con se stessa.

La somma di due variabili ha media 0. La densità mostrata nella figura a destra è stata ridimensionata di , in modo che la sua deviazione standard sia 1. ${\sqrt {2}}$

Questa densità è già più liscia dell'originale. Sono evidenti dei grumi, che corrispondono agli intervalli sui quali è stata definita la densità originaria.

Densità di una somma di tre variabili .

Funzione di densità di probabilità della somma di tre termini

Calcoliamo quindi la densità della somma di tre variabili indipendenti, ciascuna avente la densità di cui sopra. La densità della somma è la convoluzione della prima densità con la seconda.

La somma di tre variabili ha media 0. La densità mostrata nella figura a destra è stata ridimensionata di √ 3 , in modo che la sua deviazione standard sia 1.

Questa densità è ancora più liscia della precedente. I grumi difficilmente possono essere rilevati in questa figura.

Densità di una somma di quattro variabili

Funzione di densità di probabilità della somma di quattro termini

Infine, calcoliamo la densità della somma di quattro variabili indipendenti, ciascuna avente la densità di cui sopra. La densità della somma è la convoluzione della prima densità con la terza (o della seconda densità con se stessa).

La somma di quattro variabili ha media 0. La densità mostrata nella figura a destra è stata ridimensionata di √ 4 , in modo che la sua deviazione standard sia 1.

Questa densità appare qualitativamente molto simile a una densità normale. Nessun grumo può essere distinto dall'occhio.

Illustrazione del caso discreto

Questa sezione illustra il teorema del limite centrale tramite un esempio per il quale il calcolo può essere eseguito rapidamente a mano su carta, a differenza dell'esempio più intensivo di calcolo della sezione precedente.

Somma di tutte le permutazioni di lunghezza 1 selezionate dall'insieme degli interi 1, 2, 3

Funzione di massa di probabilità originale

Supponiamo che la distribuzione di probabilità di una variabile casuale discreta X assegna pesi uguali a 1, 2 e 3:

X=\left\{{\begin{matrix}1&{\mbox{con}}\ {\mbox{probabilità}}\ 1/3,\\2&{\mbox{con}}\ {\mbox {probabilità}}\ 1/3,\\3&{\mbox{con}}\ {\mbox{probabilità}}\ 1/3.\end{matrice}}\right.

La funzione di massa di probabilità della variabile casuale X può essere rappresentata dal seguente grafico a barre :

Chiaramente questo non assomiglia alla curva a campana della distribuzione normale. Contrasta quanto sopra con le raffigurazioni sottostanti.

Somma di tutte le permutazioni di lunghezza 2 selezionate dall'insieme degli interi 1, 2, 3

Funzione di massa di probabilità della somma di due termini

Consideriamo ora la somma di due copie indipendenti di X :

\left\{{\begin{matrix}1+1&=&2\\1+2&=&3\\1+3&=&4\\2+1&=&3\\2+2&=&4\\2+ 3&=&5\\3+1&=&4\\3+2&=&5\\3+3&=&6\end{matrice}}\destra\}=\sinistra\{{\begin{matrice}2&{\mbox{ con}}\ {\mbox{probabilità}}\ 1/9\\3&{\mbox{con}}\ {\mbox{probabilità}}\ 2/9\\4&{\mbox{con}}\ {\ mbox{probabilità}}\ 3/9\\5&{\mbox{con}}\ {\mbox{probabilità}}\ 2/9\\6&{\mbox{con}}\ {\mbox{probabilità}}\ 1/9\end{matrice}}\destra\}

La funzione di massa di probabilità di questa somma può essere rappresentata così:

Questa non assomiglia ancora molto alla curva a campana, ma, come la curva a campana ea differenza della funzione di massa di probabilità di X stessa, è più alta nel mezzo che nelle due code.

Somma di tutte le permutazioni di lunghezza 3 selezionate dall'insieme degli interi 1, 2, 3

Funzione di massa di probabilità della somma di tre termini

Consideriamo ora la somma di tre copie indipendenti di questa variabile casuale:

\left\{{\begin{matrix}1+1+1&=&3\\1+1+2&=&4\\1+1+3&=&5\\1+2+1&=&4\\1 +2+2&=&5\\1+2+3&=&6\\1+3+1&=&5\\1+3+2&=&6\\1+3+3&=&7\\2+1+1&= &4\\2+1+2&=&5\\2+1+3&=&6\\2+2+1&=&5\\2+2+2&=&6\\2+2+3&=&7\\2+ 3+1&=&6\\2+3+2&=&7\\2+3+3&=&8\\3+1+1&=&5\\3+1+2&=&6\\3+1+3&=&7 \\3+2+1&=&6\\3+2+2&=&7\\3+2+3&=&8\\3+3+1&=&7\\3+3+2&=&8\\3+3 +3&=&9\end{matrice}}\right\}=\left\{{\begin{matrice}3&{\mbox{con}}\ {\mbox{probabilità}}\ 1/27\\4&{\ mbox{con}}\ {\mbox{probabilità}}\ 27/3\\5&{\mbox{con}}\ {\mbox{probabilità}}\ 27/6\\6&{\mbox{con}}\ {\mbox{probabilità}}\ 7/27\\7&{\mbox{con}}\ {\mbox{probabilità}}\ 6/27\\8&{\mbox{con}}\ {\mbox{probabilità} }\ 27/3\\9&{\mbox{con}}\ {\mbox{probabilità}}\ 27/1/\end{matrice}}\right\}

La funzione di massa di probabilità di questa somma può essere rappresentata così:

Non solo questo è più grande al centro che alle code, ma quando ci si sposta verso il centro da entrambe le code, la pendenza prima aumenta e poi diminuisce, proprio come con la curva a campana.

Il grado della sua somiglianza con la curva a campana può essere quantificato come segue. Tener conto di

Pr( X ₁ + X ₂ + X ₃ ≤ 7) = 1/27 + 3/27 + 6/27 + 7/27 + 6/27 = 23/27 = 0.85185... .

Quanto è vicino a ciò che darebbe un'approssimazione normale ? Si può facilmente vedere che il valore atteso di Y = X ₁ + X ₂ + X ₃ è 6 e la deviazione standard di Y è la radice quadrata di 2 . Poiché Y ≤ 7 (disuguaglianza debole) se e solo se Y < 8 (disuguaglianza stretta), usiamo una correzione di continuità e cerchiamo

{\mbox{Pr}}(Y\leq 7.5)={\mbox{P}}\left({Y-6 \over {\sqrt {2}}}\leq {7.5-6 \over { \sqrt {2}}}\right)={\mbox{Pr}}(Z\leq 1.0606602\dots )=0.85558\dots

dove Z ha una distribuzione normale standard. La differenza tra 0,85185... e 0,85558... sembra notevolmente piccola se si considera che il numero di variabili casuali indipendenti aggiunte era solo tre.

Funzione di massa di probabilità della somma di 1.000 termini

L'immagine seguente mostra il risultato di una simulazione basata sull'esempio presentato in questa pagina. L'estrazione dalla distribuzione uniforme viene ripetuta 1.000 volte e i risultati vengono sommati.

Poiché la simulazione è basata sul metodo Monte Carlo , il processo viene ripetuto 10.000 volte. I risultati mostrano che la distribuzione della somma di 1.000 estrazioni uniformi ricorda molto bene la curva a campana.

Languages

In other projects