Teorema del limite centrale - Central limit theorem

In teoria della probabilità , il teorema del limite centrale ( CLT ) stabilisce che, in molte situazioni, quando si sommano variabili casuali indipendenti , la loro somma correttamente normalizzata tende verso una distribuzione normale (informalmente una curva a campana ) anche se le variabili originarie stesse non sono normalmente distribuito. Il teorema è un concetto chiave nella teoria della probabilità perché implica che i metodi probabilistici e statistici che funzionano per le distribuzioni normali possono essere applicabili a molti problemi che coinvolgono altri tipi di distribuzioni. Questo teorema ha visto molti cambiamenti durante lo sviluppo formale della teoria della probabilità. Le versioni precedenti del teorema risalgono al 1811, ma nella sua forma generale moderna, questo risultato fondamentale nella teoria della probabilità è stato affermato con precisione fino al 1920, fungendo così da ponte tra la teoria della probabilità classica e moderna.

Se sono campioni casuali estratti da una popolazione con media complessiva e varianza finita , e se è la media campionaria , allora la forma limite della distribuzione, , è una distribuzione normale standard.

Ad esempio, supponiamo che si ottenga un campione contenente molte osservazioni , ciascuna osservazione generata casualmente in modo non dipendente dai valori delle altre osservazioni, e che venga calcolata la media aritmetica dei valori osservati. Se questa procedura viene eseguita molte volte, il teorema del limite centrale afferma che la distribuzione di probabilità della media si avvicinerà molto a una distribuzione normale. Un semplice esempio di ciò è che se si lancia una moneta molte volte , la probabilità di ottenere un dato numero di teste si avvicinerà a una distribuzione normale, con la media pari alla metà del numero totale di lanci. Al limite di un numero infinito di lanci, sarà uguale a una distribuzione normale.

Il teorema del limite centrale ha diverse varianti. Nella sua forma comune, le variabili casuali devono essere distribuite in modo identico. Nelle varianti, la convergenza della media alla distribuzione normale avviene anche per distribuzioni non identiche o per osservazioni non indipendenti, se rispettano determinate condizioni.

La prima versione di questo teorema, secondo cui la distribuzione normale può essere usata come approssimazione alla distribuzione binomiale , è il teorema di de Moivre-Laplace .

Sequenze indipendenti

Una distribuzione "appianata" per sommatoria , che mostra la densità originale di distribuzione e tre successive sommazioni; vedere Illustrazione del teorema del limite centrale per ulteriori dettagli.
Qualunque sia la forma della distribuzione della popolazione, la distribuzione campionaria tende a una gaussiana, e la sua dispersione è data dal teorema del limite centrale.

CLT classico

Sia un campione casuale di dimensioni , ovvero una sequenza di variabili casuali indipendenti e identicamente distribuite (iid) tratte da una distribuzione del valore atteso data da e varianza finita data da . Supponiamo di essere interessati alla media campionaria

di queste variabili casuali. Per la legge dei grandi numeri , le medie campionarie convergono quasi sicuramente (e quindi convergono anche in probabilità ) al valore atteso come . Il classico teorema del limite centrale descrive la dimensione e la forma distributiva delle fluttuazioni stocastiche attorno al numero deterministico durante questa convergenza. Più precisamente afferma che man mano che aumenta, la distribuzione della differenza tra la media campionaria e il suo limite , moltiplicata per il fattore ( cioè ) approssima la distribuzione normale con media 0 e varianza . Per n sufficientemente grande , la distribuzione di è vicina alla distribuzione normale con media e varianza . L'utilità del teorema è che la distribuzione si avvicina alla normalità indipendentemente dalla forma della distribuzione dell'individuo . Formalmente, il teorema può essere enunciato come segue:

Lindeberg–Lévy CLT. Supponiamo che sia una sequenza di variabili casuali iid con e . Quindi quando si avvicina all'infinito, le variabili casuali convergono nella distribuzione a una normale :

Nel caso , convergenza in distribuzione significa che le funzioni cumulative di distribuzione di convergono puntualmente alla cdf della distribuzione: per ogni numero reale ,

dove è il cdf normale standard valutato in . La convergenza è uniforme nel senso che

dove denota il minimo limite superiore (o supremo ) dell'insieme.

Lyapunov CLT

Il teorema prende il nome dal matematico russo Aleksandr Lyapunov . In questa variante del teorema del limite centrale le variabili casuali devono essere indipendenti, ma non necessariamente distribuite identicamente. Il teorema richiede anche che le variabili aleatorie hanno momenti di un ordine , e che il tasso di crescita di questi momenti è limitata dalla condizione Lyapunov indicato di seguito.

Lyapunov CLT. Supponiamo che sia una sequenza di variabili casuali indipendenti, ciascuna con valore atteso finito e varianza . Definire

Se per alcuni , la condizione di Lyapunov

è soddisfatta, allora una somma di converge in distribuzione a una variabile casuale normale standard, come va all'infinito:

In pratica, di solito è più facile controllare le condizioni di Lyapunov per .

Se una sequenza di variabili casuali soddisfa la condizione di Lyapunov, allora soddisfa anche la condizione di Lindeberg. L'implicazione inversa, tuttavia, non regge.

Lindeberg CLT

Nella stessa impostazione e con la stessa notazione di cui sopra, la condizione di Lyapunov può essere sostituita con la seguente più debole (da Lindeberg nel 1920).

Supponiamo che per ogni

dove è la funzione dell'indicatore . Allora la distribuzione delle somme standardizzate

converge verso la distribuzione normale standard .

Multidimensionale CLT

Le dimostrazioni che utilizzano funzioni caratteristiche possono essere estese ai casi in cui ogni individuo è un vettore casuale in , con vettore medio e matrice di covarianza (tra le componenti del vettore), e questi vettori casuali sono indipendenti e distribuiti identicamente. La somma di questi vettori viene eseguita per componente. Il teorema del limite centrale multidimensionale afferma che quando scalate, le somme convergono a una distribuzione normale multivariata .

Permettere

essere il k -vettore. Il grassetto in significa che si tratta di un vettore casuale, non di una variabile casuale (univariata). Allora la somma dei vettori casuali sarà

e la media è

e quindi

Il teorema del limite centrale multivariato afferma che

dove la matrice di covarianza è uguale a

Il tasso di convergenza è dato dal seguente risultato di tipo Berry-Esseen :

Teorema. Siano vettori casuali a valori indipendenti , ciascuno avente media zero. Scrivere e assumere è invertibile. Sia una gaussiana tridimensionale con la stessa media e la stessa matrice di covarianza di . Allora per tutti gli insiemi convessi ,

dove è una costante universale, , e denota la norma euclidea su .

Non è noto se il fattore sia necessario.

Teorema generalizzato

Il teorema del limite centrale afferma che la somma di un numero di variabili casuali indipendenti e identicamente distribuite con varianze finite tenderà a una distribuzione normale all'aumentare del numero di variabili. Una generalizzazione dovuta a Gnedenko e Kolmogorov afferma che la somma di un numero di variabili casuali con distribuzioni tail power-law ( tail paretiana ) decrescente come dove (e quindi con varianza infinita) tenderà ad una distribuzione stabile al crescere del numero di addizioni . Se poi la somma converge ad una distribuzione stabile con parametro di stabilità pari a 2, cioè una distribuzione gaussiana.

Processi dipendenti

CLT in condizioni di dipendenza debole

Un'utile generalizzazione di una sequenza di variabili casuali indipendenti e identicamente distribuite è un processo casuale di mescolamento in tempo discreto; "mescolamento" significa, grosso modo, che variabili casuali temporalmente distanti l'una dall'altra sono quasi indipendenti. Diversi tipi di mescolamento sono usati nella teoria ergodica e nella teoria della probabilità. Vedere la miscelazione particolarmente forte (chiamata anche miscelazione α) definita da dove è il cosiddetto coefficiente di miscelazione forte .

Una formulazione semplificata del teorema del limite centrale sotto forte miscelazione è:

Teorema. Supponiamo che sia stazionario e -miscendo con e che e . Indica , quindi il limite

esiste, e se allora converge in distribuzione a .

Infatti,

dove la serie converge assolutamente.

L'assunzione non può essere omessa, poiché la normalità asintotica fallisce per dove sono un'altra sequenza stazionaria .

Esiste una versione più forte del teorema: l'assunzione viene sostituita con , e l'assunzione viene sostituita con

L'esistenza di tale assicura la conclusione. Per il trattamento enciclopedico dei teoremi limite in condizioni di mescolamento si veda ( Bradley 2007 ).

Differenza Martingala CLT

Teorema . Lascia che una martingala soddisfi

  • in probabilità come n → ∞ ,
  • per ogni ε > 0 , come n → ∞ ,

allora converge nella distribuzione ad as .

Attenzione: l' aspettativa ristretta non deve essere confusa con l'aspettativa condizionale .

Osservazioni

Dimostrazione del classico CLT

Il teorema del limite centrale ha una dimostrazione usando funzioni caratteristiche . È simile alla dimostrazione della legge (debole) dei grandi numeri .

Assumiamo che siano variabili casuali indipendenti e identicamente distribuite, ciascuna con media e varianza finita . La somma ha media e varianza . Considera la variabile casuale

dove nell'ultimo passaggio abbiamo definito le nuove variabili casuali , ciascuna con media nulla e varianza unitaria ( ). La funzione caratteristica di è data da

dove nell'ultimo passaggio abbiamo utilizzato il fatto che tutti sono distribuiti in modo identico. La funzione caratteristica di è, per il teorema di Taylor ,

dove è " poca notazione o " per una funzione di che va a zero più rapidamente di . Per il limite della funzione esponenziale ( ), la funzione caratteristica di uguale

Tutti i termini di ordine superiore svaniscono nel limite . Il membro di destra è uguale alla funzione caratteristica di una distribuzione normale standard , che implica attraverso il teorema di continuità di Lévy che la distribuzione di si avvicini a . Pertanto, la media campionaria

è tale che

converge alla distribuzione normale , da cui segue il teorema del limite centrale.

Convergenza al limite

Il teorema del limite centrale fornisce solo una distribuzione asintotica . Come approssimazione per un numero finito di osservazioni, fornisce un'approssimazione ragionevole solo quando vicino al picco della distribuzione normale; richiede un numero molto elevato di osservazioni per estendersi fino alle code.

La convergenza nel teorema del limite centrale è uniforme perché la funzione di distribuzione cumulativa limite è continua. Se il terzo momento centrale esiste ed è finito, allora la velocità di convergenza è almeno dell'ordine di (vedi teorema di Berry-Esseen ). Il metodo di Stein può essere utilizzato non solo per dimostrare il teorema del limite centrale, ma anche per fornire limiti sui tassi di convergenza per metriche selezionate.

La convergenza alla distribuzione normale è monotona, nel senso che l' entropia di aumenta monotonicamente a quella della distribuzione normale.

Il teorema del limite centrale si applica in particolare alle somme di variabili casuali discrete indipendenti e identicamente distribuite . Una somma di variabili casuali discrete è ancora una variabile casuale discreta , per cui ci troviamo di fronte a una sequenza di variabili casuali discrete la cui funzione di distribuzione di probabilità cumulativa converge verso una funzione di distribuzione di probabilità cumulata corrispondente ad una variabile continua (cioè quella della distribuzione normale ) . Ciò significa che se costruiamo un istogramma delle realizzazioni della somma di n variabili discrete identiche indipendenti, la curva che unisce i centri delle facce superiori dei rettangoli che formano l'istogramma converge verso una curva gaussiana quando n tende all'infinito, questa relazione è noto come teorema di de Moivre-Laplace . L' articolo sulla distribuzione binomiale descrive in dettaglio tale applicazione del teorema del limite centrale nel caso semplice di una variabile discreta che assume solo due possibili valori.

Relazione con la legge dei grandi numeri

La legge dei grandi numeri e il teorema del limite centrale sono soluzioni parziali a un problema generale: "Qual è il comportamento limite di S n quando n tende all'infinito?" Nell'analisi matematica, le serie asintotiche sono uno degli strumenti più utilizzati per affrontare tali questioni.

Supponiamo di avere uno sviluppo asintotico di :

Dividendo entrambi parti in φ 1 ( n ) e prendendo il limite produrrà un 1 , il coefficiente del termine di ordine più alto in espansione, che rappresenta il tasso al quale f ( n ) cambia nel suo termine principale.

Informale, si può dire: " f ( n ) cresce approssimativamente come un 1 φ 1 ( n ) ". Prendendo la differenza tra f ( n ) e la sua approssimazione e quindi dividendo per il termine successivo nell'espansione, arriviamo a un'affermazione più raffinata su f ( n ) :

Qui si può dire che la differenza tra la funzione e la sua approssimazione cresce approssimativamente come un 2 φ 2 ( n ) . L'idea è che dividendo la funzione per appropriate funzioni di normalizzazione e osservando il comportamento limitante del risultato, può dirci molto sul comportamento limitante della funzione originale stessa.

Informalmente, qualcosa del genere accade quando la somma, S n , di variabili casuali identicamente distribuite indipendenti, X 1 , …, X n , viene studiata nella teoria della probabilità classica. Se ogni X i ha media finita μ , allora per la legge dei grandi numeri, S n/nμ . Se inoltre ogni X i ha varianza finita σ 2 , allora per il teorema del limite centrale,

dove ξ è distribuito come N (0, σ 2 ) . Questo fornisce i valori delle prime due costanti nell'espansione informale

Nel caso in cui X i non abbia media o varianza finita, la convergenza della somma traslata e riscalata può avvenire anche con fattori di centratura e scala differenti:

o informalmente

Le distribuzioni Ξ che possono nascere in questo modo sono dette stabili . Chiaramente la distribuzione normale è stabile, ma esistono anche altre distribuzioni stabili, come la distribuzione di Cauchy , per le quali la media o la varianza non sono definite. Il fattore di scala b n può essere proporzionale a n c , per qualsiasi c1/2; può anche essere moltiplicato per una funzione che varia lentamente di n .

La legge del logaritmo iterato specifica cosa sta accadendo "tra" la legge dei grandi numeri e il teorema del limite centrale. Specificamente si dice che la funzione di normalizzazione n log log n , dimensioni intermedie tra n della legge dei grandi numeri e n del teorema limite centrale, offre un comportamento limite non banale.

Dichiarazioni alternative del teorema

Funzioni di densità

La densità della somma di due o più variabili indipendenti è la convoluzione delle loro densità (se esistono queste densità). Quindi il teorema del limite centrale può essere interpretato come un'affermazione sulle proprietà delle funzioni di densità sotto convoluzione: la convoluzione di un numero di funzioni di densità tende alla densità normale all'aumentare del numero di funzioni di densità senza limiti. Questi teoremi richiedono ipotesi più forti delle forme del teorema del limite centrale date sopra. I teoremi di questo tipo sono spesso chiamati teoremi del limite locale. Vedi Petrov per un particolare teorema del limite locale per somme di variabili casuali indipendenti e identicamente distribuite .

Funzioni caratteristiche

Poiché la funzione caratteristica di una convoluzione è il prodotto delle funzioni caratteristiche delle densità coinvolte, il teorema del limite centrale ha ancora un'altra riformulazione: il prodotto delle funzioni caratteristiche di un certo numero di funzioni di densità si avvicina alla funzione caratteristica della densità normale all'aumentare senza limiti del numero delle funzioni di densità, nelle condizioni sopra indicate. In particolare, è necessario applicare un fattore di scala appropriato all'argomento della funzione caratteristica.

Un'affermazione equivalente può essere fatta sulle trasformate di Fourier , poiché la funzione caratteristica è essenzialmente una trasformata di Fourier.

Calcolo della varianza

Sia S n la somma di n variabili casuali. Molti teoremi del limite centrale forniscono condizioni tali che S n / Var( S n ) converge in distribuzione a N (0,1) (la distribuzione normale con media 0, varianza 1) come n → ∞ . In alcuni casi è possibile trovare una costante σ 2 e una funzione f(n) tale che S n /(σ n⋅f ( n ) ) converga in distribuzione a N (0,1) come n → ∞ .

Lemma. Supponiamo che sia una sequenza di variabili casuali a valori reali e strettamente stazionarie con for all , , e . Costruire

  1. Se è assolutamente convergente, , e quindi come dove .
  2. Se in aggiunta e converge nella distribuzione ad as allora converge anche nella distribuzione ad as .

Estensioni

Prodotti di variabili casuali positive

Il logaritmo di un prodotto è semplicemente la somma dei logaritmi dei fattori. Pertanto, quando il logaritmo di un prodotto di variabili casuali che assumono solo valori positivi si avvicina a una distribuzione normale, il prodotto stesso si avvicina a una distribuzione lognormale . Molte grandezze fisiche (soprattutto massa o lunghezza, che sono una questione di scala e non possono essere negative) sono il prodotto di diversi fattori casuali , quindi seguono una distribuzione log-normale. Questa versione moltiplicativa del teorema del limite centrale è talvolta chiamata legge di Gibrat .

Mentre il teorema del limite centrale per le somme di variabili casuali richiede la condizione di varianza finita, il teorema corrispondente per i prodotti richiede la condizione corrispondente che la funzione di densità sia integrabile al quadrato.

Oltre il quadro classico

La normalità asintotica, cioè la convergenza alla distribuzione normale dopo opportuni shift e rescaling, è un fenomeno molto più generale del quadro classico trattato sopra, cioè somme di variabili casuali indipendenti (o vettori). Di tanto in tanto vengono rivelate nuove strutture; per ora non è disponibile un unico framework unificatore.

corpo convesso

Teorema. Esiste una successione ε n ↓ 0 per la quale vale quanto segue. Sia n ≥ 1 , e le variabili casuali X 1 , …, X n abbiano una densità congiunta log-concava f tale che f ( x 1 , …, x n ) = f (| x 1 |, …, | x n | ) per tutti x 1 , …, x n , ed E( X 2
k
) = 1
per ogni k = 1, …, n . Quindi la distribuzione di

è ε n -vicino a N (0,1) nella distanza di variazione totale .

Queste due distribuzioni ε n -close hanno densità (in effetti densità log-concave), quindi la distanza di varianza totale tra loro è l'integrale del valore assoluto della differenza tra le densità. La convergenza nella variazione totale è più forte della convergenza debole.

Un esempio importante di densità log-concava è una funzione costante all'interno di un dato corpo convesso e nulla all'esterno; corrisponde alla distribuzione uniforme sul corpo convesso, che spiega il termine "teorema del limite centrale per i corpi convessi".

Un altro esempio: f ( x 1 , …, x n ) = const · exp(−(| x 1 | α + ⋯ + | x n | α ) β ) dove α > 1 e αβ > 1 . Se β = 1 allora f ( x 1 , …, x n ) fattorizza in const · exp (−| x 1 | α ) … exp(−| x n | α ), il che significa che X 1 , …, X n sono indipendenti . In generale, tuttavia, sono dipendenti.

La condizione f ( x 1 , …, x n ) = f (| x 1 |, …, | x n |) assicura che X 1 , …, X n siano di media nulla e non correlati ; tuttavia, non devono essere indipendenti, e nemmeno indipendenti a coppie . A proposito, l'indipendenza a coppie non può sostituire l'indipendenza nel classico teorema del limite centrale.

Ecco un risultato di tipo Berry-Esseen .

Teorema. Sia X 1 , …, X n soddisfare le ipotesi del teorema precedente, allora

per tutti a < b ; dove C è una costante universale (assoluta) . Inoltre, per ogni c 1 , …, c n tale che c2
1
+ ⋯ + c2
n
= 1
,

La distribuzione di X 1 + ⋯ + X n/nnon deve essere approssimativamente normale (in effetti, può essere uniforme). Tuttavia, la distribuzione di c 1 X 1 + ⋯ + c n X n è vicina a N (0,1) (nella distanza di variazione totale) per la maggior parte dei vettori ( c 1 , …, c n ) secondo la distribuzione uniforme su la sfera c2
1
+ … + c2
n
= 1
.

Serie trigonometrica lacunare

Teorema ( SalemZygmund ): Sia U una variabile casuale distribuita uniformemente su (0,2π) , e X k = r k cos( n k U + a k ) , dove

  • n k soddisfano la condizione di lacunarità: esiste q > 1 tale che n k + 1qn k per ogni k ,
  • r k sono tali che
  • 0 ≤ un k < 2π .

Quindi

converge in distribuzione a N (0,1/2) .

politopi gaussiani

Teorema: Siano A 1 , …, A n punti casuali indipendenti sul piano 2 aventi ciascuno distribuzione normale standard bidimensionale. Sia K n l' inviluppo convesso di questi punti e X n l'area di K n Allora

converge in distribuzione a N (0,1) quando n tende all'infinito.

Lo stesso vale anche in tutte le dimensioni maggiori di 2.

Il politopo K n è detto politopo casuale gaussiano.

Un risultato simile vale per il numero di vertici (del politopo gaussiano), per il numero di spigoli e, di fatto, per le facce di tutte le dimensioni.

Funzioni lineari di matrici ortogonali

Una funzione lineare di una matrice M è una combinazione lineare dei suoi elementi (a coefficienti dati), M ↦ tr( AM ) dove A è la matrice dei coefficienti; vedi Traccia (algebra lineare)#Prodotto interno .

Una matrice ortogonale casuale si dice distribuita uniformemente se la sua distribuzione è la misura di Haar normalizzata sul gruppo ortogonale O( n , ) ; vedere Matrice di rotazione#Matrici di rotazione casuale uniforme .

Teorema. Sia M una matrice ortogonale casuale n × n distribuita uniformemente, e A una matrice n × n fissata tale che tr( AA *) = n , e sia X = tr( AM ) . Allora la distribuzione di X è prossima a N (0,1) nella metrica della variazione totale fino a2 3/n − 1.

sottosequenze

Teorema. Sia le variabili casuali X 1 , X 2 , … ∈ L 2 (Ω) tali che X n → 0 debolmente in L 2 (Ω) e X
n
→ 1
debolmente in L 1 (Ω) . Allora esistono interi n 1 < n 2 < tali che

converge in distribuzione a N (0,1) come k tende all'infinito.

Camminata casuale su un reticolo cristallino

Il teorema del limite centrale può essere stabilito per il semplice random walk su un reticolo cristallino (un grafo di copertura abeliano infinito su un grafo finito) e viene utilizzato per la progettazione di strutture cristalline.

Applicazioni ed esempi

Semplice esempio

Questa figura dimostra il teorema del limite centrale. Le medie campionarie vengono generate utilizzando un generatore di numeri casuali, che estrae numeri compresi tra 0 e 100 da una distribuzione di probabilità uniforme. Illustra che l'aumento delle dimensioni del campione fa sì che i 500 campioni misurati siano distribuiti più strettamente intorno alla media della popolazione (50 in questo caso). Inoltre confronta le distribuzioni osservate con le distribuzioni che ci si aspetterebbe per una distribuzione gaussiana normalizzata e mostra i valori del chi quadrato che quantificano la bontà dell'adattamento (l'adattamento è buono se il valore del chi quadrato ridotto è inferiore o approssimativamente uguale a uno). L'input nella funzione gaussiana normalizzata è la media delle medie campionarie (~50) e la deviazione standard del campione media divisa per la radice quadrata della dimensione del campione (~28,87/ n ), che è chiamata deviazione standard della media ( poiché si riferisce alla diffusione dei mezzi campionari).

Un semplice esempio del teorema del limite centrale è il lancio di molti dadi identici e imparziali. La distribuzione della somma (o media) dei numeri lanciati sarà ben approssimata da una distribuzione normale. Poiché le quantità del mondo reale sono spesso la somma bilanciata di molti eventi casuali non osservati, il teorema del limite centrale fornisce anche una spiegazione parziale per la prevalenza della normale distribuzione di probabilità. Giustifica anche l'approssimazione delle statistiche su grandi campioni alla distribuzione normale negli esperimenti controllati.

Confronto di funzioni di densità di probabilità, ** p ( k ) affinché la somma di n dadi equi a 6 facce mostri la loro convergenza a una distribuzione normale con n crescente , in accordo con il teorema del limite centrale. Nel grafico in basso a destra, i profili smussati dei grafici precedenti vengono ridimensionati, sovrapposti e confrontati con una distribuzione normale (curva nera).
Un'altra simulazione che utilizza la distribuzione binomiale. Sono stati generati 0 e 1 casuali e quindi le loro medie calcolate per dimensioni del campione comprese tra 1 e 512. Si noti che all'aumentare della dimensione del campione le code diventano più sottili e la distribuzione diventa più concentrata attorno alla media.

Applicazioni reali

La letteratura pubblicata contiene una serie di esempi e applicazioni utili e interessanti relativi al teorema del limite centrale. Una fonte riporta i seguenti esempi:

  • La distribuzione di probabilità per la distanza totale percorsa in una passeggiata aleatoria (biasata o non distorta) tenderà verso una distribuzione normale .
  • Lanciando molte monete si otterrà una distribuzione normale per il numero totale di teste (o equivalentemente per il numero totale di croci).

Da un altro punto di vista, il teorema del limite centrale spiega l'aspetto comune della "curva a campana" nelle stime di densità applicate ai dati del mondo reale. In casi come il rumore elettronico, i voti degli esami e così via, spesso possiamo considerare un singolo valore misurato come la media ponderata di molti piccoli effetti. Usando le generalizzazioni del teorema del limite centrale, possiamo quindi vedere che questo produrrebbe spesso (anche se non sempre) una distribuzione finale approssimativamente normale.

In generale, più una misura è come la somma di variabili indipendenti con uguale influenza sul risultato, più è normale. Ciò giustifica l'uso comune di questa distribuzione per sostituire gli effetti di variabili non osservate in modelli come il modello lineare .

Regressione

L'analisi di regressione ed in particolare dei minimi quadrati ordinari specifica che una variabile dipendente dipende secondo una qualche funzione da una o più variabili indipendenti , con un termine di errore additivo . Vari tipi di inferenza statistica sulla regressione presuppongono che il termine di errore sia distribuito normalmente. Questa ipotesi può essere giustificata assumendo che il termine di errore sia in realtà la somma di molti termini di errore indipendenti; anche se i singoli termini di errore non sono distribuiti normalmente, per il teorema del limite centrale la loro somma può essere ben approssimata da una distribuzione normale.

Altre illustrazioni

Data la sua importanza per la statistica, sono disponibili numerosi articoli e pacchetti informatici che dimostrano la convergenza coinvolta nel teorema del limite centrale.

Storia

Il matematico olandese Henk Tijms scrive:

Il teorema del limite centrale ha una storia interessante. La prima versione di questo teorema fu postulata dal matematico di origine francese Abraham de Moivre che, in un notevole articolo pubblicato nel 1733, utilizzò la distribuzione normale per approssimare la distribuzione del numero di teste risultante da molti lanci di una moneta equilibrata. Questa scoperta era molto in anticipo sui tempi e fu quasi dimenticata fino a quando il famoso matematico francese Pierre-Simon Laplace la salvò dall'oscurità nella sua opera monumentale Théorie analytique des probabilités , che fu pubblicata nel 1812. Laplace ampliò la scoperta di De Moivre approssimando il binomio distribuzione con la distribuzione normale. Ma come con De Moivre, la scoperta di Laplace ricevette poca attenzione ai suoi tempi. L'importanza del teorema del limite centrale fu individuata solo alla fine del XIX secolo, quando, nel 1901, il matematico russo Aleksandr Lyapunov lo definì in termini generali e dimostrò esattamente come funzionava matematicamente. Oggigiorno, il teorema del limite centrale è considerato il sovrano non ufficiale della teoria della probabilità.

Sir Francis Galton ha descritto il teorema del limite centrale in questo modo:

Non conosco quasi nulla di così adatto a impressionare l'immaginazione come la meravigliosa forma di ordine cosmico espressa dalla "Legge della Frequenza dell'Errore". La legge sarebbe stata personificata dai greci e deificata, se ne avessero saputo. Regna con serenità e in totale abnegazione, in mezzo alla confusione più selvaggia. Più grande è la folla e maggiore è l'apparente anarchia, più perfetto è il suo dominio. È la legge suprema dell'irragionevolezza. Ogni volta che un grande campione di elementi caotici viene preso in mano e schierato nell'ordine della loro grandezza, una forma di regolarità insospettata e bellissima si rivela sempre stata latente.

Il termine effettivo "teorema del limite centrale" (in tedesco: "zentraler Grenzwertsatz") fu usato per la prima volta da George Pólya nel 1920 nel titolo di un articolo. Pólya si riferiva al teorema come "centrale" a causa della sua importanza nella teoria della probabilità. Secondo Le Cam, la scuola di probabilità francese interpreta la parola centrale nel senso che "descrive il comportamento del centro della distribuzione rispetto alle sue code". L'abstract dell'articolo Sul teorema del limite centrale del calcolo della probabilità e il problema dei momenti di Pólya nel 1920 si traduce come segue.

Il verificarsi della densità di probabilità gaussiana 1 = e x 2 in esperimenti ripetuti, in errori di misurazione, che risultano nella combinazione di moltissimi e piccolissimi errori elementari, in processi di diffusione ecc., può essere spiegato, come pure- noto, dallo stesso teorema del limite, che gioca un ruolo centrale nel calcolo delle probabilità. L'effettivo scopritore di questo teorema del limite si chiamerà Laplace; è probabile che la sua prova rigorosa sia stata data per primo da Tschebyscheff e la sua formulazione più acuta si trova, per quanto mi risulta , in un articolo di Liapounoff . ...

Hald fornisce un resoconto completo della storia del teorema, che descrive in dettaglio il lavoro fondamentale di Laplace, nonché i contributi di Cauchy , Bessel e Poisson . Due resoconti storici, uno che copre lo sviluppo da Laplace a Cauchy, il secondo i contributi di von Mises , Pólya , Lindeberg , Lévy e Cramér durante gli anni '20, sono forniti da Hans Fischer. Le Cam descrive un periodo intorno al 1935. Bernstein presenta una discussione storica incentrata sul lavoro di Pafnuty Chebyshev e dei suoi studenti Andrey Markov e Aleksandr Lyapunov che ha portato alle prime prove del CLT in un contesto generale.

Una curiosa nota in calce alla storia del teorema del limite centrale è che una prova di un risultato simile al 1922 Lindeberg CLT è stato oggetto di Alan Turing 's 1934 Fellowship Tesi per King College presso l' Università di Cambridge . Solo dopo aver inviato il lavoro Turing ha appreso che era già stato dimostrato. Di conseguenza, la tesi di Turing non è stata pubblicata.

Guarda anche

Appunti

Riferimenti

link esterno