Teorema del limite centrale - Central limit theorem
In teoria della probabilità , il teorema del limite centrale ( CLT ) stabilisce che, in molte situazioni, quando si sommano variabili casuali indipendenti , la loro somma correttamente normalizzata tende verso una distribuzione normale (informalmente una curva a campana ) anche se le variabili originarie stesse non sono normalmente distribuito. Il teorema è un concetto chiave nella teoria della probabilità perché implica che i metodi probabilistici e statistici che funzionano per le distribuzioni normali possono essere applicabili a molti problemi che coinvolgono altri tipi di distribuzioni. Questo teorema ha visto molti cambiamenti durante lo sviluppo formale della teoria della probabilità. Le versioni precedenti del teorema risalgono al 1811, ma nella sua forma generale moderna, questo risultato fondamentale nella teoria della probabilità è stato affermato con precisione fino al 1920, fungendo così da ponte tra la teoria della probabilità classica e moderna.
Se sono campioni casuali estratti da una popolazione con media complessiva e varianza finita , e se è la media campionaria , allora la forma limite della distribuzione, , è una distribuzione normale standard.
Ad esempio, supponiamo che si ottenga un campione contenente molte osservazioni , ciascuna osservazione generata casualmente in modo non dipendente dai valori delle altre osservazioni, e che venga calcolata la media aritmetica dei valori osservati. Se questa procedura viene eseguita molte volte, il teorema del limite centrale afferma che la distribuzione di probabilità della media si avvicinerà molto a una distribuzione normale. Un semplice esempio di ciò è che se si lancia una moneta molte volte , la probabilità di ottenere un dato numero di teste si avvicinerà a una distribuzione normale, con la media pari alla metà del numero totale di lanci. Al limite di un numero infinito di lanci, sarà uguale a una distribuzione normale.
Il teorema del limite centrale ha diverse varianti. Nella sua forma comune, le variabili casuali devono essere distribuite in modo identico. Nelle varianti, la convergenza della media alla distribuzione normale avviene anche per distribuzioni non identiche o per osservazioni non indipendenti, se rispettano determinate condizioni.
La prima versione di questo teorema, secondo cui la distribuzione normale può essere usata come approssimazione alla distribuzione binomiale , è il teorema di de Moivre-Laplace .
Sequenze indipendenti
CLT classico
Sia un campione casuale di dimensioni , ovvero una sequenza di variabili casuali indipendenti e identicamente distribuite (iid) tratte da una distribuzione del valore atteso data da e varianza finita data da . Supponiamo di essere interessati alla media campionaria
di queste variabili casuali. Per la legge dei grandi numeri , le medie campionarie convergono quasi sicuramente (e quindi convergono anche in probabilità ) al valore atteso come . Il classico teorema del limite centrale descrive la dimensione e la forma distributiva delle fluttuazioni stocastiche attorno al numero deterministico durante questa convergenza. Più precisamente afferma che man mano che aumenta, la distribuzione della differenza tra la media campionaria e il suo limite , moltiplicata per il fattore ( cioè ) approssima la distribuzione normale con media 0 e varianza . Per n sufficientemente grande , la distribuzione di è vicina alla distribuzione normale con media e varianza . L'utilità del teorema è che la distribuzione si avvicina alla normalità indipendentemente dalla forma della distribuzione dell'individuo . Formalmente, il teorema può essere enunciato come segue:
Lindeberg–Lévy CLT. Supponiamo che sia una sequenza di variabili casuali iid con e . Quindi quando si avvicina all'infinito, le variabili casuali convergono nella distribuzione a una normale :
Nel caso , convergenza in distribuzione significa che le funzioni cumulative di distribuzione di convergono puntualmente alla cdf della distribuzione: per ogni numero reale ,
dove è il cdf normale standard valutato in . La convergenza è uniforme nel senso che
dove denota il minimo limite superiore (o supremo ) dell'insieme.
Lyapunov CLT
Il teorema prende il nome dal matematico russo Aleksandr Lyapunov . In questa variante del teorema del limite centrale le variabili casuali devono essere indipendenti, ma non necessariamente distribuite identicamente. Il teorema richiede anche che le variabili aleatorie hanno momenti di un ordine , e che il tasso di crescita di questi momenti è limitata dalla condizione Lyapunov indicato di seguito.
Lyapunov CLT. Supponiamo che sia una sequenza di variabili casuali indipendenti, ciascuna con valore atteso finito e varianza . Definire
Se per alcuni , la condizione di Lyapunov
è soddisfatta, allora una somma di converge in distribuzione a una variabile casuale normale standard, come va all'infinito:
In pratica, di solito è più facile controllare le condizioni di Lyapunov per .
Se una sequenza di variabili casuali soddisfa la condizione di Lyapunov, allora soddisfa anche la condizione di Lindeberg. L'implicazione inversa, tuttavia, non regge.
Lindeberg CLT
Nella stessa impostazione e con la stessa notazione di cui sopra, la condizione di Lyapunov può essere sostituita con la seguente più debole (da Lindeberg nel 1920).
Supponiamo che per ogni
dove è la funzione dell'indicatore . Allora la distribuzione delle somme standardizzate
converge verso la distribuzione normale standard .
Multidimensionale CLT
Le dimostrazioni che utilizzano funzioni caratteristiche possono essere estese ai casi in cui ogni individuo è un vettore casuale in , con vettore medio e matrice di covarianza (tra le componenti del vettore), e questi vettori casuali sono indipendenti e distribuiti identicamente. La somma di questi vettori viene eseguita per componente. Il teorema del limite centrale multidimensionale afferma che quando scalate, le somme convergono a una distribuzione normale multivariata .
Permettere
essere il k -vettore. Il grassetto in significa che si tratta di un vettore casuale, non di una variabile casuale (univariata). Allora la somma dei vettori casuali sarà
e la media è
e quindi
Il teorema del limite centrale multivariato afferma che
dove la matrice di covarianza è uguale a
Il tasso di convergenza è dato dal seguente risultato di tipo Berry-Esseen :
Teorema. Siano vettori casuali a valori indipendenti , ciascuno avente media zero. Scrivere e assumere è invertibile. Sia una gaussiana tridimensionale con la stessa media e la stessa matrice di covarianza di . Allora per tutti gli insiemi convessi ,
dove è una costante universale, , e denota la norma euclidea su .
Non è noto se il fattore sia necessario.
Teorema generalizzato
Il teorema del limite centrale afferma che la somma di un numero di variabili casuali indipendenti e identicamente distribuite con varianze finite tenderà a una distribuzione normale all'aumentare del numero di variabili. Una generalizzazione dovuta a Gnedenko e Kolmogorov afferma che la somma di un numero di variabili casuali con distribuzioni tail power-law ( tail paretiana ) decrescente come dove (e quindi con varianza infinita) tenderà ad una distribuzione stabile al crescere del numero di addizioni . Se poi la somma converge ad una distribuzione stabile con parametro di stabilità pari a 2, cioè una distribuzione gaussiana.
Processi dipendenti
CLT in condizioni di dipendenza debole
Un'utile generalizzazione di una sequenza di variabili casuali indipendenti e identicamente distribuite è un processo casuale di mescolamento in tempo discreto; "mescolamento" significa, grosso modo, che variabili casuali temporalmente distanti l'una dall'altra sono quasi indipendenti. Diversi tipi di mescolamento sono usati nella teoria ergodica e nella teoria della probabilità. Vedere la miscelazione particolarmente forte (chiamata anche miscelazione α) definita da dove è il cosiddetto coefficiente di miscelazione forte .
Una formulazione semplificata del teorema del limite centrale sotto forte miscelazione è:
Teorema. Supponiamo che sia stazionario e -miscendo con e che e . Indica , quindi il limite
esiste, e se allora converge in distribuzione a .
Infatti,
dove la serie converge assolutamente.
L'assunzione non può essere omessa, poiché la normalità asintotica fallisce per dove sono un'altra sequenza stazionaria .
Esiste una versione più forte del teorema: l'assunzione viene sostituita con , e l'assunzione viene sostituita con
L'esistenza di tale assicura la conclusione. Per il trattamento enciclopedico dei teoremi limite in condizioni di mescolamento si veda ( Bradley 2007 ).
Differenza Martingala CLT
Teorema . Lascia che una martingala soddisfi
- in probabilità come n → ∞ ,
- per ogni ε > 0 , come n → ∞ ,
allora converge nella distribuzione ad as .
Attenzione: l' aspettativa ristretta non deve essere confusa con l'aspettativa condizionale .
Osservazioni
Dimostrazione del classico CLT
Il teorema del limite centrale ha una dimostrazione usando funzioni caratteristiche . È simile alla dimostrazione della legge (debole) dei grandi numeri .
Assumiamo che siano variabili casuali indipendenti e identicamente distribuite, ciascuna con media e varianza finita . La somma ha media e varianza . Considera la variabile casuale
dove nell'ultimo passaggio abbiamo definito le nuove variabili casuali , ciascuna con media nulla e varianza unitaria ( ). La funzione caratteristica di è data da
dove nell'ultimo passaggio abbiamo utilizzato il fatto che tutti sono distribuiti in modo identico. La funzione caratteristica di è, per il teorema di Taylor ,
dove è " poca notazione o " per una funzione di che va a zero più rapidamente di . Per il limite della funzione esponenziale ( ), la funzione caratteristica di uguale
Tutti i termini di ordine superiore svaniscono nel limite . Il membro di destra è uguale alla funzione caratteristica di una distribuzione normale standard , che implica attraverso il teorema di continuità di Lévy che la distribuzione di si avvicini a . Pertanto, la media campionaria
è tale che
converge alla distribuzione normale , da cui segue il teorema del limite centrale.
Convergenza al limite
Il teorema del limite centrale fornisce solo una distribuzione asintotica . Come approssimazione per un numero finito di osservazioni, fornisce un'approssimazione ragionevole solo quando vicino al picco della distribuzione normale; richiede un numero molto elevato di osservazioni per estendersi fino alle code.
La convergenza nel teorema del limite centrale è uniforme perché la funzione di distribuzione cumulativa limite è continua. Se il terzo momento centrale esiste ed è finito, allora la velocità di convergenza è almeno dell'ordine di (vedi teorema di Berry-Esseen ). Il metodo di Stein può essere utilizzato non solo per dimostrare il teorema del limite centrale, ma anche per fornire limiti sui tassi di convergenza per metriche selezionate.
La convergenza alla distribuzione normale è monotona, nel senso che l' entropia di aumenta monotonicamente a quella della distribuzione normale.
Il teorema del limite centrale si applica in particolare alle somme di variabili casuali discrete indipendenti e identicamente distribuite . Una somma di variabili casuali discrete è ancora una variabile casuale discreta , per cui ci troviamo di fronte a una sequenza di variabili casuali discrete la cui funzione di distribuzione di probabilità cumulativa converge verso una funzione di distribuzione di probabilità cumulata corrispondente ad una variabile continua (cioè quella della distribuzione normale ) . Ciò significa che se costruiamo un istogramma delle realizzazioni della somma di n variabili discrete identiche indipendenti, la curva che unisce i centri delle facce superiori dei rettangoli che formano l'istogramma converge verso una curva gaussiana quando n tende all'infinito, questa relazione è noto come teorema di de Moivre-Laplace . L' articolo sulla distribuzione binomiale descrive in dettaglio tale applicazione del teorema del limite centrale nel caso semplice di una variabile discreta che assume solo due possibili valori.
Relazione con la legge dei grandi numeri
La legge dei grandi numeri e il teorema del limite centrale sono soluzioni parziali a un problema generale: "Qual è il comportamento limite di S n quando n tende all'infinito?" Nell'analisi matematica, le serie asintotiche sono uno degli strumenti più utilizzati per affrontare tali questioni.
Supponiamo di avere uno sviluppo asintotico di :
Dividendo entrambi parti in φ 1 ( n ) e prendendo il limite produrrà un 1 , il coefficiente del termine di ordine più alto in espansione, che rappresenta il tasso al quale f ( n ) cambia nel suo termine principale.
Informale, si può dire: " f ( n ) cresce approssimativamente come un 1 φ 1 ( n ) ". Prendendo la differenza tra f ( n ) e la sua approssimazione e quindi dividendo per il termine successivo nell'espansione, arriviamo a un'affermazione più raffinata su f ( n ) :
Qui si può dire che la differenza tra la funzione e la sua approssimazione cresce approssimativamente come un 2 φ 2 ( n ) . L'idea è che dividendo la funzione per appropriate funzioni di normalizzazione e osservando il comportamento limitante del risultato, può dirci molto sul comportamento limitante della funzione originale stessa.
Informalmente, qualcosa del genere accade quando la somma, S n , di variabili casuali identicamente distribuite indipendenti, X 1 , …, X n , viene studiata nella teoria della probabilità classica. Se ogni X i ha media finita μ , allora per la legge dei grandi numeri, S n/n→ μ . Se inoltre ogni X i ha varianza finita σ 2 , allora per il teorema del limite centrale,
dove ξ è distribuito come N (0, σ 2 ) . Questo fornisce i valori delle prime due costanti nell'espansione informale
Nel caso in cui X i non abbia media o varianza finita, la convergenza della somma traslata e riscalata può avvenire anche con fattori di centratura e scala differenti:
o informalmente
Le distribuzioni Ξ che possono nascere in questo modo sono dette stabili . Chiaramente la distribuzione normale è stabile, ma esistono anche altre distribuzioni stabili, come la distribuzione di Cauchy , per le quali la media o la varianza non sono definite. Il fattore di scala b n può essere proporzionale a n c , per qualsiasi c ≥1/2; può anche essere moltiplicato per una funzione che varia lentamente di n .
La legge del logaritmo iterato specifica cosa sta accadendo "tra" la legge dei grandi numeri e il teorema del limite centrale. Specificamente si dice che la funzione di normalizzazione √ n log log n , dimensioni intermedie tra n della legge dei grandi numeri e √ n del teorema limite centrale, offre un comportamento limite non banale.
Dichiarazioni alternative del teorema
Funzioni di densità
La densità della somma di due o più variabili indipendenti è la convoluzione delle loro densità (se esistono queste densità). Quindi il teorema del limite centrale può essere interpretato come un'affermazione sulle proprietà delle funzioni di densità sotto convoluzione: la convoluzione di un numero di funzioni di densità tende alla densità normale all'aumentare del numero di funzioni di densità senza limiti. Questi teoremi richiedono ipotesi più forti delle forme del teorema del limite centrale date sopra. I teoremi di questo tipo sono spesso chiamati teoremi del limite locale. Vedi Petrov per un particolare teorema del limite locale per somme di variabili casuali indipendenti e identicamente distribuite .
Funzioni caratteristiche
Poiché la funzione caratteristica di una convoluzione è il prodotto delle funzioni caratteristiche delle densità coinvolte, il teorema del limite centrale ha ancora un'altra riformulazione: il prodotto delle funzioni caratteristiche di un certo numero di funzioni di densità si avvicina alla funzione caratteristica della densità normale all'aumentare senza limiti del numero delle funzioni di densità, nelle condizioni sopra indicate. In particolare, è necessario applicare un fattore di scala appropriato all'argomento della funzione caratteristica.
Un'affermazione equivalente può essere fatta sulle trasformate di Fourier , poiché la funzione caratteristica è essenzialmente una trasformata di Fourier.
Calcolo della varianza
Sia S n la somma di n variabili casuali. Molti teoremi del limite centrale forniscono condizioni tali che S n / √ Var( S n ) converge in distribuzione a N (0,1) (la distribuzione normale con media 0, varianza 1) come n → ∞ . In alcuni casi è possibile trovare una costante σ 2 e una funzione f(n) tale che S n /(σ √ n⋅f ( n ) ) converga in distribuzione a N (0,1) come n → ∞ .
Lemma. Supponiamo che sia una sequenza di variabili casuali a valori reali e strettamente stazionarie con for all , , e . Costruire
- Se è assolutamente convergente, , e quindi come dove .
- Se in aggiunta e converge nella distribuzione ad as allora converge anche nella distribuzione ad as .
Estensioni
Prodotti di variabili casuali positive
Il logaritmo di un prodotto è semplicemente la somma dei logaritmi dei fattori. Pertanto, quando il logaritmo di un prodotto di variabili casuali che assumono solo valori positivi si avvicina a una distribuzione normale, il prodotto stesso si avvicina a una distribuzione lognormale . Molte grandezze fisiche (soprattutto massa o lunghezza, che sono una questione di scala e non possono essere negative) sono il prodotto di diversi fattori casuali , quindi seguono una distribuzione log-normale. Questa versione moltiplicativa del teorema del limite centrale è talvolta chiamata legge di Gibrat .
Mentre il teorema del limite centrale per le somme di variabili casuali richiede la condizione di varianza finita, il teorema corrispondente per i prodotti richiede la condizione corrispondente che la funzione di densità sia integrabile al quadrato.
Oltre il quadro classico
La normalità asintotica, cioè la convergenza alla distribuzione normale dopo opportuni shift e rescaling, è un fenomeno molto più generale del quadro classico trattato sopra, cioè somme di variabili casuali indipendenti (o vettori). Di tanto in tanto vengono rivelate nuove strutture; per ora non è disponibile un unico framework unificatore.
corpo convesso
Teorema. Esiste una successione ε n ↓ 0 per la quale vale quanto segue. Sia n ≥ 1 , e le variabili casuali X 1 , …, X n abbiano una densità congiunta log-concava f tale che f ( x 1 , …, x n ) = f (| x 1 |, …, | x n | ) per tutti x 1 , …, x n , ed E( X 2
k) = 1 per ogni k = 1, …, n . Quindi la distribuzione di
è ε n -vicino a N (0,1) nella distanza di variazione totale .
Queste due distribuzioni ε n -close hanno densità (in effetti densità log-concave), quindi la distanza di varianza totale tra loro è l'integrale del valore assoluto della differenza tra le densità. La convergenza nella variazione totale è più forte della convergenza debole.
Un esempio importante di densità log-concava è una funzione costante all'interno di un dato corpo convesso e nulla all'esterno; corrisponde alla distribuzione uniforme sul corpo convesso, che spiega il termine "teorema del limite centrale per i corpi convessi".
Un altro esempio: f ( x 1 , …, x n ) = const · exp(−(| x 1 | α + ⋯ + | x n | α ) β ) dove α > 1 e αβ > 1 . Se β = 1 allora f ( x 1 , …, x n ) fattorizza in const · exp (−| x 1 | α ) … exp(−| x n | α ), il che significa che X 1 , …, X n sono indipendenti . In generale, tuttavia, sono dipendenti.
La condizione f ( x 1 , …, x n ) = f (| x 1 |, …, | x n |) assicura che X 1 , …, X n siano di media nulla e non correlati ; tuttavia, non devono essere indipendenti, e nemmeno indipendenti a coppie . A proposito, l'indipendenza a coppie non può sostituire l'indipendenza nel classico teorema del limite centrale.
Ecco un risultato di tipo Berry-Esseen .
Teorema. Sia X 1 , …, X n soddisfare le ipotesi del teorema precedente, allora
per tutti a < b ; dove C è una costante universale (assoluta) . Inoltre, per ogni c 1 , …, c n ∈ ℝ tale che c2
1+ ⋯ + c2
n= 1 ,
La distribuzione di X 1 + ⋯ + X n/√ nnon deve essere approssimativamente normale (in effetti, può essere uniforme). Tuttavia, la distribuzione di c 1 X 1 + ⋯ + c n X n è vicina a N (0,1) (nella distanza di variazione totale) per la maggior parte dei vettori ( c 1 , …, c n ) secondo la distribuzione uniforme su la sfera c2
1+ … + c2
n= 1 .
Serie trigonometrica lacunare
Teorema ( Salem – Zygmund ): Sia U una variabile casuale distribuita uniformemente su (0,2π) , e X k = r k cos( n k U + a k ) , dove
- n k soddisfano la condizione di lacunarità: esiste q > 1 tale che n k + 1 ≥ qn k per ogni k ,
- r k sono tali che
- 0 ≤ un k < 2π .
Quindi
converge in distribuzione a N (0,1/2) .
politopi gaussiani
Teorema: Siano A 1 , …, A n punti casuali indipendenti sul piano ℝ 2 aventi ciascuno distribuzione normale standard bidimensionale. Sia K n l' inviluppo convesso di questi punti e X n l'area di K n Allora
converge in distribuzione a N (0,1) quando n tende all'infinito.
Lo stesso vale anche in tutte le dimensioni maggiori di 2.
Il politopo K n è detto politopo casuale gaussiano.
Un risultato simile vale per il numero di vertici (del politopo gaussiano), per il numero di spigoli e, di fatto, per le facce di tutte le dimensioni.
Funzioni lineari di matrici ortogonali
Una funzione lineare di una matrice M è una combinazione lineare dei suoi elementi (a coefficienti dati), M ↦ tr( AM ) dove A è la matrice dei coefficienti; vedi Traccia (algebra lineare)#Prodotto interno .
Una matrice ortogonale casuale si dice distribuita uniformemente se la sua distribuzione è la misura di Haar normalizzata sul gruppo ortogonale O( n , ℝ ) ; vedere Matrice di rotazione#Matrici di rotazione casuale uniforme .
Teorema. Sia M una matrice ortogonale casuale n × n distribuita uniformemente, e A una matrice n × n fissata tale che tr( AA *) = n , e sia X = tr( AM ) . Allora la distribuzione di X è prossima a N (0,1) nella metrica della variazione totale fino a2 √ 3/n − 1.
sottosequenze
Teorema. Sia le variabili casuali X 1 , X 2 , … ∈ L 2 (Ω) tali che X n → 0 debolmente in L 2 (Ω) e X
n→ 1 debolmente in L 1 (Ω) . Allora esistono interi n 1 < n 2 < tali che
converge in distribuzione a N (0,1) come k tende all'infinito.
Camminata casuale su un reticolo cristallino
Il teorema del limite centrale può essere stabilito per il semplice random walk su un reticolo cristallino (un grafo di copertura abeliano infinito su un grafo finito) e viene utilizzato per la progettazione di strutture cristalline.
Applicazioni ed esempi
Semplice esempio
Un semplice esempio del teorema del limite centrale è il lancio di molti dadi identici e imparziali. La distribuzione della somma (o media) dei numeri lanciati sarà ben approssimata da una distribuzione normale. Poiché le quantità del mondo reale sono spesso la somma bilanciata di molti eventi casuali non osservati, il teorema del limite centrale fornisce anche una spiegazione parziale per la prevalenza della normale distribuzione di probabilità. Giustifica anche l'approssimazione delle statistiche su grandi campioni alla distribuzione normale negli esperimenti controllati.
Applicazioni reali
La letteratura pubblicata contiene una serie di esempi e applicazioni utili e interessanti relativi al teorema del limite centrale. Una fonte riporta i seguenti esempi:
- La distribuzione di probabilità per la distanza totale percorsa in una passeggiata aleatoria (biasata o non distorta) tenderà verso una distribuzione normale .
- Lanciando molte monete si otterrà una distribuzione normale per il numero totale di teste (o equivalentemente per il numero totale di croci).
Da un altro punto di vista, il teorema del limite centrale spiega l'aspetto comune della "curva a campana" nelle stime di densità applicate ai dati del mondo reale. In casi come il rumore elettronico, i voti degli esami e così via, spesso possiamo considerare un singolo valore misurato come la media ponderata di molti piccoli effetti. Usando le generalizzazioni del teorema del limite centrale, possiamo quindi vedere che questo produrrebbe spesso (anche se non sempre) una distribuzione finale approssimativamente normale.
In generale, più una misura è come la somma di variabili indipendenti con uguale influenza sul risultato, più è normale. Ciò giustifica l'uso comune di questa distribuzione per sostituire gli effetti di variabili non osservate in modelli come il modello lineare .
Regressione
L'analisi di regressione ed in particolare dei minimi quadrati ordinari specifica che una variabile dipendente dipende secondo una qualche funzione da una o più variabili indipendenti , con un termine di errore additivo . Vari tipi di inferenza statistica sulla regressione presuppongono che il termine di errore sia distribuito normalmente. Questa ipotesi può essere giustificata assumendo che il termine di errore sia in realtà la somma di molti termini di errore indipendenti; anche se i singoli termini di errore non sono distribuiti normalmente, per il teorema del limite centrale la loro somma può essere ben approssimata da una distribuzione normale.
Altre illustrazioni
Data la sua importanza per la statistica, sono disponibili numerosi articoli e pacchetti informatici che dimostrano la convergenza coinvolta nel teorema del limite centrale.
Storia
Il matematico olandese Henk Tijms scrive:
Il teorema del limite centrale ha una storia interessante. La prima versione di questo teorema fu postulata dal matematico di origine francese Abraham de Moivre che, in un notevole articolo pubblicato nel 1733, utilizzò la distribuzione normale per approssimare la distribuzione del numero di teste risultante da molti lanci di una moneta equilibrata. Questa scoperta era molto in anticipo sui tempi e fu quasi dimenticata fino a quando il famoso matematico francese Pierre-Simon Laplace la salvò dall'oscurità nella sua opera monumentale Théorie analytique des probabilités , che fu pubblicata nel 1812. Laplace ampliò la scoperta di De Moivre approssimando il binomio distribuzione con la distribuzione normale. Ma come con De Moivre, la scoperta di Laplace ricevette poca attenzione ai suoi tempi. L'importanza del teorema del limite centrale fu individuata solo alla fine del XIX secolo, quando, nel 1901, il matematico russo Aleksandr Lyapunov lo definì in termini generali e dimostrò esattamente come funzionava matematicamente. Oggigiorno, il teorema del limite centrale è considerato il sovrano non ufficiale della teoria della probabilità.
Sir Francis Galton ha descritto il teorema del limite centrale in questo modo:
Non conosco quasi nulla di così adatto a impressionare l'immaginazione come la meravigliosa forma di ordine cosmico espressa dalla "Legge della Frequenza dell'Errore". La legge sarebbe stata personificata dai greci e deificata, se ne avessero saputo. Regna con serenità e in totale abnegazione, in mezzo alla confusione più selvaggia. Più grande è la folla e maggiore è l'apparente anarchia, più perfetto è il suo dominio. È la legge suprema dell'irragionevolezza. Ogni volta che un grande campione di elementi caotici viene preso in mano e schierato nell'ordine della loro grandezza, una forma di regolarità insospettata e bellissima si rivela sempre stata latente.
Il termine effettivo "teorema del limite centrale" (in tedesco: "zentraler Grenzwertsatz") fu usato per la prima volta da George Pólya nel 1920 nel titolo di un articolo. Pólya si riferiva al teorema come "centrale" a causa della sua importanza nella teoria della probabilità. Secondo Le Cam, la scuola di probabilità francese interpreta la parola centrale nel senso che "descrive il comportamento del centro della distribuzione rispetto alle sue code". L'abstract dell'articolo Sul teorema del limite centrale del calcolo della probabilità e il problema dei momenti di Pólya nel 1920 si traduce come segue.
Il verificarsi della densità di probabilità gaussiana 1 = e − x 2 in esperimenti ripetuti, in errori di misurazione, che risultano nella combinazione di moltissimi e piccolissimi errori elementari, in processi di diffusione ecc., può essere spiegato, come pure- noto, dallo stesso teorema del limite, che gioca un ruolo centrale nel calcolo delle probabilità. L'effettivo scopritore di questo teorema del limite si chiamerà Laplace; è probabile che la sua prova rigorosa sia stata data per primo da Tschebyscheff e la sua formulazione più acuta si trova, per quanto mi risulta , in un articolo di Liapounoff . ...
Hald fornisce un resoconto completo della storia del teorema, che descrive in dettaglio il lavoro fondamentale di Laplace, nonché i contributi di Cauchy , Bessel e Poisson . Due resoconti storici, uno che copre lo sviluppo da Laplace a Cauchy, il secondo i contributi di von Mises , Pólya , Lindeberg , Lévy e Cramér durante gli anni '20, sono forniti da Hans Fischer. Le Cam descrive un periodo intorno al 1935. Bernstein presenta una discussione storica incentrata sul lavoro di Pafnuty Chebyshev e dei suoi studenti Andrey Markov e Aleksandr Lyapunov che ha portato alle prime prove del CLT in un contesto generale.
Una curiosa nota in calce alla storia del teorema del limite centrale è che una prova di un risultato simile al 1922 Lindeberg CLT è stato oggetto di Alan Turing 's 1934 Fellowship Tesi per King College presso l' Università di Cambridge . Solo dopo aver inviato il lavoro Turing ha appreso che era già stato dimostrato. Di conseguenza, la tesi di Turing non è stata pubblicata.
Guarda anche
- Proprietà di equipartizione asintotica
- Distribuzione asintotica
- Distribuzione Bates
- Legge di Benford – Risultato dell'estensione del CLT al prodotto di variabili casuali.
- Teorema di Berry-Esseen
- Teorema del limite centrale per la statistica direzionale – Teorema del limite centrale applicato al caso della statistica direzionale
- Metodo delta – per calcolare la distribuzione limite di una funzione di una variabile casuale.
- Teorema di Erdős-Kac - collega il numero di fattori primi di un intero con la normale distribuzione di probabilità
- Teorema di Fisher-Tippett-Gnedenko - teorema limite per valori estremi (come max{ X n })
- Distribuzione Irwin–Hall
- Teorema del limite centrale della catena di Markov
- Distribuzione normale
- Teorema di convergenza di Tweedie - Un teorema che può essere considerato un ponte tra il teorema del limite centrale e il teorema della convergenza di Poisson
Appunti
Riferimenti
- Bárány, Imre ; Vu, Van (2007). "Teoremi limite centrale per politopi gaussiani". Annali di probabilità . Istituto di statistica matematica. 35 (4): 1593–1621. arXiv : math/0610192 . doi : 10.1214/009117906000000791 . S2CID 9128253 .
- Bauer, Heinz (2001). Teoria della Misura e dell'Integrazione . Berlino: de Gruyter. ISBN 3110167190.
- Billingsley, Patrick (1995). Probabilità e misura (3a ed.). John Wiley & Figli. ISBN 0-471-00710-2.
- Bradley, Richard (2007). Introduzione alle condizioni di miscelazione forte (1a ed.). Heber City, UT: Kendrick Press. ISBN 978-0-9740427-9-4.
- Bradley, Richard (2005). "Proprietà di base di condizioni di miscelazione forti. Un sondaggio e alcune domande aperte". Indagini di probabilità . 2 : 107-144. arXiv : math/0511078 . Bibcode : 2005math.....11078B . doi : 10.1214/154957805100000104 . S2CID 8395267 .
- Dinov, Ivo; Christou, Nicolas; Sanchez, Juana (2008). "Teorema del limite centrale: nuova applet SOCR e attività dimostrativa" . Giornale di educazione statistica . COME UN. 16 (2): 1–15. doi : 10.1080/10691898.2008.11889560 . PMC 3.152.447 . PMID 21833159 .
- Durrett, Richard (2004). Probabilità: teoria ed esempi (3a ed.). Cambridge University Press. ISBN 0521765390.
- Gaposhkin, VF (1966). "Serie lacunarie e funzioni indipendenti". Indagini matematiche russe . 21 (6): 1–82. Bibcode : 1966RuMaS..21....1G . doi : 10.1070/RM1966v021n06ABEH001196 ..
- Klartag, Bo'az (2007). "Un teorema limite centrale per insiemi convessi". Invenzioni matematiche . 168 (1): 91-131. arXiv : math/0605014 . Bibcode : 2007InMat.168...91K . doi : 10.1007/s00222-006-0028-8 . S2CID 119169773 .
- Klartag, Bo'az (2008). "Una disuguaglianza di tipo Berry-Esseen per corpi convessi con una base incondizionata". Teoria della probabilità e campi correlati . 145 (1–2): 1–33. arXiv : 0705.0832 . doi : 10.1007/s00440-008-0158-6 . S2CID 10163322 .
link esterno
- Teorema del limite centrale alla Khan Academy
- "Teorema del limite centrale" , Encyclopedia of Mathematics , EMS Press , 2001 [1994]
- Weisstein, Eric W. "Teorema del limite centrale" . MathWorld .