Legge dei grandi numeri

Questa voce o sezione sull'argomento matematica non cita le fonti necessarie o quelle presenti sono insufficienti.

La legge dei grandi numeri, detta anche teorema di Bernoulli (in quanto la sua prima formulazione è dovuta a Jakob Bernoulli), descrive il comportamento della media di una sequenza di $n$ prove di una variabile casuale, indipendenti e caratterizzate dalla stessa distribuzione di probabilità ( $n$ misure della stessa grandezza, $n$ lanci della stessa moneta, ecc.), al tendere ad infinito della numerosità $n$ della sequenza stessa.

Secondo la legge dei grandi numeri è ragionevolmente sicuro che la media, che determiniamo a partire da un numero sufficiente di campioni, sia sufficientemente vicina alla media vera, ovvero quella calcolabile teoricamente. Che cosa significhi "ragionevolmente sicuri" dipende da quanto vogliamo essere precisi nel nostro test: con dieci prove, avremmo una stima grossolana, con cento, ne otterremmo una molto più precisa, con mille, ancora di più, e così via: il valore di $n$ che siamo disposti ad accettare come sufficiente dipende dal grado di casualità che riteniamo necessario per il dato in questione.

In termini generici, per la legge dei grandi numeri si può dire:

che la media della sequenza è un'approssimazione, che migliora al crescere di $n,$ della media della distribuzione, e
che, viceversa, si può prevedere che sequenze siffatte mostreranno una media tanto più spesso e tanto più precisamente prossima alla media della distribuzione quanto più grande sarà $n$ .

Un caso particolare di applicazione della legge dei grandi numeri è la previsione probabilistica della proporzione di successi in una successione di $n$ realizzazioni indipendenti di un evento $E,$ ossia la frequenza di $E$ nelle $n$ misurazioni: per $n$ che tende a infinito, la proporzione di successi converge alla probabilità di $E$ .

Unita a questa si ha un'altra nozione interessante, ossia la legge dei piccoli numeri, che va al di là del concetto di equiprobabilità e considera la dimensione del campione rispetto ai possibili eventi e conseguenti esiti. In particolare, a seguito di esperimenti ripetuti considerando un campione più piccolo, è molto più semplice allontanarsi dal valore atteso, banalmente perché avendo meno valori da considerare vi è più probabilità che essa si approssimi ad un certo valore, sottostimando il numero di campioni per stime accurate. Essa fu teorizzata da Kahneman.^[1]

Legge forte dei grandi numeri

Se, data una successione di variabili casuali $X_{1},X_{2},\ldots ,X_{n},\ldots$ indipendenti e identicamente distribuite con media (finita) ${\mu }$ , si considera la media campionaria

{\bar {X}}_{n}={\frac {X_{1}+X_{2}+\cdots +X_{n}}{n}}

la legge (forte) dei grandi numeri afferma che

\operatorname {P} \left(\lim _{n\rightarrow \infty }{\bar {X}}_{n}=\mu \right)=1,

ossia lo stimatore media campionaria converge quasi certamente al valore atteso comune delle $X_{i}$ .

Legge debole dei grandi numeri

Se, data una successione di variabili casuali $X_{1},X_{2},\ldots ,X_{n},\ldots$ aventi la stessa media ${\mu }$ , la stessa varianza finita e indipendenti, si considera la media campionaria

{\bar {X}}_{n}={\frac {X_{1}+X_{2}+\cdots +X_{n}}{n}}

la legge (debole) dei grandi numeri afferma che per ogni $\ \varepsilon >0$ :

\lim _{n\rightarrow \infty }\operatorname {P} \left(\left|{\bar {X}}_{n}-\mu \right|<\varepsilon \right)=1.

ossia la media campionaria converge in probabilità al valore atteso comune alle $X_{i}$ .

Con maggior rigore

Sia $\{(\Omega _{i},{\mathcal {A}}_{i},\operatorname {P} _{i})\}_{i\in \mathbb {N} }$ una successione di spazi di probabilità. Si consideri lo spazio prodotto $(\Omega ,{\mathcal {A}},\operatorname {P} )$ e in esso una successione bernoulliana di eventi (stocasticamente indipendenti e con probabilità costante $p$ ) $\{E_{k}\}_{k\in \mathbb {N} }\subseteq {\mathcal {A}}$ . Assegnato un elemento $\omega \in \Omega$ si definisce la frequenza di successo in $n$ prove $\phi _{n}(\omega )={\tfrac {N_{n}}{n}}$ , dove $\phi _{n}\colon \Omega \to \mathbb {R}$ e $N_{n}=\#\{i:\omega \in E_{i}\}_{i=1}^{n}$ indica il numero di successi ottenuti in $n$ prove.

Dimostrazione della legge debole dei grandi numeri

Nelle condizioni sopra enunciate, si vuole dimostrare che:

\forall \varepsilon \in \mathbb {R} _{0}^{+},\lim _{n\to \infty }\operatorname {P} \{\omega \in \Omega :|\phi _{n}(\omega )-p|>\varepsilon \}=0

Fissato $\varepsilon$ , si consideri la disuguaglianza di Bienaymé-Čebyšëv:

\operatorname {P} \{\omega \in \Omega :|\phi _{n}(\omega )-\operatorname {E} (\phi _{n})|>\varepsilon \}\leq {\frac {\operatorname {var} (\phi _{n})}{\varepsilon ^{2}}}

;

poiché $N_{n}$ è distribuito in modo binomiale, il suo valore atteso è

\operatorname {E} (N_{n})=np,

e la sua varianza è

\operatorname {var} (N_{n})=np(1-p);

abbiamo allora che il valore atteso e la varianza di $\phi _{n}$ sono, rispettivamente:

\operatorname {E} (\phi _{n})=\operatorname {E} \left({\frac {N_{n}}{n}}\right)={\frac {\operatorname {E} (N_{n})}{n}}=p,

\operatorname {var} (\phi _{n})=\operatorname {var} \left({\frac {N_{n}}{n}}\right)={\frac {\operatorname {var} ({N_{n}})}{n^{2}}}={\frac {p(1-p)}{n}}.

Sostituendo nella disuguaglianza, si ottiene:

\operatorname {P} \{\omega \in \Omega :|\phi _{n}(\omega )-p|>\varepsilon \}\leq {\frac {p(1-p)}{n\varepsilon ^{2}}},

e, passando al limite per $n\to +\infty$ ,

\lim _{n\to \infty }\operatorname {P} \{\omega \in \Omega :|\phi _{n}(\omega )-p|>\varepsilon \}\leq 0.

Ma la probabilità non può essere negativa:

\operatorname {P} \colon {\mathcal {A}}\to [0,1],

da cui la tesi.

Osservazioni

La legge debole dei grandi numeri non assicura che, comunque scelto $\varepsilon >0$ , quasi certamente a partire da un certo $n_{\varepsilon }$ il valore $|\phi _{n}-p|$ si mantenga minore o uguale a $\varepsilon$ , ossia che l'insieme

\{\omega \in \Omega :\exists n_{\varepsilon }:\forall n>n_{\varepsilon },|\phi _{n}(\omega )-p|>\varepsilon \}

sia $\operatorname {P}$ -trascurabile. Infatti, esplicitando la definizione di limite, si trova:

\forall \varepsilon >0,\forall \eta >0,\exists n_{\varepsilon ,\eta }:\forall n\geq n_{\varepsilon ,\eta },\operatorname {P} \{\omega \in \Omega :|\phi _{n}(\omega )-p|>\varepsilon \}\leq \eta ,

ma niente sembra assicurare che $n_{\varepsilon ,\eta }$ non diverga per $\eta \to 0$ .

Dimostrazione della legge forte dei grandi numeri

Ciò è invece assicurato, nelle medesime condizioni, dalla proposizione:

\operatorname {P} \{\omega \in \Omega :\lim _{n\to \infty }\phi _{n}(\omega )=p\}=1,

che, in effetti, implica sia

\forall \varepsilon \in \mathbb {R} _{0}^{+},\operatorname {P} \{\omega \in \Omega :\exists n_{\varepsilon }:\forall n>n_{\varepsilon },|\phi _{n}(\omega )-p|>\varepsilon \}=0

sia la legge debole dei grandi numeri.

Dimostrazione delle due implicazioni

La legge forte può essere formulata, esplicitando la definizione di limite e passando al complementare, come:

\operatorname {P} \{\omega \in \Omega :\exists \varepsilon \in \mathbb {R} _{0}^{+}:\forall n_{\varepsilon }\in \mathbb {N} ,\exists n>n_{\varepsilon }:|\phi _{n}(\omega )-p|>\varepsilon \}=0

che a sua volta è equivalente, trasformando il quantificatore esistenziale in un'unione, a:

\operatorname {P} (\bigcup _{\varepsilon \in \mathbb {R} _{0}^{+}}\{\omega \in \Omega :\forall n_{\varepsilon }\in \mathbb {N} ,\exists n>n_{\varepsilon }:|\phi _{n}(\omega )-p|>\varepsilon \})=0

e per monotonia di $\operatorname {P}$

\forall \varepsilon \in \mathbb {R} _{0}^{+},\operatorname {P} \{\omega \in \Omega :\exists n_{\varepsilon }\in \mathbb {N} :\forall n>n_{\varepsilon },|\phi _{n}(\omega )-p|>\varepsilon \}\leq

\leq \operatorname {P} (\bigcup _{\varepsilon \in \mathbb {R} _{0}^{+}}\{\omega \in \Omega :\forall n_{\varepsilon }\in \mathbb {N} ,\exists n>n_{\varepsilon }:|\phi _{n}(\omega )-p|>\varepsilon \})

da cui, per confronto, la prima implicazione. Trasformando anche gli altri due quantificatori in operazioni insiemistiche, si ha:

0=\operatorname {P} \{\omega \in \Omega :\exists n_{\varepsilon }\in \mathbb {N} :\forall n>n_{\varepsilon },|\phi _{n}(\omega )-p|>\varepsilon \}=

=\operatorname {P} (\bigcap _{n_{\varepsilon }\in \mathbb {N} }\bigcup _{n>n_{\varepsilon }}\{\omega \in \Omega :|\phi _{n}(\omega )-p|>\varepsilon \})=

ma, si è in presenza dell'intersezione di una successione non crescente di insiemi, dunque per monotonia di $\operatorname {P}$ , si ha:

=\lim _{n_{\varepsilon }\to \infty }\operatorname {P} (\bigcup _{n>n_{\varepsilon }}\{\omega \in \Omega :|\phi _{n}(\omega )-p|>\varepsilon \})\geq

e ancora:

\geq \lim _{n\to \infty }\{\omega \in \Omega :|\phi _{n}(\omega )-p|>\varepsilon \}

da cui anche la seconda implicazione, ricordando che questo è valido per ogni $\varepsilon$ .

Dimostrazione della legge forte

Si è già visto che l'asserto è equivalente a:

\operatorname {P} (\bigcup _{\varepsilon \in \mathbb {R} _{0}^{+}}\{\omega \in \Omega :\forall n_{\varepsilon }\in \mathbb {N} ,\exists n>n_{\varepsilon }:|\phi _{n}(\omega )-p|>\varepsilon \})=0

Discretizzando, come consueto nel caso dei limiti, si ha:

\operatorname {P} (\bigcup _{k\in \mathbb {N} _{0}}\{\omega \in \Omega :\forall n_{k}\in \mathbb {N} ,\exists n>n_{k}:|\phi _{n}(\omega )-p|>{\frac {1}{k}}\})=0

Per subadditività

\operatorname {P} (\bigcup _{k\in \mathbb {N} _{0}}\{\omega \in \Omega :\forall n_{k}\in \mathbb {N} ,\exists n>n_{k}:|\phi _{n}(\omega )-p|>{\frac {1}{k}}\})\leq

\leq \sum _{k\in \mathbb {N} _{0}}\operatorname {P} \{\omega \in \Omega :\forall n_{k}\in \mathbb {N} ,\exists n>n_{\varepsilon }:|\phi _{n}(\omega )-p|>{\frac {1}{k}}\}

Dunque, se quest'ultima espressione sarà nulla, si sarà dimostrata la legge forte. Essendo $\operatorname {P}$ non negativa, si dovrà avere:

\forall k\in \mathbb {N} _{0},\operatorname {P} (\limsup _{n\to \infty }\{\omega \in \Omega :|\phi _{n}(\omega )-p|>{\frac {1}{k}}\})=0

si vuole mostrare che questo è vero considerando la sottosuccessione $\phi _{n^{2}}$ . Si vuole applicare il lemma di Borel-Cantelli, pertanto si verifica che converga l'espressione

\sum _{n=1}^{\infty }\operatorname {P} \{\omega \in \Omega :|\phi _{n^{2}}(\omega )-p|>{\frac {1}{k}}\}

Per la disuguaglianza di Bienaymé-Čebyšëv si trova:

\forall k,\forall n,\operatorname {P} \{\omega \in \Omega :|\phi _{n^{2}}(\omega )-p|>{\frac {1}{k}}\}\leq {\textrm {var}}(\phi _{n^{2}})k^{2}=k^{2}{\frac {p(1-p)}{n^{2}}}

da cui:

\sum _{n=1}^{\infty }\operatorname {P} \{\omega \in \Omega :|\phi _{n^{2}}(\omega )-p|>{\frac {1}{k}}\}\leq p(1-p)k^{2}\sum _{n=1}^{\infty }{\frac {1}{n^{2}}}

Ma questa serie è notoriamente convergente. Pertanto,

\forall k\in \mathbb {N} _{0},\operatorname {P} (\limsup _{n\to \infty }\{\omega \in \Omega :|\phi _{n^{2}}(\omega )-p|>{\frac {1}{k}}\})=0

Si noti ora che ogni numero naturale n è compreso tra due quadrati consecutivi:

\forall n\in \mathbb {N} ,\exists q\in \mathbb {N} :q^{2}\leq n<(q+1)^{2}

da cui

{\frac {N_{n}}{(q+1)^{2}}}\leq \phi _{n}\leq {\frac {N_{n}}{q^{2}}}

si noti ora che $n-q^{2}$ è la massima differenza possibile tra $N_{q^{2}}$ e $N_{n}$ , da cui:

N_{q^{2}}\leq N_{n}\leq N_{q^{2}}+(n-q^{2})

pertanto:

{\frac {N_{q^{2}}}{(q+1)^{2}}}\leq {\frac {N_{n}}{(q+1)^{2}}}\leq \phi _{n}\leq {\frac {N_{n}}{q^{2}}}\leq {\frac {N_{q^{2}}+(n-q^{2})}{q^{2}}}

ora però si ha $n-q^{2}\leq (q+1)^{2}-q^{2}$ , dunque:

{\frac {N_{q^{2}}}{q^{2}}}{\frac {q^{2}}{(q+1)^{2}}}\leq \phi _{n}\leq {\frac {N_{q^{2}}}{q^{2}}}+{\frac {(q+1)^{2}-q^{2}}{q^{2}}}

passando al limite ( $n\to \infty \Rightarrow q\to \infty$ ) e applicando il risultato ottenuto per $\phi _{n^{2}}$ , si ottiene che, quasi certamente:

p\cdot 1=p\lim _{q\to \infty }{\frac {q^{2}}{(q+1)^{2}}}\leq \lim _{n\to \infty }\phi _{n}\leq p+\lim _{q\to \infty }{\frac {q^{2}+2q+1-q^{2}}{q^{2}}}=p+0

il che conclude la dimostrazione.

Note

^ Articolo Kahneman (PDF), su econ.yale.edu.

Voci correlate

Altri progetti

Wikimedia Commons

Wikimedia Commons contiene immagini o altri file su legge dei grandi numeri

Collegamenti esterni

(EN) Richard Routledge, law of large numbers, su Enciclopedia Britannica, Encyclopædia Britannica, Inc.
(EN) Eric W. Weisstein, Legge dei grandi numeri, su MathWorld, Wolfram Research.

Controllo di autorità	Thesaurus BNCF 34822 · LCCN (EN) sh85075318 · GND (DE) 4157077-7 · BNF (FR) cb11978788d (data) · J9U (EN, HE) 987007558155705171