Pivotstatistik

Eine Pivotstatistik, auch Pivot-Größe genannt, kurz ein Pivot, ist eine spezielle Funktion in der mathematischen Statistik. Es handelt sich um Statistiken mit bestimmten Invarianzeigenschaften, die zur Konstruktion von Konfidenzbereichen verwendet werden. Der Name leitet sich ab vom französischen pivot (deutsch Anker, hier im Sinne von Dreh- und Angelpunkt)[1] und beruht auf den Invarianzeigenschaften.

Definition

Gegeben sei ein statistisches Modell ( X , A , ( P ϑ ) ϑ Θ ) {\displaystyle ({\mathcal {X}},{\mathcal {A}},(P_{\vartheta })_{\vartheta \in \Theta })}

Ein Pivot ist eine Zufallsvariable T ( X , ϑ ) {\displaystyle T(X,\vartheta )} als Funktion von der Stichprobenvariable X {\displaystyle X} und ϑ {\displaystyle \vartheta } , deren Verteilung unabhängig von ϑ {\displaystyle \vartheta } ist.[2]

Streng formell wird eine Pivotstatistik wie folgt definiert: Gegeben seien ein Entscheidungsraum ( Γ , A Γ ) {\displaystyle (\Gamma ,{\mathcal {\mathcal {A}}}_{\Gamma })} und eine zu schätzende Funktion

g : Θ Γ {\displaystyle g\colon \Theta \to \Gamma } .

Meist ist Γ R {\displaystyle \Gamma \subset \mathbb {R} } . Dann heißt eine messbare Abbildung

T : X × Γ Γ {\displaystyle T\colon {\mathcal {X}}\times \Gamma \to \Gamma }

eine Pivotstatistik für g {\displaystyle g} , wenn sie folgende Eigenschaften erfüllt:[3]

  • Für alle B A Γ {\displaystyle B\in {\mathcal {A}}_{\Gamma }} und alle ϑ Θ {\displaystyle \vartheta \in \Theta } ist die Menge { x X T ( x , g ( ϑ ) ) B } {\displaystyle \{x\in {\mathcal {X}}\mid T(x,g(\vartheta ))\in B\}} in A {\displaystyle {\mathcal {A}}} enthalten.
  • Es existiert eine Wahrscheinlichkeitsverteilung Q {\displaystyle Q} auf ( Γ , A Γ ) {\displaystyle (\Gamma ,{\mathcal {A}}_{\Gamma })} , so dass für alle ϑ Θ {\displaystyle \vartheta \in \Theta } stets P ϑ T ( , g ( ϑ ) ) 1 = Q {\displaystyle P_{\vartheta }\circ T(\cdot ,g(\vartheta ))^{-1}=Q} gilt.

Beispiel

Gegeben sei ein festes σ 0 > 0 {\displaystyle \sigma _{0}>0} und sei N ( μ , σ 0 2 ) {\displaystyle {\mathcal {N}}(\mu ,\sigma _{0}^{2})} die Normalverteilung mit Erwartungswert μ {\displaystyle \mu } und Varianz σ 0 2 {\displaystyle \sigma _{0}^{2}} . Sei N n ( μ , σ 0 2 ) {\displaystyle {\mathcal {N}}^{n}(\mu ,\sigma _{0}^{2})} das n-fache Produktmaß.

Betrachtet wird als statistisches Modell das Produktmodell ( R n , B ( R n ) , ( N n ( μ , σ 0 2 ) ) μ R ) {\displaystyle (\mathbb {R} ^{n},{\mathcal {B}}(\mathbb {R} ^{n}),({\mathcal {N}}^{n}(\mu ,\sigma _{0}^{2}))_{\mu \in \mathbb {R} })} bei fester Varianz und unbekanntem Erwartungswert.

Dann ist eine Pivot-Statistik gegeben durch

T ( X , μ ) = n ( X ¯ μ ) σ 0 {\displaystyle T(X,\mu )={\frac {{\sqrt {n}}({\overline {X}}-\mu )}{\sigma _{0}}}} .

Hierbei ist

X ¯ = 1 n i = 1 n X i {\displaystyle {\overline {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}}

das Stichprobenmittel. Dass es sich um ein Pivot handelt, folgt direkt aus den Rechenregeln für normalverteilte Zufallsvariablen (siehe Invarianz der Normalverteilung gegenüber Faltung), denn es ist X ¯ μ N ( 0 , σ 0 2 / n ) {\displaystyle {\overline {X}}-\mu \sim {\mathcal {N}}(0,\sigma _{0}^{2}/n)} . Durch Normierung mit der Standardabweichung σ 0 / n {\displaystyle \sigma _{0}/{\sqrt {n}}} erhält man, dass T {\displaystyle T} immer standardnormalverteilt ist, also T ( , μ ) N ( 0 , 1 ) {\displaystyle T(\cdot ,\mu )\sim {\mathcal {N}}(0,1)} für alle μ R {\displaystyle \mu \in \mathbb {R} } .

Konstruktion von Konfidenzbereichen mittels Pivots

Existiert eine Pivotstatistik T {\displaystyle T} und ist eine Menge B A Γ {\displaystyle B\in {\mathcal {A}}_{\Gamma }} gegeben, so wird durch

C B ( x ) = { γ Γ T ( x , γ ) B } {\displaystyle C_{B}(x)=\{\gamma \in \Gamma \mid T(x,\gamma )\in B\}}

ein Bereichsschätzer definiert.[3] Aufgrund der Definition des Bereichsschätzers ist dann

{ x X g ( ϑ ) C B ( x ) } = { x X T ( x , g ( ϑ ) ) B } {\displaystyle \{x\in {\mathcal {X}}\mid g(\vartheta )\in C_{B}(x)\}=\{x\in {\mathcal {X}}\mid T(x,g(\vartheta ))\in B\}}

und somit

P ϑ ( { x X g ( ϑ ) C B ( x ) } ) = P ϑ ( { x X T ( x , g ( ϑ ) ) B } ) = Q ( B ) {\displaystyle P_{\vartheta }(\{x\in {\mathcal {X}}\mid g(\vartheta )\in C_{B}(x)\})=P_{\vartheta }(\{x\in {\mathcal {X}}\mid T(x,g(\vartheta ))\in B\})=Q(B)}

für alle ϑ Θ {\displaystyle \vartheta \in \Theta } aufgrund der Pivoteigenschaft von T {\displaystyle T} . Der Bereichsschätzer C B {\displaystyle C_{B}} liefert also einen Konfidenzbereich zum Konfidenzniveau Q ( B ) {\displaystyle Q(B)} . Die Wahl der Menge B {\displaystyle B} bestimmt somit Konfidenzniveau und Geometrie des Konfidenzbereiches.

Beispiel zur Konstruktion von Konfidenzbereichen

Unter denselben Rahmenbedingungen wie im obigen Beispiel soll ein Konfidenzbereich für den Mittelwert zum Konfidenzniveau 1 α {\displaystyle 1-\alpha } bestimmt werden. Da Q = N ( 0 , 1 ) {\displaystyle Q={\mathcal {N}}(0,1)} ist, muss zuerst eine Menge B {\displaystyle B} gewählt werden, so dass

Q ( B ) = N ( 0 , 1 ) ( B ) = 1 α {\displaystyle Q(B)={\mathcal {N}}(0,1)(B)=1-\alpha } .

Die Wahl von B {\displaystyle B} hängt im Wesentlichen von der Anwendung ab. Gängig sind einseitige Konfidenzintervalle

B 1 = [ a 1 , + ) {\displaystyle B_{1}=[a_{1},+\infty )} oder B 2 = ( , a 2 ] {\displaystyle B_{2}=(-\infty ,a_{2}]}

oder zweiseitige Konfidenzintervalle

B 3 = [ a 3 , a 3 ] {\displaystyle B_{3}=[-a_{3},a_{3}]} .

Dabei müssen a 1 , a 2 , a 3 {\displaystyle a_{1},a_{2},a_{3}} nun so gewählt werden, dass N ( 0 , 1 ) ( B i ) = 1 α {\displaystyle {\mathcal {N}}(0,1)(B_{i})=1-\alpha } für i = 1 , 2 , 3 {\displaystyle i=1,2,3} ist. Dafür wählt man die passenden p {\displaystyle p} -Quantile u p {\displaystyle u_{p}} der Standardnormalverteilung aus und erhält a 1 = u α {\displaystyle a_{1}=u_{\alpha }} sowie a 2 = u 1 α {\displaystyle a_{2}=u_{1-\alpha }} und a 3 = u 1 α / 2 {\displaystyle a_{3}=u_{1-\alpha /2}} .

Damit ergibt sich für den Bereichsschätzer mit der Menge B 1 {\displaystyle B_{1}}

C B 1 ( X ) = { μ R T ( X , μ ) [ u α , + ) } = { μ R n ( X ¯ μ ) σ 0 u α } = { μ R μ X ¯ σ 0 u 1 α n } {\displaystyle {\begin{aligned}C_{B_{1}}(X)&=\{\mu \in \mathbb {R} \mid T(X,\mu )\in [u_{\alpha },+\infty )\}\\&=\left\{\mu \in \mathbb {R} \;\mid \;{\frac {{\sqrt {n}}({\overline {X}}-\mu )}{\sigma _{0}}}\geq u_{\alpha }\right\}\\&=\left\{\mu \in \mathbb {R} \mid \mu \geq {\overline {X}}-{\frac {\sigma _{0}u_{1-\alpha }}{\sqrt {n}}}\right\}\end{aligned}}} ,

da aufgrund der Symmetrie der Standardnormalverteilung u 1 α = u α {\displaystyle u_{1-\alpha }=-u_{\alpha }} gilt.

Als einseitiges Konfidenzintervall zum Konfidenzniveau 1 α {\displaystyle 1-\alpha } für den Erwartungswert erhält man somit

C B 1 ( X ) = [ X ¯ σ 0 u 1 α n , + ) {\displaystyle C_{B_{1}}(X)=\left[{\overline {X}}-{\frac {\sigma _{0}u_{1-\alpha }}{\sqrt {n}}},+\infty \right)} .

Durch analoges Vorgehen mit den Mengen B 2 {\displaystyle B_{2}} und B 3 {\displaystyle B_{3}} erhält man als zweites einseitiges Konfidenzintervall

C B 2 ( X ) = ( , X ¯ + σ 0 u 1 α n ] {\displaystyle C_{B_{2}}(X)=\left(-\infty ,{\overline {X}}+{\frac {\sigma _{0}u_{1-\alpha }}{\sqrt {n}}}\right]}

und als beidseitiges Konfidenzintervall

C B 3 ( X ) = [ X ¯ σ 0 n u 1 α / 2 ; X ¯ + σ 0 n u 1 α / 2 ] {\displaystyle C_{B_{3}}(X)=\left[{\overline {X}}-{\frac {\sigma _{0}}{\sqrt {n}}}u_{1-\alpha /2};{\overline {X}}+{\frac {\sigma _{0}}{\sqrt {n}}}u_{1-\alpha /2}\right]} .

Verwandte Konzepte

Eng mit den Pivotstatistiken sind die approximativen Pivotstatistiken verwandt. Sie dienen der Konstruktion von approximativen Konfidenzbereichen und beruhen auf Grenzwertbetrachtungen.

Einzelnachweise

  1. Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 234, doi:10.1515/9783110215274. 
  2. Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, S. 142, doi:10.1007/978-3-642-17261-8. 
  3. a b Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, S. 231, doi:10.1007/978-3-642-41997-3.