Kurtosis

In de kansrekening en de statistiek is kurtosis (Grieks: κύρτωσις, kurtosis, welven, krommen) of welving (gewelfdheid), (ook wel platheid genoemd) een maat voor de 'staartvormigheid' van een kansverdeling. Zowel de parameter zelf als de schatter daarvan worden met kurtosis aangeduid. Een hoge kurtosis wijst op een verdeling met lage kans op extreme uitschieters, vanwege de staartvorm. Dit houdt in dat een relatief groot deel van de variantie veroorzaakt wordt door zeldzame extreme waarden. Een lage kurtosis wijst op een platte verdeling. Hier wordt de variantie voornamelijk veroorzaakt door een groter deel minder extreme waarden. Soms wordt er gezegd dat kurtosis gerelateerd is aan de 'piekvormigheid', maar dat is incorrect.[1]

Definitie

Voor kurtosis worden in de statistische literatuur twee verschillende definities gebruikt. Als eerste, wordt kurtosis gedefinieerd als het vierde gestandaardiseerde moment:

γ 2 = μ 4 σ 4 = E [ ( X μ ) 4 ] ( E [ ( X μ ) 2 ] ) 2 {\displaystyle \gamma '_{2}={\frac {\mu _{4}}{\sigma ^{4}}}={\frac {\operatorname {E} [(X-{\mu })^{4}]}{(\operatorname {E} [(X-{\mu })^{2}])^{2}}}}

waarin μ 4 = E ( X μ ) 4 {\displaystyle \mu _{4}={\rm {E}}(X-\mu )^{4}} het vierde centrale moment is, en σ {\displaystyle \sigma } de standaarddeviatie.

Voor een normale verdeling is γ 2 = 3 {\displaystyle \gamma '_{2}=3} . Om vergelijking met de normale verdeling te vergemakkelijken, wordt algemeen de volgende definitie van kurtosis gehanteerd, die ook wel exces kurtosis genoemd wordt.

γ 2 = γ 2 3 {\displaystyle \gamma _{2}=\gamma '_{2}-3}

Een wiskundige theoretische reden voor deze aangepaste definitie is dat de kurtosis nu gelijk is aan het quotiënt van het vierde cumulant ( κ 4 {\displaystyle \kappa _{4}} ) en het kwadraat van de tweede cumulant ( κ 2 {\displaystyle \kappa _{2}} , die gelijk is aan de variantie).

γ 2 = κ 4 κ 2 2 {\displaystyle \gamma _{2}={\frac {\kappa _{4}}{\kappa _{2}^{2}}}}

Een praktische reden is dat volgens deze formule de normale verdeling een kurtosis gelijk aan nul heeft.

  • Een positieve kurtosis duidt op een stevige piekvorm van de kansverdeling, dit wordt leptokurtisch genoemd. Voorbeelden van leptokurtische verdelingen zijn de laplaceverdeling en de logistische verdeling.
  • Een negatieve kurtosis duidt op een platte vorm van de kansverdeling, dit wordt platykurtisch genoemd. Voorbeelden hiervan zijn de uniforme verdeling. De meest platykurtische verdeling is de Bernoulli-verdeling met parameter p = 1 / 2 {\displaystyle p=1/2} , deze heeft een kurtosis van –2.
  • Verdelingen met kurtosis 0 worden mesokurtosisch genoemd. Voorbeelden hiervan zijn de normale verdelingen.

Eigenschappen

  • Als X {\displaystyle X} normaal verdeeld is, is γ 2 ( X ) = 0 {\displaystyle \gamma _{2}(X)=0} .
  • Als Y {\displaystyle Y} de som is van n {\displaystyle n} onafhankelijke, identiek als X {\displaystyle X} verdeelde stochastische variabelen, dan is γ 2 ( Y ) = γ 2 ( X ) / n {\displaystyle \gamma _{2}(Y)=\gamma _{2}(X)/n} .
  • Als X 1 , , X n {\displaystyle X_{1},\ldots ,X_{n}} onderling onafhankelijke stochastische variabelen zijn, alle met dezelfde variantie, geldt:
γ 2 ( i = 1 n X i ) = 1 n 2 i = 1 n γ 2 ( X i ) {\displaystyle \gamma _{2}\left(\sum _{i=1}^{n}X_{i}\right)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\gamma _{2}(X_{i})} .

NB: deze drie eigenschappen gelden voor γ 2 {\displaystyle \gamma _{2}} en niet voor γ 2 {\displaystyle \gamma '_{2}} .

Steekproefkurtosis

De kurtosis van een verdeling kan geschat worden op basis van de uitkomst x 1 , , x n {\displaystyle x_{1},\ldots ,x_{n}} van een aselecte steekproef uit de verdeling. De steekproefkurtosis is de momentschatter van de kurtosis:

g 2 = n i = 1 n ( x i x ¯ ) 4 ( i = 1 n ( x i x ¯ ) 2 ) 2 3 {\displaystyle g_{2}={\frac {n\,\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{4}}{\left(\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}\right)^{2}}}-3}

waarin x ¯ {\displaystyle {\overline {x}}} het steekproefgemiddelde is.

Omdat dit geen zuivere schatter voor de populatiekurtosis is, wat wil zeggen dat E g 2 γ 2 {\displaystyle {\rm {E}}g_{2}\neq \gamma _{2}} , wordt in praktijk, en in de meeste softwarepakketten, meestal de volgende, wel zuivere, schatter gebruikt

G 2 = n 1 ( n 2 ) ( n 3 ) ( ( n + 1 ) g 2 + 6 ) {\displaystyle G_{2}={\frac {n-1}{(n-2)(n-3)}}((n+1)\,g_{2}+6)}
Bronnen, noten en/of referenties
  1. (en) Westfall, Peter H. (11-08-2014). https://www.tandfonline.com/doi/abs/10.1080/00031305.2014.917055. Gearchiveerd op 10 februari 2023. The American Statistician 2014
· · Sjabloon bewerken
Onderwerpen uit de beschrijvende statistiek
Gemiddelden:rekenkundig gemiddelde · meetkundig gemiddelde · harmonisch gemiddelde · kwadratisch gemiddelde · gewogen gemiddelde · getrimd gemiddelde · Winsorgemiddelde
Andere liggingsmaten:mediaan · modus · kwartiel · deciel · percentiel
Spreidingsmaten:variantie · standaardafwijking · variatiecoëfficiënt · interkwartielafstand
Grafische beschrijvingen:histogram · boxplot · Q-Q plot
Overig:moment · scheefheid · kurtosis · vijf-getallensamenvatting