Varianco




Pri la aliaj sencoj de la vorto vidu apartigilon varianco (apartigilo).




En probablokalkulo kaj statistiko, varianco de hazarda variablo estas mezuro de ĝia statistika disvastiĝo, kiu indikas la tipan malproksimecon de la atendita valoro.


La varianco de reel-valora hazarda variablo estas ĝia dua centra momanto, kaj ankaŭ estas ĝia dua kumulanto. La varianco de hazarda variablo estas la kvadrato de ĝia norma diferenco.




Enhavo






  • 1 Difino


  • 2 Historio


  • 3 Varianco kaj inercimomanto


  • 4 Propraĵoj


  • 5 Loĝantara varianco kaj specimena varianco


  • 6 Ĝeneraligoj


  • 7 Vidu ankaŭ


  • 8 Referenco





Difino |


Se μ=E⁡(X){displaystyle mu =operatorname {E} (X)} estas la atendita valoro (meznombro) de la hazarda variablo X, tiam la varianco estas:


var⁡(X)=E⁡[(X−μ)2].{displaystyle operatorname {var} (X)=operatorname {E} [(X-mu )^{2}].}

Do ĝi estas la atendita valoro de la kvadrato de la devio de X for de ĝia propra meznombro. Pli simple, oni povas esprimi ĝin kiel "La averaĝo de la kvadrato de la distanco de ĉiu datenpunkto for de la meznombro". Ĝi estas tial meznombra kvadratigita dekliniĝo. La varianco de hazarda variablo X estas tipe simbolita per var⁡(X){displaystyle operatorname {var} (X)}, σX2{displaystyle sigma _{X}^{2}}, aŭ simple σ2 {displaystyle sigma ^{2} }.


Notu ke la pli supra difino povas esti uzata por ambaŭ diskretaj kaj kontinuaj hazardaj variabloj, dank'al la difino de la ekspekta operatoro E{displaystyle operatorname {E} }.


  • Pri kontinua hazarda variablo X de probablodensa funkcio f(x):

var⁡(X)=∫(x−μ)2f(x)dx,{displaystyle operatorname {var} (X)=int (x-mu )^{2},f(x),dx,,}

pri kiu μ{displaystyle mu } estas la atendita valoro, t.e.


μ=∫xf(x)dx,{displaystyle mu =int x,f(x),dx,,}

kaj x variante tra la tuta domajno de X.


  • Pri diskreta hazarda variablo X de probabla masa funkcio, probablo estas ligita al ĉiu elemento, x1 ↦ p1, ...xi ↦ pi, ...xn ↦ pn (N=∑i=1nni,pi=niN{displaystyle N=sum _{i=1}^{n}n_{i},,,p_{i}={frac {n_{i}}{N}}}), tial

var⁡(X)=∑i=1npi⋅(xi−μ)2{displaystyle operatorname {var} (X)=sum _{i=1}^{n}p_{i}cdot (x_{i}-mu )^{2}}

kie μ{displaystyle mu } estas la atendita valoro, t.e.


μ=∑i=1npi⋅xi.{displaystyle mu =sum _{i=1}^{n}p_{i}cdot x_{i},.}

Kiam ĉiuj probabloj estas egalaj (pi=1n{displaystyle p_{i}={frac {1}{n}}} por ĉiu xi), μ {displaystyle mu } egalas al la aritmetika meznombro (averaĝo).


Multaj distribuoj, kiel la koŝia distribuo, ne havas varianco ĉar la taŭga integralo diverĝas. Aparte, se distribuo ne havas atenditan valoron, ĝi ne havas ankaŭ variancon. La malo estas ne ĉiam vera: estas distribuoj pri kiu la atendita valoro ekzistas, sed la varianco ne.



Historio |


La termino varianco estis unue prezentita de Ronald Fisher en lia papero La Korelacio inter Parencoj pri Konjekto de Mendela Heredado [1] eldonita en 1918:


"La granda aro da disponeblaj statistikoj montras al ni, ke devioj de homa mezuro for de averaĝo sekvas tre proksimume la normalan distribuon de eraroj, kaj, konsekvente, ke variableco eblas esti uniforme mezurita per norma diferenco, kiu korespondas al la kvadrata radiko de la meznombra kvadratigita eraro. Kiam estas du sendependaj fontoj de variablado, kiu eblas kaŭzi, en uniforman loĝantaron, distribuojn kun normaj diferencoj σ1 {displaystyle sigma _{1} } kaj σ2 {displaystyle sigma _{2} }, okazas ke la distribuo, kiam ambaŭ distribuoj agas samtempe, havas norman diferencon σ12+σ22{displaystyle {sqrt {sigma _{1}^{2}+sigma _{2}^{2}}}}. Estas do dezirinde, kiam analizante fontojn de variablado, konsideri la kvadratojn de la normaj diferencoj por taksi variablecon. Ni nomos tiun kvanton Varianco..."



Varianco kaj inercimomanto |


La varianco de probablodistribuo estas analoga al la inercimomanto en klasika meĥaniko, ĉar ĉi tiu korespondas al lineara masodistribuo ĉirkaŭ akso de rotacio.


Dum la inercimomanto de volumeno V estas:



I=∫V(r→)2ρ(r→)dV{displaystyle I=int _{V}({vec {r}}_{perp })^{2}rho ({vec {r}})mathrm {d} V}, kie r→{displaystyle {vec {r}}} estas la radiusvektoro de iu punkto de la korpo, ρ(r→){displaystyle rho ({vec {r}})} estas la masa denso ĉe la punkto, r→{displaystyle {vec {r}}_{perp }} la orta distanco inter la punkto kaj la rotaciakso,

la varianco de kontinua hazarda variablo estas ankaŭ integralo:



var⁡(X)=∫(x−μ)2f(x)dx,{displaystyle operatorname {var} (X)=int (x-mu )^{2},f(x),dx,,} pro tiu analogio, tiaj terminoj kiel la varianco estas nomataj momanto de probablodistribuo.


Propraĵoj |


Se la varianco estas difinita, ĝi estas neniam negativa, ĉar kvadratoj estas pozitivaj aŭ nulaj. La mezurunuo de varianco estas kvadrato de mezurunuo de observado. Ekzemple, se alto estas mezurita en metroj do varianco de aro de altoj estas mezurita en kvadrataj metroj. Ĉi tiu fakto estadas neoportuna, kaj motivigis anstataŭe uzi kvadratan radikon de varianco, sciatan kiel variancan devion.


Eblas pruvi de la difino ke la varianco ne dependas de meznombro μ{displaystyle mu }. Do, se la variablo estas "ŝovita" per valoro b prenante X+b, do varianco de la rezultanta hazarda variablo estas la sama. Male, se la variablo estas multiplikita per skala faktoro a, la varianco estas multiplikita per a2. Pli formale, se a kaj b estas reelaj konstantoj kaj X estas hazarda variablo kies varianco estas difinita,


var⁡(aX+b)=a2var⁡(X) .{displaystyle operatorname {var} (aX+b)=a^{2},operatorname {var} (X) .}

Alia formulo por la varianco sekvas simple el lineareco de atenditaj valoroj kaj la pli supra difino:


var⁡(X)=E⁡(X2−2XE⁡(X)+[E⁡(X)]2)=E⁡(X2)−2[E⁡(X)]2+[E⁡(X)]2=E⁡(X2)−[E⁡(X)]2 .{displaystyle operatorname {var} (X)=operatorname {E} (X^{2}-2,X,operatorname {E} (X)+[operatorname {E} (X)]^{2})=operatorname {E} (X^{2})-2[operatorname {E} (X)]^{2}+[operatorname {E} (X)]^{2}=operatorname {E} (X^{2})-[operatorname {E} (X)]^{2} .}

Ĉi tiu estas ofta maniero por kalkuli la variancon en praktiko.


Unu kaŭzo por uzi variancon prefere al la aliaj kriterioj estas tio, ke varianco de sumo aŭ diferenco de sendependaj hazardaj variabloj estas la sumo de iliaj variancoj. Por tio, pli malforta kondiĉo ol sendependeco, nomita nekorelacieco, ankaŭ sufiĉas. Ĝenerale,


var⁡(aX+bY)=a2var⁡(X)+b2var⁡(Y)+2abcov⁡(X,Y) ,{displaystyle operatorname {var} (aX+bY)=a^{2},operatorname {var} (X)+b^{2},operatorname {var} (Y)+2ab,operatorname {cov} (X,Y) ,}

ĉi tie cov{displaystyle operatorname {cov} } estas la kunvarianco, kiu estas nulo por sendependaj hazardaj variabloj (se ĝi ekzistas).



Loĝantara varianco kaj specimena varianco |


Ĝenerale, la loĝantara varianco de "finia" loĝantaro da N elementoj estas donita per:


σ2=1N∑i=1N(xi−)2,{displaystyle sigma ^{2}={frac {1}{N}}sum _{i=1}^{N}left(x_{i}-{overline {x}}right)^{2},,}

kie {displaystyle {overline {x}}} estas la loĝantara meznombro rilatante al ia propraĵo de tiu loĝantaro. Ĉi tiu estas nure speciala kazo de la ĝenerala difino de varianco prezentita pli supre, sed limitita al finiaj loĝantaroj.


En multaj praktikaj situacioj, la vera varianco de loĝantaro estas ne sciata apriore, kaj devas esti komputita iel. Kiam traktante kun multnombraj finiaj loĝantaroj, oni povas nek observi, nek nombri ĉiujn N elementojn de la loĝantaro; do estas preskaŭ neniam eble trovi precizan valoron de la loĝantara varianco, pro tempo, kosto, kaj alia limigo. Kiam traktante kun nefiniaj loĝantaroj, ĝenerale neeblas trovi la valoron de varianco.


Komuna maniero de taksi la variancon de multnombraj finiaj aŭ malfiniaj loĝantaroj estas per specimenoj. Ni komencas kun "finia" specimena loĝantaro prenita el la entuta loĝantaro. Supozu ni ke tia specimeno estas la vico (y1,…,yn){displaystyle (y_{1},dots ,y_{n})}, kie n < N. Ni povas konsideri ĉi tiun specimenon laŭ du klaraj manieroj:


la unua, ni povas trakti ĝin kiel finian loĝantaron kaj priskribi ĝian variancon;


la dua, ni povas taksi la subloĝantaran variancon de ĉi tiu specimeno.


La varianco de la specimeno (y1,…,yn){displaystyle (y_{1},dots ,y_{n})}, vidita kiel finia loĝantaro, estas


sn2=1n∑i=1n(yi−)2 ,{displaystyle s_{n}^{2}={frac {1}{n}}sum _{i=1}^{n}left(y_{i}-{overline {y}}right)^{2} ,}

kie {displaystyle {overline {y}}} estas la meznombro rilate al la specimeno. Ĉi tiu estas iam sciata kiel la dekliva specimena varianco; tamen, tiu termino estas ambigua. Iuj elektronikaj kalkuliloj povas kalkuli σ2{displaystyle sigma ^{2}} je la premo de butono, pri kiu estas kutime markita "σ2{displaystyle sigma ^{2}}".


Kiam uzante la specimenon (y1,…,yn){displaystyle (y_{1},dots ,y_{n})} por taksi la variancon de la malpli granda loĝantaro, oni estas tentata egaligi la subloĝantaran varianco al σ2{displaystyle sigma ^{2}}. Tamen, σ2{displaystyle sigma ^{2}} estas parta proksimumo de la loĝantara varianco; ĉar oni devas konsideri la sekvantan nedeklivan specimena varianco:


sn−12=1n−1∑i=1n(yi−)2,{displaystyle s_{n-1}^{2}={frac {1}{n-1}}sum _{i=1}^{n}left(y_{i}-{overline {y}}right)^{2},}

kie {displaystyle {overline {y}}} estas la meznombro de la subloĝantaro.


Notu ke la termo n-1 en la denominatoro pli supre malsimilas al la ekvacio pri sn2{displaystyle s_{n}^{2}}, kiu havas n en la denominatoro.


Notu ke sn−12{displaystyle s_{n-1}^{2}} estas ĝenerale ne identa al la vera loĝantara varianco; ĝi estas nur proksimumo, kvankam tre bona nur kiam n estas granda. Ĉar sn−12{displaystyle s_{n-1}^{2}} estas teoria takso kaj estas bazita sur finia specimeno, ĝi ankaŭ estas iam ambigue nomita specimena varianco.


Unu komuna fonto de konfuzo estas ke la termino specimena varianco povas referi ĉu al la nedekliva varianco sn−12{displaystyle s_{n-1}^{2}} de la loĝantara varianco, ĉu al la dekliva varianco sn2{displaystyle s_{n}^{2}} de la specimeno vidita kiel finia loĝantaro. Nur la kunteksto permesas klarigi la situacion. Intuicie, komputante la variancon per divido per n, anstataŭ n-1, supozigas loĝantaran variancon. Tio okazas, ĉar ni estas uzanta la specimenan meznombron {displaystyle {overline {y}}} kiel valoron de la nekonata loĝantara meznombro μ {displaystyle mu }, kaj la krudan histogramon de ripetitaj eroj en la specimeno, anstataŭ la nekonatajn verajn probablojn.


En praktiko, pri granda n, la distingo estas efektive kaj ofte eta.



Ĝeneraligoj |


Se X estas vektoro-valorita hazarda variablo, kun valoroj en Rn{displaystyle mathbb {R} ^{n}}, kaj imagita kiel kolumna vektoro, tiam la natura ĝeneraligo de varianco estas E[(X − μ)(X − μ)T], kie μ = E[X] kaj XT estas la transpono de X, kaj do estas linia vektoro. Ĉi tiu varianco estas nenegativa-difinita kvadrata matrico, kutime referita kiel la kunvarianca matrico.


Se X estas komplekso-valorita hazarda variablo, kun valoroj en C{displaystyle mathbb {C} }, tiam ĝia varianco estas E[(X − μ)(X − μ)*], kie X* estas la kompleksa konjugito de X. Ĉi tiu varianco estas nenegativa reela nombro.



Vidu ankaŭ |



  • Neegalaĵo pri lokaj kaj skalaj parametroj

  • Atendata valoro

  • Hazardemo

  • Leĝo de tuteca varianco

  • Dekliveco

  • Duonvarianco

  • Korelacio

  • Kunvarianco

  • Momanto (statistiko)

  • Varianca devio



Referenco |




  1. Ronald Fisher (1918) La Korelacio inter Parencoj pri Konjekto de Mendela Heredado (angle)










Popular posts from this blog

Franz Schubert

Erzsébet Schaár

Ponta tanko