Statisztika! A szórást, szóródást és varianciát elmagyarázná valaki érthetően?
Általában jól megtudok érteni dolgokat, de ezekkel mindig gondban vagyok.
Próbáltam több helyen utánuk olvasni, de mindig elvesztem a fonalat.
Először a szórás a variancia becslése.
Pl.: az óceán összetételére vagy kiváncsi egy méréssel monduk 1 l víz összetételét határozza meg. Ha az egyész óceán minden literét megméred, akkor meg tudod határozni a mérések varianciáját. Tehát a varianciát effektíve a jóisten se tudja.
De tudjuk becsülni a szórással.
Ha van legalább 5-6 mintád, a számított szórás eléggé közel lesz a varianciához.
Mi a szösz a variancia?
Képzeld el hogy az óceános mérési eredményeket ábrázolod egy hisztogramon. Azaz az x tengelyen lesz a mért eredmény pl. sótartalom, az y tengelyen pedíg az adott eredmény gyakorisága. Ha tényleg leméred az egész óceánt, és nagyon finom a mérésed (pokolian sok a tizedesjegy) akkor kapsz egy teljesen sima haranggörbét. (Olyan mint egy harang metszete)
Középen az átlagos összetétel körül lesz rengeteg sok eredmény. Viszont mindenféle mérési hiba miatt elég sokféle eredmény lesz. A nagy hibák ritkák lesznek, de azért előfordulnak. Minél nagyobb a hiba, annál ritkább.
Ha a haranggörbét jellemezni akarod, lesz két nagyon fontos jellemződ.
Az egyik, hogy hol a görbe csúcsának a közepe, (a várható érték). A másik hogy milyen széles a haranggörbe. Ha a függőleges középvonal közepétől megméred a távolságot vízszintesen a görbéig az jól jellemzi, hogy milyen széles a görbe. Ez a variancia. (Annyit egyszerűsítettem, hogy valójában az inflexiós pontban kéne mérni a szélességet)
Mire jó még ez a görbe?
Ugye minden letséges mérési eredmény szerepel ezen a görbén, tehát biztos, hogy egy adott mérési eredmény szerepel a görbén. Sok eredmény többször is szerepel. A középső eredmények nagyon sokszor szerepelnek, a szélsők elég ritkán, ezt mutatja igazából a görbe. A göbe alatti terület arányos a 100%-os valósínűséggel, de a görbe jobbra és palra is végtelen hosszú, ez nem túl praktikus. Mondjuk nézzük meg mekkora terület tartozik a középéreték plusz minusz 1 varianciához. (Ehez vannak táblázatok, nem kell integrálnunk nekünk személy szerint semmit.) Kb 60 % jön ki. Ez a harangnak a kidomborodó középső része, illetve az az alatti terület.
Plusz minusz két szórásra kb 95% jön ki. Háromra 99%
Mire jó ez az egész?
A haranggörbét sose látjuk, sose rendelkezünk minden informácíóval, sose merjük ki literenként az egész óceánt. De mondjuk megbecsültük a varianciát egy szórással. Mondjuk ma mérünk 1 db mintát az óceánból, biztos lesz valami véletlen hibája a mérésünkenk. De 95%ig biztosak akrunk lenni az eredményünkben, akkor azt mondjuk, hogy a mért eerdményünk az ami de plusz mínusz két szórásnyra bizonytalanok vagyunk benne.
Vagy másképp mondjuk az ivóvíznek van egy nagyon fontos paramétere, amit megszab a az orvostudomány, és azalapján a jogszabály mondjuk legyen ez 50 prüntyfaktor. Ezt napi szinten ellenőrizni kell, vagy nem felelünk meg a jogszabálynak. Sajnos csak szökőévente egyszer mérünk pontosan 50-t úgyhogy mindenki szomjanhalna. Ezért a jogszabály alkotók egy elfogadási sávot adnak meg. 95% ig biztosak akarnak lenni abban, hogy a víz 50 prüntyfaktorú. Tudják azt is, hogy eg 50-es víz ismételt mérése 1 prüntyfaktor szórást mutat. Akkor az 50 es vízre mért éreték 95% valószínűséggel 48 és 52 között lesz. Tehát 48- tól 52 ig nem kell meglepődni a mérési eredményen, iható a víz ebben a tartományban.
És mit jelent az, hogy ha mondjuk magas vagy kicsi a variancia vagy a szórás?
Minél kisebb a variancia, annál inkább hasonlóak az átlaghoz az egyedi értékek, ugye? Szóval a terjdelem milyenségét vagy mondjuk a ritka értékek gyakoriságát írja le, gondolom.
Igen, minél kisebb a variancia, annál inkább hasonlóak az átlaghoz az egyedi értékek.
Annyi, hogy az, hogy milyen gyakoriak a ritka értékek, az nem csak a szórástól függ, hanem a görbe alakjától is.
Általában normális eloszlást feltételezünk ami a jól ismert haranggörbe, de lehetnek olyanok is, amik nem normál eloszlást követnek.
Monduk nem egy harang, hanem egy lapos lángos, akkor tele lesz a populáció mindenféle átlagtól eltérő értékkel.
Kapcsolódó kérdések:
Minden jog fenntartva © 2025, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!