Mit jelent az a statisztikában, hogy valami szignifikáns?
"Míg a “jelentős, szignifikáns” egy normál beszélgetésben “fontosat” jelent, a statisztika világában “valószínűleg igaz” a jelentése"
Először is tisztázni kell, hogy mit értünk (általában) statisztikai vizsgálat alatt.
Általában olyasmire vagyunk kíváncsiak, hogy két dolog összefüggést mutat-e egymással, illetve hogy valaminek az eloszlása megfelel-e egy adott eloszlás típusnak.
Vegyük az elsőt, hogy két dolog összefügg-e. Mondjuk például az a kérdés, hogy akinek nagyobb a lábmérete, annak nagyobb-e a péniszmérete is. Egyszerű a mérés: megnézzük, hányas cipőt hord, lemérjük a péniszét, és számolunk.
A két összefüggő adatsor kb így fog kinézni:
(42; 15)
(42; 17)
(43; 16)
stb.
A két adatsorból a megfelelő statisztikával megállapítható, hogy a két méret összefügg-e. És itt jön a képbe a szignifikancia.
Tegyük fel, csak összesen KÉT adatod van:
(42; 17)
(43; 16)
Ebből az látszik, hogy akinek nagyobb a lába, annak kisebb a pénisze. Csakhogy mivel összesen KÉT embered volt, ezért lehet, hogy csak véletlenül választottál ki két embert, akinek ilyenek a méretei.
Vegyünk több embert, mondjuk 10-et. Ha még náluk is fennál az összefüggés (vagy valami más összefüggés), akkor az már sokkal jobb.
Minél több embered van, annál jobb.
Na de mi van akkor, ha általában (mondjuk 10-ből 6-nál) a nagyobb láb nagyobb péniszhez tartozik, de van pár, akinek ugyanakkora a lába, de eltér a pénisze, illetve nagyobb a lába, de kisebb a pénisze?
Megint felmerülhet a gyanú, hogy csak véletlenül kerültek a mintába a zavaró tényezők, menjünk feljebb az elemszámmal.
És mi van akkor, ha mind a 10 embernél gyönyörűen korrelál a két méret? Hát akkor sokkal valószínűbb, hogy ez így van a valóságban is, tehát kijelenthető, hogy van összefüggés.
Statisztikailag szignifikánsnak akkor nevezünk egy mérést, ha a minta elemszáma elég nagy ahhoz, hogy kizárjuk, hogy véletlenül válogattunk össze megfelelő embereket, illetve a mintán belüli korreláció olyan magas, hogy nem kell a mintaszám növelésével kiszűrni a zajt.
A statisztikai szignifikancia tehát egy valószínűséget ad, mégpedig annak a valószínűségét, hogy a mérésed NEM VÉLETLEÜL adta azt, amit adott. Nagyon fontos, hogy a szignifikancia vizsgálatára akkor van csak szükség, ha találunk összefüggést. Ha nincs összefüggés, mert egyszerűen nem függ össze a két adatsor (azaz nem lehet a lábméretből egyértelműen következtetni a péniszméretre, mert az emberek harmadának nagyobb lábhoz kisebb pénisz tartozik, másik harmadnak nagyobbhoz nagyobb, megint másoknak nagyobb lábhoz ugyanakkora), akkor nem lesz szignifikáns az eredmény. Akkor sem szignifikáns az eredmény, ha egyszerűen túl kevés adatot vizsgáltunk. Tehát az, hogy nincs szignifikancia, még nem jelenti biztosan azt, hogy nincs is összefüggés. De ha elég nagy az elemszám, akkor már gyanús, hogy nagyobb elemszámmal sem fogunk összefüggést találni.
Visszatérve a példához:
Két ember láb-pénisz mérete egyáltalán nem ad statisztikailag szignifikáns összefüggést. Bármit is kapsz, szinte biztos, hogy csak véletlenül nyúltál bele az adott dologba.
10 emberen csak akkor kapsz szignifikáns eredményt, ha mindenki (vagy szinte mindenki) ugyanúgy korrelál. Ha már vannak kilógó esetek, akkor nem lesz szignifikáns az eredmény.
Fontos, hogy a szignifikancia NEM azt jelzi, hogy az eredmény FONTOS vagy NAGY. Egyáltalán nem biztos, hogy egy eredmény jelentős.
Tegyük fel, hogy azt találjuk, hogy a férfiaknak 0,1%-kal kevesebb hajhagymájuk van a fejükön, mint a nőknek. Ez egy nem jelentős eredmény, és nem is fontos, és nem is nagy a különbség, de ha megviszgálunk 10000 nőt és 10000 férfit, és mindenkinél fennáll ez a 0,1% differencia, akkor NAGYON SZIGNIFIKÁNS.
Namost a szignifikanciának van mértéke. Egész más, ha 10 emberen találunk egy összefüggést, mintha 10000 emberen találunk. Ezt e p értékkel jelöljük. Ha 99%, hogy valami valóban úgy van, akkor p = 1%, azaz p = 0,01. Ha csak 95%-ban vagyunk biztosak, akkor p = 0,05 (azaz 5%). Azaz p azt mutatja, hogy mennyi a bizonytalansági faktor, ezért minél kisebb, annál jobb. Vannak tudományágak, ahol az 5% még elmegy, máshol 1% vagy épp 0,1% kell.
""Míg a “jelentős, szignifikáns” egy normál beszélgetésben “fontosat” jelent, a statisztika világában “valószínűleg igaz” a jelentése"
Hát igen, ékes példája annak, hogy nem elég használni tudni a googlet, nem árt, ha van egy kis alapvető tudásod is a témával kapcsolatban.
A google idézet végülis igaz, de ez nem jelenti azt, hogy az első válaszolónak nincs igaza: ha valami a statisztikában szignifikáns, tehát Jelentős mértékű, az azt sokszor jelenti, hogy a hipotézisünk valószínűleg igaz.
Előző: "A google idézet végülis igaz..."
Írhattad volna egyszerűbben: az idézet igaz, de aki idézte az hülye, nem olyan okos mint én...
Pl Két mintás t-próba.
Egy különbség alfa szinten (alfa elsőfajú hiba valószínűsége) szignifikáns, ha annak a valószínűsége, hogy a kapott eltérést a véletlen okozta (figyelembe véve a kapott mintákat és a feltételezett eloszlásokat) legföljebb alfa.
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!