A biológiai kutatás kísérletmegtervezésében mit jelent a szignifikanciaszint meghatározása? 11. osztályos biosz
Nagyjából tudom, tehát kísérlet előtti (prédikációban vagy kísérletmegtervezési?) fázisban meghatározzuk azt az értéket (alfa) mely azt határozzuk meg, hogy a kísérletből származó összehasonlított adat(sor)ok között mennyi eséllyel mondjuk, prediktáljuk különbözőek (a nullhipotézist elvetve tehát hogy semmi különbséget nem várunk) eltérőnek (ez pedig már szignifikáns eredmény) úgy hogy pedig nem azok (-hamis pozitív). És ezeket ilyen 0.05 (eddig az interneten keresések során szinte csak ebbe a számba ütköztem), 0.1 vagy simán százalékos formában (5% és 10%). Nagyjából jól leírtam a definícióját? És ennek a predikciónak mi a haszna, a kísérlet elvégzése után, a kapott adatok összehasonlításakor felhasználják ezt a predikciót? Gondolom nem, ezzel csak azt akarják megtudni, hogy mennyire érdemes elvégezni a kísérletet, hogy mennyi eséllyes lesz eredményes, szignifikáns az eredmény) És hogyan határozzák meg a szignifikancia-szintet?
Nagyon köszönöm, ha valaki ránéz a kérdésemre!
Kábé nem értem, amit írtál, de a szignifikanciaszint azt jelenti, hogy mekkora esélyt hagyunk arra, hogy az eredmény a véletlen műve. Minél magasabb az elemszám (pl. kísérleti egerek száma), annál magasabb lesz a szignifikanciaszint, ám annál drágább a kísérlet. A kísérlet előtt csak tippelni lehet az eredményt, de nem mindegy, hogy mekkora hatást akarunk kimutatni. Ha a hatás kicsi, (mondjuk egy előző kísérletben tíz egérből egynél jött létre, vagy a mért érték várt változása a természetes ingadozás nagyságrendje) akkor több egér/példány kell, ha nagyobb, akkor kevesebb. Mivel a kísérlet előtt a hatás pontos mértéke nem ismert, így az adott szignifikancia-szinthez szükséges mintanagyság (pl. hány egér kell) csak saccolható, nem mondható meg pontosan. Így azt is csak saccolni lehet, hogy a kísérlet végeredménye mennyire lesz szignifikáns.
Mondjuk ez külünbözteti meg a kísérletet a demonstrációtól, hogy nem tudjuk előre az eredményt.
Váó, először is köszönöm a gyors válaszokat!
Igen nagyon bénán fogalmaztam meg, te viszont nagyon jól 2. válaszoló, az egeres példát külön köszönöm.
Most a válaszod alapján újra megfogalmaznám, mit jelent ez az egész akkor, lehet hogy még így sem lesz pontos.
Tehát a kísérlet megtervezésekor pl. vegyük Meyer kísérletét (1 kontroll és fú 7 másik növ3ny (nem vagyok benne biztos, mindenesetre most 7 lesz) az elemek tehát a növények száma határozza meg a hatást, a szignifikanciát(?) tehát ha több növénynek nem adott volna egy bizonyos tápanyagot, akkor nőtt volna a hatás és így a szignifikancia értéke? Bocsánat ha nagyon nem így van nem a magyarázattal van baj. De inkább a meghatározott szignifikancia-szinthez képest, a várt hatáshoz képest alakítjuk az elemek számát? Tehát ha Meyer úgy számolt, hogy a szignifikancia-érték nem nagy (pl. 0.05?), tehát a hatás amit a vizsgált és növények és a kontrollcsoport közötti növekedésbeli különbséget prediktált, előrejelzett, akkor a növények számát megnövelte és lett mondjuk az a fentiekben lett hét növény, amelyekkel számolt szignifikancia-érték már nagyobb lett? De tegyük fel, ha rengeteg ugyanolyan növénnyel (pontosan azt sem tudom melyik volt az) végezte volna el a kísérletét, akkor a szignifikancia érték az már annyira kiugró lett volna, hogy már torzított volna a valóságon? Interneten találtam dolgokat erről, félreértés ne legyen, de egyszerűen nem értem.
Alapfogalmak: ugye a dolgok történhetnek véletlenül is, tehát ha mondjuk van egy (egyelőre még) kezelhettelen betegség, ahol 100-ból kb. tíz spontán meggyógyul, és van egy tesztelt gyógyszer, amit tesztelünk 30 betegen és abból is tíz meggyógyul, akkor van bizonyos esély rá, hogy a gyógyszer hatástalan, csak éppen a 30 betegből a szokásosnál többnek volt szerencséje. Ha ez az esély kisebb mint 5%, akkor azt mondjuk, hogy a gyógyszer hatása 95%-os szignifikancia-szinten igazolt. Ha kevesebb mint 1%, akkor 99%-os szignifikancia-szinten igazolt.
>Mi ez a statisztikai próba, erre van kifejezetten egy képlet?
-Sőt több :) Ezek a statisztikai próbák döntik el, hogy bizonyos állítások bizonyos szignifikancia-szinteken igazoltak-e. Többféle próba van, hogy mondjuk mondjuk egy elem egy adott átlagú és szórású sokaságból való-e, hogy két sokaság szórása megegyezik-e, de marha sok van. Továbbá arra is figyelni kell, hogy a próbák alkalmazásának vannak előfeltételei, normál eloszlású sokaságra vonatkozó próbát pl. nem lehet használni, ha az egyik változód kevés értéket vehet fel, pl. szemszín, nem.
De úgy általánosságban a kísérlet kiértékelésekor statisztikai próbákkal mondják meg, hogy az eredmény szignifikáns-e és ha igen, milyen szinten az.
Fúú, túl sok infó, (persze hálás vagyok az összesnek), de akkor rendszerezem és javítsatok ha valami rossz vagy hiányos:
Most vettem észre, hogy a kettes és az előttem lévő, hetes válaszoló is a véletlennek a beleszámításával hozta párhuzamba a szignifikancia-szintet/értéket, tehát:
a kísérlet kimenetele valami véletlen folyamán teljesen más lehet, mint ami normál esetben történne. a véletlennel kell számolni, ez a szignifikancia-érték. tegyük fel hogy nagy az esély a véletlennek a bekövetkezésére; ekkor a szignifikancia-érték nagy lesz pl. emberekkel kísérletezés, de nem illegális módon, hanem pl. megnézzük hogyan változik a pulzus különböző stílusú zenékre - mivel az emberek különbözőek, teljesen más eredmények jöhetnek ki pl. 10-10 ember vizsgálatakor, így hogy ezt elkerüljük, (hogy csökkentsük a szignifikancia-szintet), sokkal több embert kell megvizsgálni, sokkal több ,,elemmel" kell elvégezni a kísérletet.
De ha növényekkel, ugyanolyan babpalántákkal végeznénk kísérletet, de rengeteggel pl. 10000-rel, akkor meg az azokkal történt változások (mértékének) átlaga közel lenne ahhoz hogy alig történt valami, a nullhipotézishez, tehát hogy semmi nem fog történni változásban.
Az a megfelelő tehát, ha a szignifikancia érték sem túl nagy, sem túl kicsi. Ennek az értéke a fenti példák alapján is a vizsgált elemek számától függ. (ugye csak ettől?)
Vagy amit fent leírtam az a statisztikai próbáról szól? Merthogy az számítja a véletlent és ha ez 5% vagy annál kevesebb, akkor a szignifikancia érték 95%...
A statisztikai próba abban különbözik a szignifikanciától, hogy az a véletlenek jelenlétében adja meg az adatsorok (a kontroll és a vizsgált csoportok) közötti különbséget. A szignifikancia pedig a véletlennel egyáltalán nem számol, az csak azt mutatja meg, hogy mennyire valószínű, hogy lesz szignifikáns változás, eltér a két adatsor, véletlenek nélkül, úgy hogy elvethetjük a nullhipotézist? De akkor miért jó az alacsony szignifikancia-érték? (eddig mindig 5% láttam) Vagy 7-es akkor ez az 5% valószínűleg a statisztikai próbára vonatkozott? És a statisztikai próba + szignifikancia 100% ad? Bocsánat valahogy nem áll össze még mindig..
Köszönöm 7-es a válaszodat, az első bekezdést értettem, összekötni az anyaggal még nem teljesen tudom, most úgy érzem magam, hogy tudom így úgy mi ez meg az, de nem tudom ezeket ahogy említettem egymáshoz kötni, hogy egy letisztult képet kapjak. A 2. bekezdést már nem annyira értettem, de ez nem a te hibád, egyszerűen nem tudom felfogni mi van. De hasznos volt, megy a 100%
Jól érzed, hogy a szignifikanciaszint meghatározása a kísérletezés egyik fontos lépése, és jó irányban gondolkodsz a definícióval kapcsolatban. Most kicsit emberszerűbben magyarázom el, hogy jobban érthető legyen.
A **szignifikanciaszint** (vagy alfa-érték) azt az esélyt jelzi, hogy egy kísérlet során hamisan elvetjük a nullhipotézist, tehát azt állítjuk, hogy van valamilyen hatás vagy különbség, amikor valójában nincs (ez a hamis pozitív hiba). A leggyakoribb szint a 0,05, ami azt jelenti, hogy 5% esély van rá, hogy a kísérlet során tévesen találunk valamilyen szignifikáns eredményt, holott valójában nincs különbség.
Azért használják ezt az értéket, hogy szabályozzák, milyen szigorúan vizsgálják meg, hogy a kísérleti eredmények valóban jelentősek-e, vagy csak véletlen ingadozásokból erednek. Tehát, ha például 0,05-ös szintet választanak, akkor azt mondják, hogy 95% az esélye annak, hogy az eredmény valóban a kísérlet hatását mutatja, nem pedig véletlen zajt.
**Miért fontos ez a kísérlet előtt?**
Mert segít eldönteni, mennyire bízhatunk majd az eredményekben. Ha túl magasra (pl. 0,1) állítják a szintet, akkor könnyebben találhatnak „hamis pozitív” eredményeket, vagyis olyasmit, ami nem valódi. Ha túl alacsonyra (pl. 0,01), akkor viszont nehezebb lesz szignifikáns eredményt találni.
**Hogyan használják a szignifikanciaszintet a kísérlet után?**
A kísérlet végén az összegyűjtött adatok alapján végzik el a statisztikai elemzést, és ha az eredmények egy bizonyos szint alatt vannak (például a p-érték kisebb, mint 0,05), akkor azt mondjuk, hogy az eredmény **szignifikáns**, vagyis a különbség nem véletlen. Így a szignifikanciaszint meghatározása előre segít abban, hogy legyen egy előre definiált mérce, ami alapján eldönthetik, hogy az eredmény valóban megbízható-e.
**Hogyan határozzák meg?**
Ez részben a kísérlet jellegétől függ. Ha nagyobb a tétje annak, hogy téves eredményt kapjanak (pl. ha gyógyszerkutatásról van szó), akkor alacsonyabb szignifikanciaszintet használnak, hogy biztosak legyenek benne, az eredmény nem véletlen. Kisebb kockázatú kísérleteknél viszont lehet magasabb az alfa (például 0,1), hogy nagyobb eséllyel találjanak hatást.
Összefoglalva: a szignifikanciaszint segít megérteni, hogy mennyire lehet bízni a kísérleti eredményekben, és a kísérlet után ezt használják annak eldöntésére, hogy az eredmény valóban jelentős-e vagy csak véletlen.
Látom még mindig van némi képzavar, megpróbálom én is leírni, kicsit részletesebben.
Tudományos kísérletekben általában dolgok közötti összefüggéseket mérünk, például:
- Átlagosan magasabbak-e a magyar férfiak, mint a magyar nők?
- Az X gyógyszert szedő influenzás betegek gyorsabban gyógyulnak-e meg, mint az Y gyógyszert szedők?
Kezdjük az első, egyszerűbb példával. Ezt a kérdést megválaszolhatnánk úgy, hogy megmérjük minden magyar férfi és minden magyar nő testmagasságát, és összehasonlítjuk az átlagukat. Itt nincs szükség statisztikai tesztre, mindenkit megmértünk, az eredmény az ami. Csakhogy Magyarországon él közel 10 millió ember, mindenkit megmérni rendkívül időigényes és macerás lenne. Hatékonyabb megoldás, ha mintát veszünk a populációból, megmérjük a mintákba bekerült emberek magasságát, és ebből következtetünk a teljes populációra.
De ha nem mérünk meg mindenkit, akkor mégis honnan tudhatjuk, hogy a különbség amit látunk valóban általánosítható-e mindenkire? Ideális esetben a mintavétel véletlenszerű. De még ebben az esetben is előfordulhat, hogy mondjuk (puszta balszerencséből) sikerül az átlagosnál magasabb nőket, és az átlagosnál alacsonyabb férfiakat kiválasztanunk. (Azért pont ezt a példát hozom, mert itt tudjuk a valódi választ, nagyon sokan nagyon sok populációt megmértek, a férfiak átlagosan magasabbak mint a nők.) Vagy fordítva, magas férfiakat és alacsony nőket választunk. Itt jön képbe a mintaszám. Mekkora az esélye, hogy ha véletlenszerűen választunk egy magyar férfit, akkor ő pont 177,3 cm magas? (Egy nem túl régi adat szerint ennyi az átlagos magyar férfi testmagasság.) Gondolom el tudod képzelni, hogy ez nem túl valószínű. És annak mekkora a valószínűsége, hogy ha 10 férfit választunk véletlenszerűen, akkor az ő átlagmagasságuk pont 177,3 cm? Valószínűbb, mint egyetlen ember esetében, de nem nehéz belátni, hogy egy ekkora mintánál komoly szerepe lehet a szerencsének. Ha véletlenül 10 magas embert sikerült összeszednünk, akkor könnyen lehet, hogy az eredmény 186,5 cm lesz. És ha 1000 embert választunk? És ha 10000-ret?
Minél nagyobb a minta, annál kisebb lesz a véletlen torzító hatása. Viszont annál több idő, pénz, és energia elvégezni a mérést. Erre még visszatérünk, most maradjunk mondjuk egy 1000 fős női, és egy 1000 fős férfi mintánál.
Megmérjük őket, és mondjuk azt találjuk, hogy a férfiak testmagassága átlagosan 176,1 cm, a nőké 164 cm. Levonhatjuk-e ebből azt a következtetést, hogy az átlagos magyar férfi magasabb, mint az átlagos magyar nő? Ennek a kérdésnek az eldöntésére valók a statisztikai tesztek.
A nullhipotézis mindig az, hogy a mért változók között nincs összefüggés, ebben az esetben ezt magyarul úgy lehetne mondani, hogy a nemnek nincs hatása a testmagasságra = az átlagos férfi és az átlagos nő egyforma magas. A teszthipotézis pedig az, hogy van (valamekkora) különbség, azaz a nem és a testmagasság között van összefüggés. A statisztikai teszt, amit használni akarunk jelen esetben legyen a két mintás t-próba, és az egyszerűség kedvéért feltételezzük, hogy a mintáink megfelelnek a t-próba követelményeinek (ebbe most nem mennék bele). A teszt elvégzéséhez van egy képlet, amibe be kell helyettesíteni a megfelelő számokat. Ennek eredményeként fogsz kapni egy új számot, ez lesz a teszt statisztikád. Ekkor előveszel egy ehhez a típusú t-próbához készült táblázatot, és kikeresed a választott statisztikai szinted oszlopában és a vizsgálatod szabadsági fokainak sorában, hogy a vonatkozó teszt statisztika értéket. Ha a te számod, amit kaptál, ennél nagyobb, akkor az adott szignifikancia szinten az eredményed szignifikáns. (A kutatási gyakorlatban ezt az egész procedúrát számítógépen csináljuk, de ettől most tekintsünk el.)
És ezzel el is érkeztünk a szignifikanciához. A legegyszerűbben megfogalmazva a szignifikancia szint azt jelenti, hogy mekkora valószínűséggel veted el a nullhipotézist, miközben az valójában igaz. Magyarul: mekkora eséllyel jelented ki hogy X és Y dolog között van összefüggés, miközben a valóságban nincs, és a látott különbséget csak a véletlen torzító hatása okozta. Ezt ki lehet fejezni százalékban és tizedestörtben is. A hétköznapi életben leginkább százalékos valószínűségekről szoktunk beszélni, a matematikában viszont 0 és 1 közötti számokkal fejezzük ki. De a kettő egyenértékű, csak megfelelően kell átváltani. Például 5% = 0,05. A tudományos életben a leggyakrabban a 0,05-ös, 0,01-es, és 0,001-es szinteket használjuk, ezek az 5%-os, 1%-os, és 0,1%-os esélyű tévedés megfelelői. Ha tizedestört alakban fejezzük ki a konkrét értéket, akkor ezt általában kis p betűvel szoktuk jelölni.
Manapság a statisztikai programok könnyen ki tudják számolni az adott kísérlethez tartozó pontos p értéket, azaz a tévedésünk pontos valószínűségét, de ez nem mindig volt így. Száz meg kétszáz évvel ezelőtt, a papíron kézzel számolgatós korszakban a konkrét p értéket sokkal macerásabb volt kiszámolni, mint a teszt statisztikát. Ezért kitalálták azt a megoldást, hogy néhány fix p értékre kiszámolták, hogy mennyi lenne adott körülmények között a teszt statisztika értéke, ebből csináltak táblázatokat, és ezekben kellett kikeresni, hogy adott szinten szignifikáns-e az eredményed. Ma már néhány kattintással megkaphatjuk a konkrét p értéket, de a szintek eszméje megmaradt. A valóságban semmi mágikus nincs se a 0,05-ös, se a 0,01-es számban, egyszerűen hagyomány.
Hogy választunk szignifikancia szintet? Egyszerű: eldöntjük, hogy mekkora tévedési valószínűség az, amibe hajlandóak vagyunk beletörődni.
És itt vissza is kanyarodnék a mintaszámhoz. A testmagasságos példában viszonylag könnyű dolgunk volt, mert itt akár a teljes populációt is megmérhetnénk, ha akarnánk. A másik, influenzás példa viszont már problémásabb. Hány influenzás ember van? Ki tudja? Senki, ráadásul az emberek nem állandóan influenzásak. Elkapják, betegek, meggyógyulnak (jobbik esetben). Ha össze akarjuk hasonlítani két gyógyszer hatékonyságát, akkor mintát kell vennünk a populációból, két csoportra osztani, és kipróbálni a kérdéses gyógyszereket. De mekkora mintát vegyünk? Minél nagyobb, annál kisebb lesz a véletlen zavaró hatása, de annál többe kerül a vizsgálat, és egy bizonyos szinten túl nem igazán érdekel minket a különbség. A gyakorlatban érdekes-e, hogy egy gyógyszer 99,9%-os valószínűséggel jobb, mint a másik, vagy 99,99999% valószínűséggel? Valahol húzunk egy határt, és azt mondjuk, hogy az ennél biztosabb eredményeket egy kalap alá vesszük. És miután kiválasztottuk a szignifikancia szintünket, más matematikai módszerekkel azt is meg tudjuk becsülni, hogy mekkora mintára (=hány betegre) lesz szükségünk, hogy a kapott eredményünk hihető legyen. (Ennek a részleteibe most nem mennék bele, bonyolult.)
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!