Regressziós egyenes és szórást szeretnék számolni 3 dimenziós térben. Tehát 3 adatsorom van és ezek kapcsolata érdekel. Hogyan tudnám az egyenes egyenletét és a pontoknak az egyenestől való távolságát meghatározni Excel vagy Maple segítségével?
Itt felmerül az a kérdés, (ami amúgy 2 dimenziósnál is), hogy melyik érték ami mérési bizonytalansággal vagy egyéb zavarral terhelt.
2 dimenziósnál alapeset, hogy az x értékeket pontosnak veszed, és a pont távolsága az egyenestől, amik négyzetösszegét minimalizálja az eljárás, az az y koordináták, eltérése, nem a regressziós egyenesre bocsátott merőlegesek hosszának négyzetösszege.
Ez akkor alkalmazható, ha az X értéked teljesen biztos, mondjuk naptári dátumok. Ha X és Y is külső tényezőktől zavart, akkor szerencsésebb a tényleges pont-egyenes távolságot minimalizálni.
Három dimenzióban több variáció is felmerül....
Azt csak Te tudod, hogy miféle adatokról van szó, tehát hogy mi a kérdés...
A legelterjedtebb eset, hogy két magyarázó és egy függő változónk van, tehát pl. a gyerek tanulmányi átlagát akarjuk magyarázni a szülők havi jövedelme és iskolai végzettsége alapján. Mondjuk az "egyenes" szót használod, de ez "felület", ha lineáris összefüggést feltételezel, akkor z = ax+by+c alakban leírható sík.
Elmélet: [link]
Tudtommal az Excel nem tud többváltozós regressziót és korrelációt számolni, a Maple-t nem ismerem, SPSS-t szoktak használni ilyesmire.
De az Excelben is van Solver bővítmény, azzal lehet minimalizálni, így megkaphatók a fenti sík paraméterei.
A változozót tekinthetjük függetlennek. Persze összefüggés van közöttük, de A pont annyira függ B-től mint C-től és mint C B-től.
Ha térben ábrázolnánk a pontokat tényleg lehet rá illeszteni egyenest. A z= ax+by+c kiszámítását 3 pontonként elvégeztem. Tehát a meglévő x;y;z adatokhoz kiszámoltan az a;b;c -ket. Ez 5 adatnál 10 egyenes, itt még érzésre ki lehet szűrni legjobban kilógó adatokat és a 3 legjobban simuló számhármasra illesztettem az egyenest és láttam a maradék kettő adathármas távolságát az "egyenes"-től az az a trendtől.
Az adatok szaporodásával valami profibb módszer lenne szükségem a z= ax+by+c illeszkedő egyenes meghatározásához.
Az SPSS és hasonló szoftverek használata azért nem tetszik mert ugyan ad sok információt, de ezek nagy részére nincs szükségem, az a a kevés ami kéne az pedig nehéz kikonvertálni belőle olyan egyszerű formátumban amire szükségem van.
Az egyetemi tananyagokkal az a bajom, hogy úgy számolnak a dimenziókkal mint az indiánok; 1-2-sok.
Nekem a kettő kevés, a sok, sok. Nekem pont 3 kéne. Meg kéne taulni az egész könyvet, hogy egy egyenletet hasznosítani tudjak...
Valójában azért tettem fel itt a kérdést, hátha valaki beírja az egyetlen egyenletet...
Hát nem fogja senki beírni, mert ez sajnos nem a tipikus eset.
Amúgy nem értem, amit felírtál, az a SÍK egyenlete, nem egyenesé. Egy térbeli egyenest meghatároz pl. egy pontjának az x,y,z koordinátája, és az (A,B,C) irányvektora. Vagy - gondolom - úgy érted, hogy az öt pontod meghatároz tíz irányvektort kezdőponttal, és ezeket kelene összevonni. A Solver bővítményt ajánlom, az tud többparaméteres optilalizációt.
Az egyik irányvektort és kezdőpontot megadod kiindulási adatnak. Minden adatpontnak kiszámítod a távolságát ettől az egyenestől, ezek abszulút értékét vagy négyzetét összegzed, és azt mondot a Solver- nek, hogy az az érték legyen minimális, ehhez variálja a kezdőpont koordinátáit és az irányvektor értékét (6 adat)
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!