Deriválásnál miért és hogyan egyszerűsödik ki az alábbi kifejezés?
z = w * dy / ds
y = s * x
=>
z = w * x
Kérdéseim:
1. Hogyan egyszerűsödhet ki ez a kifejezés, ahol ds (ami szerint deriválunk) ugye végtelen kicsi változás, melynek függvényében a dy változásra vagyunk kíváncsiak, de s pedig egy konkrét érték? Kiegyszerűsíthati-e az s a ds-t (meghagyva x-et maradékként)? Egyáltalán behelyettesíthető az első sorba a második? Levezetés szerint azt látom h igen, de miért?
2. Itt a d alatt a deriválás jelét értettem, nem pedig a kis 'd'-t.
Egyébként mi a pontos különbség a kettő között? Mivel egyikkel és másikkal is láttam már felírva hasonlókat, gondolom nem ugyanazt jelenik..
3. Igaz, hogy y = x^T lesz az eredmény, ha y és x vektorok, s pedig mátrix? Miért?
Tudnátok linkelni ide vonatkozó szócikkeket némi magyarázattal, hogy megértsem, mi miért történik pontosan?
Elnézést, elírtam..
3. kérdésben, y = w * x^T akar lenni...
Előre is köszi a tippeket!
rosszul sikerült a javítás is... :D
z = w * x^T -re gondoltam
Alapvetően jó lenne, ha a betűidet definiálnád.
Ha jól értem, az a kérdésed hogy s*x s szerinti deriváltja miért x? (vagy x^T)
"Kiegyszerűsíthati-e az s a ds-t (meghagyva x-et maradékként)?"
Nem.
"Egyáltalán behelyettesíthető az első sorba a második?"
Alapvetően bárhova behelyettesíthető bármi. (fixme?)
- - -
2.: [link]
E szerint a parciális jellel '∂' úgy deriválunk hogy az egyik változó szerint deriválunk míg a többi konstans, 'd' jellel meg úgy deriválunk hogy a többi változó nem konstans, hanem az implicit összefüggések igazak maradnak :o
Ilyesmiről még én sem hallottam (biztosan ellógtam a többváltozós analízist) vonatkozó szakirodalomnak én is örülnék.
- - -
3: Még soha nem hallottam mátrix szerinti deriválásról.
Vektorok mátrixok szerinti deriválásáról nem ír a wiki, de nem hiszem hogy transzponálódna a vektor. Vonatkozó irodalom:
(És az sem árt, ha leírod hogy minek a végeredménye lesz mennyi...)
2: talán
d(xy) = dx*y + dy*x, míg
∂(xy) = [y,x]
Vagy valami ilyesmi. Mi nem igazán használtuk (vagy definiáltuk) ezeket jelöléseket :/
szia, köszi a választ, sokat segítettél, zöld kéz ment!
"Ha jól értem, az a kérdésed hogy s*x s szerinti deriváltja miért x? (vagy x^T)"
Nem egészen ez volt a kérdésem. A kérdésem inkább vmi ilyesmi:
adott : z = w * dy / ds
és ismert : y = s * x
ekkor pontosan hogyan és miért tehetjük meg azt, hogy az első kifejezésbeli dy helyére az y-nal adott kifejezést behelyettesítjük, mert a levezetésben ilyesmi van:
z = w * dy / ds = w * d(s * x) / ds = w * x^T
bár a levezetésben a második és harmadik egyenlőségjel közötti rész nincs konkrétan leírva, csak a végeredmény..
A betűket nem definiáltam, mert egy nagyobb kifejezés részei, ezért csak egyszerűsítve írtam fel az egészet.. A levezetést egyébként MOE (Mixture of Experts) kapuzó hálózatoknál találtam, a 9.2-es fejezetében ennek a könyvnek:
(sajnos az online verzióból a képletek valamiért hiányoznak)
Ebben a fejezetben valahol?
Én semmit nem találok, ahol mátrix szerint kéne deriválnod :/
Nagyon esetleg feltételes valószínűséget/várható értéket venned (mátrix értékű vv szerint).
Fogalmam sincs, hogy ez formailag megegyezik-e azzal az apparátussal, amit a wikiből linkeltem, elsőre azt mondanám hogy nem, és hogy zárd be gyorsan azt a lapot.
Fogalmam sincs hogy a d betűk mit jelentenek (mondjuk 9.12, 9.15 vagy 9.21-ben más és más), de deriválást nem látok. Alapvetően nem tűnik vészesnek a könyv.
- - -
Nem hiszem hogy ezt a levezetést elsődlegesen formailag kéne látnod, olyan rövid hogy sokkal inkább hordozhat fogalmi jelentést (egy darab szorzás van benne, körülbelül lineáris kapcsolatot állít).
Nem tetszik amiket írsz róla, hogy megtranszponálódna valamiért a mennyiség.
De nem én vagyok aki segíteni tud :(
köszönöm az ötleteket, sokat segítettél, szerintem jók amiket írtál!
igen, egész pontosan a (9.40)-es, (9.43)-as és (9.44)-es összefüggések azok..
A teljes levezetés valóban nincs itt és csak koncepcionálisan kellene tudni, de szeretném alaposabban átlátni ezeket az összefüggéseket..
Mivel a linkelt könyvben nálam nem látszik, ezért kiírtam a képleteket:
(szigma itt egy konkrét szakértő paramétereit összefogó mátrix, x az input, y output, ennél a képletnél csak lineáris kapcsolat van a kettő között, de egy másik anyagban lesz majd más jellegű kapcsolat is, ezért is szeretném ezt itt megérteni)
"Nagyon esetleg feltételes valószínűséget/várható értéket venned (mátrix értékű vv szerint)."
Az egésznek valóban lehet valószínűségi értelmezése (bizonyos feltételek teljesülése esetén, ezért ez egy egész jó ötlet, csak én még nem láttam ezelőtt deriváltként ilyesmit kifejezve).
Erről tudsz mondani néhány szót, hogy lehet értelmezni a mátrix értékű valószínűségi változókat deriváltként?
Utólagos engedelmeddel bedobtam a kérdésed az index fórum kérdezgetős témájába (azt talán két darab matematikus is nézi aktívan, nagyon másik helyet nem ismerek).
Itt lesz olvasható, ha visszaírnak valamit:
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!