Az MT19937 pszeudo random generátor megfelelően működik minden lehetséges int értékre az alábbi python implemenációra?
Itt ugyanis a seed értéke kívül eshet az unsigned int32 tartományon és nincs ez lekezelve semmilyen módon hanem számol úgy. Ebben eltér pl a c++-os implementációtól a működése. Nem tudom, hogy ez bug vagy fícsör. Vagyis hogy megfelel e a statisztikai teszten a 32 bites tartományon kívüli seed-el és még plusz jó e mert nagyobb a kezdőállapot halmaz?
Dehogy mindegy. Nem olyan egyszerű jó random generátort csinálni, a benne használt konstansok sem akárhogyan lettek meghatározva. Az extra hosszú ( 2^19937-1 ) ismétlési periódus pedig bizonyítva van matematikailag. Halom statisztikai teszten át kellett hogy menjen és sok matematikus ellenzésén keresztül kellett hogy menjen. Ilyen generátort használnak fizetős szotfverek is és nem csak úgy Pistike által összerakott "szuper" algorimtust. Régebben és is próbáltam írni random generátort, úgy hogy csak tologattam ide oda a biteket, bitműveletek, szorzás, osztás stb. de elhasalt a statisztikai teszteken. Ha elhasal a teszten az igazolja hogy nem jó, ha nem hasal el az nem igazolja hogy jó. Pár száz, pár ezer vagy netalántán pár tízezer-százezer, de leginkább pár ezer hosszú periódus lesz, gyakrabban csak pár száz vagy ezer vagy annyi sem ha csak úgy tologatod ide oda a biteket.
Például az LCG (linear congruential generator) pszeudo random generátor algorimus nagyon nem nyilvánvaló, hogy 32 bit random pool-al 2^32 hosszú periódussal fog ismétlődi és miért tudja kihasználni a 32 bit teljes állapotterét. Ha csak úgy írsz egy algorimust rá hasraütésszerűen ezt közelíteni nem fogja, a millió hosszú periódust nem fogja elérni valószínű. Vagyis magyarul determinisztikus algorimus szerint statisztikailag random sorrendbe bejárja a 32 bit teljes állapotterét ami 2^32 lépésenként ciklikusan ismétlődik.
Kedves kérdező!
Ha már ilyen jól beleástad magad a véletlenszám generálás elméletébe, a következő ötletem van a kérdésed korrekt és pontos megválaszolására:
Generáltass vele számokat, majd az általad ismert "statisztikai módszerekkel" a tényleges ellenörzést végezd el.
Ez lesz a válasz a kérdésedre is.
Néhány kzenfekvő módszer (a teljesség igénye nélkül):
1.,
0..1 intervallumon generált számok egyenletes eloszlása - ellenprőzhető egy diagrammal (gyakorlati hisztogram próba).
2.,
egyenletes eloszlású val. változó konvertálható normális eloszlásúvá (Box-Müller konverzió) majd T próba.
3.,
D.E Knuth próbái (több is van)(gyakoriság,sorozat,hézag próba..)
Ha mélyebben érdekel a téma :
Kolmogorov-Szmirnov próba, vagy "préselés próba (squeeze-test)" re keress.
Egyszerűbb a tesztet elvégezni mint kérdezni, jósoltatni arról mi lesz az eredmény!
Köszi a választ.
Megállapítás az, hogy bug-os impelentáció avagy azzal a feltétellel jó, ha mindig unsigned int32 tartományán belüli inicializálási seed értéket kap.
Két féle lehetőség van, ha tartományon kívülivel inicializáljuk:
1.: Ekvivalnes sorozatot ad egy adott unsigned int32 seed értékkel inicializált generátor objektummal.
2.: Sok egyezőséget mutat, de nem azonos egy adott unsigned int32 seed értékkel inicializált generátor objektummal.
Röviden ez elfogadhatatlan. A tartományon belüli sedd értékekkel inicializált generátor objektumok sztochasztikus mintázat szerint eltérő lehetséges sorozatokat generálnak nagyon helyesen.
"2.: Sok egyezőséget mutat, de nem azonos egy adott unsigned int32 seed értékkel inicializált generátor objektummal. "
Mármint a generált sorozat mutat sok egyezőséget, de azt arra semmilyen garanciát/becslést nem tudok mondani, hogy megmarad e az extra hosszú periódus vagy nagyon leromlik ez esetben.
???
Python nyelvi szinten 624 elemű lista van melyben a nulladik indexű elem kezdőértékétől függ a többi elem értéke és az egész generált pseudorandom sorozat. Az MT19937 pseudorandom generátor objetkum létrehozásakor és az első generált szám előtt egy alapállapotban van a generátor. Amikor az első pseudorandom számot kérjük tőle akkor az állapotátmeneti függvénynek megfelelően az alapállapotból a következő állapotba lép a generátorobjektum. A generátor aktuális állapotát a tagváltozói tárolják értelemszerűen.
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!