Kezdőoldal » Tudományok » Társadalomtudományok és bölcsészet » Hol írnak arról, hogy egy...

Hol írnak arról, hogy egy összetömörített szöveget képviselő bitszakasz nagyon hasonlít a véletlenszerű szakaszokra?

Figyelt kérdés
A véletlenszerű eseményeknek van egyféle mintázata a statisztikában. Elvileg kimutatták, hogy ha egy értelmes szöveget maximálisan összetömörítünk, pont olyan mintázatot kapunk, mint a véletlenszerűséget leíró statisztikák esetében. Tudtok olyan könyveket, cikkeket, weboldalakat stb. amik ezt magyarázzák?

2016. aug. 16. 13:00
1 2
 1/15 anonim ***** válasza:

Én még nem hallottam erről, és így első hallásra kicsit furcsa is. Pl. milyen algoritmussal tömörítsük?

De kíváncsi vagyok, ha van ilyen cikk.

2016. aug. 16. 13:26
Hasznos számodra ez a válasz?
 2/15 anonim ***** válasza:
"Elvileg kimutatták..."
2016. aug. 16. 17:00
Hasznos számodra ez a válasz?
 3/15 A kérdező kommentje:

Erről egy matekproftól hallottam még régebben. Most megpróbálom összegezni a lényegét. Szóval pl. pénzérmét dobálunk és megfigyeljük a fejek és írások számát és elhelyezkedését.

Tegyük fel, hogy a fej és írás esélye 50-50%, illetve hogy a dobások egymástól függetlenül történnek.

Ha 10.000 dobás történt, akkor ennek kb. 50%-a várhatóan fej lett. A statisztikusok használnak egy sztenderd eltérés nevű értéket (ami ebben az esetben 50), és ha az eredmény kétszer-háromszor jobban eltér ettől az értéktől, akkor a pénzfeldobást úgy ítélik meg, hogy nem várt eredményt hozott, vagyis nem tekinthető tisztán véletlennek a folyamat.

Így 10.000 dobásból 5047 fej rendben van, de 5386 már erősen eltér, 6023 pedig még inkább.

Ám a dolog összetettebb, mert ha két egymás utáni dobás eredményét vizsgáljuk, akkor elvárható lenne, hogy minden lehetséges kombináció – fej-fej, írás-írás, fej-írás, írás-fej – egyformán 25%-ban fordul elő. Itt is meg van határozva egy sztenderd eltérés érték. Ugyanígy megvizsgálhatjuk a dobáseredményeket hármas, négyes és további csoportok szerint is.

A nagy számok törvénye alapján az eltérés sosem lehet nagyobb a meghatározottnál.


Manapság számos tömörítőprogram azt csinálja, hogy vesz egy szövegszakaszt, és azt rövidebb formába kódolja, hogy kisebb helyen tárolható legyen. Kiderült, hogy ha egy szöveget összetömörítenek, akkor az azt képviselő bitszakasz nagyon hasonlít a véletlenszerű szakaszokra. Egy maximálisan tömörített szöveg eleget tesz a fent említett összes kritériumnak, amit véletlen sorozatoktól elvárhatunk. Ennek ellenére a szakasz értelmes üzenetet tartalmaz kódolt formában.


Következtetésképpen egy szakasz tűnhet véletlennek, még akkor is, ha valójában dekódolható, és egy értelmes üzenetet rejt. Ez a megállapítás a kvantummechanikai események alapján kapott véletlen szakaszokra is igaz, ezért a professzor azzal érvelt, hogy téves az az elképzelés, mely szerint Isten biztosan nem piszkálhat a fizikai rendszerek működésébe úgy, hogy azt nem érzékelhetjük. Megdöbbentő gondolatmenet, de a lényeg, hogy szeretnék meggyőződni, hogy ez tényleg így van-e, ahogy mondta.


Ha valakit érdekel, van egy másik módszer is, amivel úgy piszkálhatnak hozzá a fizikai világ rendszerébe, hogy azt műszerekkel kimérhetnénk. A részecskék paramétereit ugyanis csak bizonyos pontossággal (asszem 7-8 tizedesjegyig) tudják kimérni. Ha tehát a mérési határon túli értékeken valaki módosít, akkor a pék-transzformációhoz és szélső értékhez hasonló törvényszerűségek hatására a kaotikus természetű fizikai rendszerekben ezek az apró változások az idő haladtával exponenciálisan megnövekednek, oly módon, hogy a mi makroszintünkön is tapasztalható változás jön létre - anélkül, hogy azt kimérhetnénk. Mindegy, ez csak amolyan filozófiai csemegézés nekem, de mégis fontosnak tartom és érdekesnek.

2016. aug. 17. 12:10
 4/15 anonim ***** válasza:

A fizika prof. információ elmélettel vagy számítástudománnyal is foglalkozik?

Én nem vagyok prof(i), de szerintem itt arról van szó, hogy egy adott kód mennyire használja ki a szabályok adta lehetőségeket. Pl. ha bájtonként 8 biten tárolhatunk adatokat, de minden bájtban csak 1 és 100 közötti érték szerepel, akkor nincs kihasználva. A tömörítő algoritmusok elég jól vannak kitalálva ahhoz, hogy kihasználjanak minden lehetséges értéket, nem úgy, ahogy pl. egy szöveg ASCII vagy UTF8 kódolásánál.


A másik, hogy az egyenletes eloszlás nem azonos a véletlen számokkal. Ha az eredeti szövegben egy karaktert megváltoztatok, jó eséllyel nem fog a teljes kódsorozat megváltozni. (Nem ellenőrző összegről vagy titkosításról beszélünk!)


És mi van egy olyan sorozattal, hogy mondjuk 1,2,3,...? Egyenletesen lesznek benne az értékek, csak elég alacsony lesz az információtartalma. A tömörített adatok viszont igen sok információt hordoznak, vagy mondhatjuk úgy is, hogy nagy a váratlansága, "meglepetés ereje". De szerintem nem szerencsés ezt keverni a véletlen számokkal.

2016. aug. 17. 15:16
Hasznos számodra ez a válasz?
 5/15 A kérdező kommentje:

Információ elmélettel és számtechkel is foglalkozik, bár nem tudom, hogy milyen mélyen.


A kérdés, hogy a kvantummechanika események leírását alkotó véletlen szakaszoknak mekkora az információ mennyisége? (Nekem fogalmam sincs róla.) Asszem itt jön be a határozatlansági reláció - minél pontosabban megmérünk egy értéket, annál pontatlanabbul tudjuk annak a tulajdonságpárját. Az információ elmélet szerint ilyenkor változik az információ tartalom? Minél pontosabb mérést végzünk, annál jobban nő (vagy csökken) a kvantumfizikai események véletlenszerű szakaszainak információtartama?

2016. aug. 19. 10:44
 6/15 A kérdező kommentje:

"És mi van egy olyan sorozattal, hogy mondjuk 1,2,3,...? Egyenletesen lesznek benne az értékek, csak elég alacsony lesz az információtartalma."


Erről még az jutott eszembe, hogy az 1,2,3.. sorozat inkább hogy nem várt sorozat, ha a véletlen "állította" így elő. Ebből a szempontból pedig nagy az információ tartalma.


Vagy például visszatérve a pénzérmés példához: ha 10.000 dobásból pontosan 5000 a fej és 5000 az írás, és ráadásul pont sorban követik egymást: fej-írás, fej-írás, fej-írás stb. akkor habár nagyon egyenletes a sorozat eloszlása, mégis mérget vennénk rá, hogy ez nem a puszta véletlen eredménye.


A matekdoktor csak annyit állított, hogy a szakemberek által kidolgozott véletlen statisztikák érvényesek a maximálisan tömörített szöveges dokumentumokra is.

2016. aug. 19. 10:55
 7/15 anonim ***** válasza:

"Erről még az jutott eszembe, hogy az 1,2,3.. sorozat inkább hogy nem várt sorozat, ha a véletlen "állította" így elő. Ebből a szempontból pedig nagy az információ tartalma."


Hát nem tudom, én nem így tanultam. De mint mondtam, nem vagyok profi. :)


"a szakemberek által kidolgozott véletlen statisztikák érvényesek a maximálisan tömörített szöveges dokumentumokra is"


Nem igazán értem, mi az hogy "véletlen statisztikák". Csak az eloszlás jut eszembe, de így ez megint keveredik a véletlennel. Az egyenletes eloszlás nem elégséges feltétele a véletlen számsorozatnak.


Ha esetleg valaki jobban otthon van a témában, leírhatná, hogy hogyan függnek össze ezek a fogalmak:

- statisztikai eloszlás

- véletlen

- információ tartalom (a tömörített adatok miatt)


Vagy ez hátha segít.

[link]

2016. aug. 19. 13:24
Hasznos számodra ez a válasz?
 8/15 A kérdező kommentje:

Fú, lehet, hogy Te nem vagy profi, de én még annyira sem, mert magas volt Shannon entrópiafüggvénye... (persze, egyáltalán nem tanultam ilyeneket.)


Köszönöm a válaszokat, nagy hasznosak voltak. Jó a kiindulópont is, hogy mi az összefüggés az általad felsorolt fogalmak között. Attól tartok, hogy nincsenek teljesen letisztázva a definíciók. Valahol olvastam, hogy pl. egy nyerő lottószelvénynek nagyobb az információ tartalma, mint a nem nyerőnek, mivel az sokkal ritkább. Viszont mindkettő tudatos tevékenység által kitöltött, ugyanakkor mindkét esetben véletlenszerűen vannak elszórva a jelzések. Éppen ezért (innen ez már az én gondolatmenetem) az információtartamból nem lehet következtetni arra, hogy véletlen vagy tudatosan megszerkesztett sorozatról beszélünk-e.

2016. aug. 20. 09:57
 9/15 anonim ***** válasza:

"Valahol olvastam, hogy pl. egy nyerő lottószelvénynek nagyobb az információ tartalma, mint a nem nyerőnek, mivel az sokkal ritkább."


A nyerő és nem nyerő szelvények előfordulási valószínűsége ugyanannyi. Attól semmi nem változik, hogy ezek közül az egyiket kiválasztják valami alapján.

Annyi igaz, hogy 1 db szelvény ritkább, mint a többi X-millió (?) együtt, de ez triviális és a téma szempontjából irreleváns.

2016. aug. 20. 11:04
Hasznos számodra ez a válasz?
 10/15 A kérdező kommentje:
Azt hiszem, nem értem a problémádat. Egy véletlenszerű fej-írás dobássorozat statisztikai jellemezői (tehát az írások és fejek aránya és elhelyezkedése) elvileg nagyon hasonlítanak egy bármilyen algoritmussal maximálisan tömörített szöveges dokumentum bitszakaszához (tehát a 0-ák és 1-esek arányához és elhelyezkedéséhez). Ha ez igaz, mi alapján állapítod meg a relatíve nagy vagy kicsi információ tartalmat?
2016. aug. 20. 12:07
1 2

Kapcsolódó kérdések:




Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!