Mi a bizonyítéka, hogy a számokat legjobb esetben is csak logaritmikus tárban lehet tárolni?
Tulajdonképpen egy olyan algoritmusról szeretnénk belátni, hogy nem létezik, aminek az inputja egy szám (n), és az outputja egy O( log(log(n)) ) véges sok karakterből álló reprezentáció, melyből egyértelműen visszaszámítható az input.
Hogy fognál hozzá?
#3-as, igen, elhagyva az igényt, hogy minden számítást egyszerűen el lehessen végezni velük, ami eddig egyszerű volt.
@2*Sü, logikus a válaszod, mint mindig, de élsz a prekoncepcióval, hogy minden karakter számjegy, és az egymás után írtjuk a = szumma k=0-től n-ig a_k × b^k értékeként előáll - b különböző számjegy esetén. Holott megengedhetnénk bizonyos karaktereknek műveleti jelentést is, pl. összeadás és hatványozás.
Ekkor 100000003 kilenc karakter, viszont 10^9+3 csak hat. Ehhez viszont ismerni kell a szóban forgó szám partícióit, és megtalálni azt, amelynek tagjai kis számok nagy hatványai. Esetünkben az 100000000+3 partíció volt a releváns. Valószínűleg ennek a számnak ennél hatékonyabb felírása nincs is.
Úgy gondolom, hogy végignézni exponenciálisan sok partíciót - száznak pl. 190M+ partíciója van - elég komoly trade-off.
> Holott megengedhetnénk bizonyos karaktereknek műveleti jelentést is, pl. összeadás és hatványozás.
Teljesen mindegy. A jelek száma, így a belőlük képezhető kombinációja – függetlenül azok jelentésétől – fix. Ha egy jelkombinációhoz pontosan egy számot rendelsz hozzá, akkor a leírható számok száma – nem a nagysága, hanem a darabszáma – maximálisan a kombinációk száma lesz.
Teljesen lényegtelen a kérdés szempontjából, hogy a jelkészletből képezhető kombinációkhoz milyen számokat rendelsz hozzá. Ez akár lehet teljesen esetleges is. Pl. ha a jelkészlet {A,B,C}, és „kétjegyű” számokról van szó, akkor lehet ez is egy hozzárendelés:
AA → 0
AB → 0,5
AC → 1
BA → 7
BB → 42
BC → 1000000
CA → 10¹⁰⁰
CB → googolplex
CC → Graham-szám
Hogy a hozzárendelésekkel rendelkező számok nem egészek vagy nem folytonosak, az lényegtelen. A lényeg, hogy a jelkészletnek 9 darab kétjegyű kombinációja van, így maximálisan 9 szám van, ami leírható a jelkészlet kétjegyű kombinációival.
> Ekkor 100000003 kilenc karakter, viszont 10^9+3 csak hat.
Oké, csak ezzel behoztál két extra karaktert a jelkészletbe, ráadásul ezek bizonyos kombinációihoz – pl. ^+1093 vagy +^++^+ – nem rendeltél értéket, illetve több jelsorozathoz ugyanazt a számot rendeled hozzá – pl. 11^0+3=12^0+3=99^0+3 –, és bár a hat jellel jóval nagyobb számok is leírhatók – pl. 9^9^99 –, viszont bizonyos – ennél kisebb – számok nem írhatók le így hat karakterrel, pl. 1937817.
Ez a kérdés kvázi homológ azzal mintha az informatikai értelemben vett adattömörítést kérdezted volna. Ott bármely adat digitális azaz számjegyekkel ábrázolható. Egy ilyen adatot tekinthetünk egyetlen számnak is. Van több féle tömörítő algoritmus, ha a tényleges adatra vagyunk kíváncsiak ami tömörített akkor előtte ki kell tömöríteni, ez történik mindig a háttérben tömörített adatok esetében. Csak bizonyos adatok tömöríthetők be, de összességében nem tudunk tömöríteni a, ha a lehetséges adatok halmazát tekintjük. Az oka ugyanaz amit 2*Sü kifejtett már. Viszont ha az adatok a jellegüknél fogva olyanok, hogy tömöríthetőek (mármint mindig tömöríthető csak nem mindig lesz kisebb a tömörített állapota) , akkor spóroltunk vele tárhelyet vagy sávszélességet ... stb. Ez homológ azzal hogy csak bizonyos tulajdonságú számokat írnánk fel máshogy valamilyen algortitmus szerint melyekre igaz hogy rövidebb lesz ez a fajta felírási forma.
Eddig tömörítés alatt általános tömörítést értettem ami vesztességmentes tömörítés.
Nagyobb tömörítési arány érhető el, ha nem általános a tömörítő, hanem speciális és természetesen ez úgy nem ellentmondásos, ha vesztességes tömörítés. Így nem kapod vissza ugyanazt az adatot kitömörítés esetén, csak kb ugyanazt. Azt, hogy mit jelent az hogy kb, az a konkrét adatra jellemző tulajdonságától függ. Akkor matematikailag tekintve van egy interpretációs függvény amely megmondja azt az adatot hogy kell értelmezni és lehet távolságfüggvényt is hozzárendelni amely megmondja hogy mennyire van távol a vesztességestömörítés kitömörítése után lévő adat az eredeti adattól. Pl .jpg képek esetében is vesztességmentes tömörítés van, ott az input egy mátrix, sorból és oszlopokból álló számok/számhármasok (avagy számhármasok helyett 3 mátrix, ez már részlet kérdés, homológ hogy számhármasok a mátrix egy eleme vagy 3 mátrix van melyben számok vannak, illetve ha számokból álló mátrix akkor szürkeállományos az input). A .jpg-nek van vesztességmentes változata is különben. Azt a mátrixot is ami a kép is tekinthetem egyetlen nagy számnak.
Ha már számok, ha konkrétan számokról van szó, nem valamilyen más digitális adatról mely végső soron szám/számok. Akkor van olyan számábrázolás melynek a tárigénye a szám méretének függvényében O( log(log(n)) ) , ez a lebegőpontos számábrázolás. Persze ez se teljesen igaz, mert a kis számokra ez nem igaz. Ha csak az egész számokat vesszük és szoftveres megoldást pl a gmpy2 matematikai függvénykönyvtárban az mpfr lebegőpontos típust. Viszont itt "melyből egyértelműen visszaszámítható az input" feltétel nem teljesül, mert sok számnak ugyanaz a képbe mpfr-be. Ugyanúgy mint .jpg esetében sok különböző input mátrixot ugyanoda képezi le a jpg tömörítő, ha vesztességesre van paraméterezve.
"Pl .jpg képek esetében is vesztességmentes tömörítés van,"
"Pl .jpg képek esetében is vesztességes tömörítés van," akart lenni a mondat.
Kapcsolódó kérdések:
Minden jog fenntartva © 2025, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!