Adopbe reader-ben, hogyan kell — mondjuk pl. jpg képről, mert szöveg van rajta — szövegeset előállítani, keresni is lehessen benne?
A readerrel nem lehet, de vannak olyan programok, pl fine reader.
__________
Köszi a választ, de a "fine reader" úgyszólván "gagyi" sokszor értelmezhetetlen — egyébként, akkor hogyan használja az "adobe reader" a szöveget (úgy értem, hogyan illeszted be, vay konvertálod, ha nincs rá menü)?
Namost a fine reader lehet hogy gagyi, kipróbálhatod más cég termékeit, pl abbyy reader, keress rá arra a kulcsszóra, hogy OCR.
Az OCR egyébként azt jelenti, hogy Optical Character Recognizer vagy valami hasonló, vagyis optikai karakter azonosító. Rögtön hadd tegyek egy kis kitérőt, hogy értsd a problémát. Bizonyára láttál már captcha-t, olyan kis összezagyvált betűt, amit egyes fórumokon a belépéskor kérnek, hogy írd be. Erre gondolok: [link]
Az emberi agy számára nem jelent problémát egy összegyűrt, színes vagy áthúzott betű azonosítása, de egy programnak, ami alapvetően teljesen máshogy fog hozzá, igenis probléma. (Épp azért használjuk őket, mert így különböző programok nem tudnak automatikusan belépni egy fórumba...) Az OCR is ugye program, ami betűket azonosít. Ha te látod is a betűt, érted és jól olvasható, attól még a program nem biztos, hogy meg tudja érteni az ott lévő betűket, azaz ahogy írod, zagyvaságot fog adni, hibásan fogja azonosítani őket. A JPG-nek teljesen tisztának, minimum 300 dpi felbontásúnak kell lennie, és a betűk lehetőleg legyenek kontrasztosak. Csak mondom, hogy a pdf jó eséllyel csak 150 dpi, így nincs az az OCR, ami hibátlanul be tudja azonosítani.
Amikor pdf-ből szöveget másolsz, akkor ott valaha szöveg is colt. Vagyis írtak egy doksit, és csináltak pdf-et. Ilyenkor az adobe programmal a szövegkijelölő eszközzel vissza tudod szedni a karaktereket. De az is lehet, hogy beszkenneltek egy könyvet, amiben ugye hiába betűk vannak, maga a könyv egy jpg-ként jelenik meg, nem szerkeszthető szövegként (ugye innen hiányzik az OCR lépés ahhoz hogy karakterré váljanak a képen levő betűk) és ezt a jpg-t rakták pdf-be. Ez esetben pedig csak a képkijelölővel tudod másolni, és beleszerkeszteni a szövegbe nem fogsz tudni.
Ja, és még a szöveges pdf-et se fogod tudni rendesen visszakonvertálni szöveggé, bár vannak olyan progik, amik ezt ígérik. Nem megy nekik.
Tehát marad a tanácsom, szerezz valami ocr-t.
talán ezzel a progival menni fog:
JOCR
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!