Kezdőoldal » Számítástechnika » Programok » Adopbe reader-ben, hogyan...

Adopbe reader-ben, hogyan kell — mondjuk pl. jpg képről, mert szöveg van rajta — szövegeset előállítani, keresni is lehessen benne?

Figyelt kérdés
2009. szept. 29. 13:36
 1/4 anonim ***** válasza:
A readerrel nem lehet, de vannak olyan programok, pl fine reader.
2009. szept. 29. 13:59
Hasznos számodra ez a válasz?
 2/4 A kérdező kommentje:

A readerrel nem lehet, de vannak olyan programok, pl fine reader.

__________

Köszi a választ, de a "fine reader" úgyszólván "gagyi" sokszor értelmezhetetlen — egyébként, akkor hogyan használja az "adobe reader" a szöveget (úgy értem, hogyan illeszted be, vay konvertálod, ha nincs rá menü)?

2009. szept. 30. 07:56
 3/4 anonim ***** válasza:

Namost a fine reader lehet hogy gagyi, kipróbálhatod más cég termékeit, pl abbyy reader, keress rá arra a kulcsszóra, hogy OCR.


Az OCR egyébként azt jelenti, hogy Optical Character Recognizer vagy valami hasonló, vagyis optikai karakter azonosító. Rögtön hadd tegyek egy kis kitérőt, hogy értsd a problémát. Bizonyára láttál már captcha-t, olyan kis összezagyvált betűt, amit egyes fórumokon a belépéskor kérnek, hogy írd be. Erre gondolok: [link]


Az emberi agy számára nem jelent problémát egy összegyűrt, színes vagy áthúzott betű azonosítása, de egy programnak, ami alapvetően teljesen máshogy fog hozzá, igenis probléma. (Épp azért használjuk őket, mert így különböző programok nem tudnak automatikusan belépni egy fórumba...) Az OCR is ugye program, ami betűket azonosít. Ha te látod is a betűt, érted és jól olvasható, attól még a program nem biztos, hogy meg tudja érteni az ott lévő betűket, azaz ahogy írod, zagyvaságot fog adni, hibásan fogja azonosítani őket. A JPG-nek teljesen tisztának, minimum 300 dpi felbontásúnak kell lennie, és a betűk lehetőleg legyenek kontrasztosak. Csak mondom, hogy a pdf jó eséllyel csak 150 dpi, így nincs az az OCR, ami hibátlanul be tudja azonosítani.


Amikor pdf-ből szöveget másolsz, akkor ott valaha szöveg is colt. Vagyis írtak egy doksit, és csináltak pdf-et. Ilyenkor az adobe programmal a szövegkijelölő eszközzel vissza tudod szedni a karaktereket. De az is lehet, hogy beszkenneltek egy könyvet, amiben ugye hiába betűk vannak, maga a könyv egy jpg-ként jelenik meg, nem szerkeszthető szövegként (ugye innen hiányzik az OCR lépés ahhoz hogy karakterré váljanak a képen levő betűk) és ezt a jpg-t rakták pdf-be. Ez esetben pedig csak a képkijelölővel tudod másolni, és beleszerkeszteni a szövegbe nem fogsz tudni.


Ja, és még a szöveges pdf-et se fogod tudni rendesen visszakonvertálni szöveggé, bár vannak olyan progik, amik ezt ígérik. Nem megy nekik.


Tehát marad a tanácsom, szerezz valami ocr-t.

2009. okt. 1. 09:57
Hasznos számodra ez a válasz?
 4/4 anonim ***** válasza:

talán ezzel a progival menni fog:

JOCR

2009. okt. 1. 17:21
Hasznos számodra ez a válasz?

Kapcsolódó kérdések:




Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!