Kezdőoldal » Számítástechnika » Programok » Hogyan lehet scannelt könyvet...

Hogyan lehet scannelt könyvet szöveggé alakítani?

Figyelt kérdés
Nem tudok a le töltött pdfben keresni, mert a könyv be lett scannelve, szóval a kereső nem ismer fel egy betűt sem. Hogyan lehetne megoldani hogy kereshető legyen? Egy konkrét dolgot szeretnék megtalálni. De nem akarok hetekig olvasni egy 600 oldalas könyvet hogy meglegyen.
2021. okt. 6. 00:13
 1/9 anonim ***** válasza:

OCR-el át kell alakítani előbb a dokumentumot, akkor kereshetővé válik.

Sajnos a karakterfelismerés hatékonysága betűtípus és méret függő, ezen túlmenően maga a szkennelés minősége is befolyásolja.

2021. okt. 6. 00:31
Hasznos számodra ez a válasz?
 2/9 anonim ***** válasza:

Ha magyar nyelvű, akkor rossz híreim vannak.

A magyar elég gáz a felismerés szempontjából.

Ha nincsenek ékezetek, pl. angol nyelvű, akkor elég jó a felismerési arány, de ha magyar, akkor az ingyenes módszerekkel nem fogsz használható eredményt kapni.

2021. okt. 6. 00:40
Hasznos számodra ez a válasz?
 3/9 A kérdező kommentje:
Magyar könyv. Próbáltam ilyen ocr programot, de egyik sem engedett 100 mbnál nagyobb filet. Amúgy nagyon jó minőségű szkenn, tök éles, pontos, jól be lehet zummolni.
2021. okt. 6. 00:44
 4/9 anonim válasza:
Gyors ötletként, egy pdf szerkesztő programmal darabold fel a könyvet kisebbre, hátha úgy elfogadják. Végső esetben akár oldalanként képként elmented. Persze nagy munka, de képet biztos elfogadnak ezek az átalakitó programok.
2021. okt. 6. 01:54
Hasznos számodra ez a válasz?
 5/9 anonim ***** válasza:

vagy letöltesz egy ocr progit

bár a feltelepítése problémásabb, ha nem értesz hozzá

[link]

[link]

2021. okt. 6. 10:27
Hasznos számodra ez a válasz?
 6/9 anonim ***** válasza:
És azt lehet tudni, mit szeretnél megtalálni és melyik könyvben?
2021. okt. 6. 10:51
Hasznos számodra ez a válasz?
 7/9 anonim ***** válasza:
Milyen PDF olvasót használsz? Mert van ám olyan, hogy a PDF-be beleteszik az OCR-el beolvasott tartalmat is, csak abban nem minden olvasó tud keresni.
2021. okt. 6. 11:38
Hasznos számodra ez a válasz?
 8/9 anonim ***** válasza:

Van egy nagyon jó kis ingyenes PDF olvasó, ami (sok más jó tulajdonsága mellett) beépített OCR-t is tartalmaz: PDF XChange VieWer

Már évek óta nem fejlesztik, de az utolsó verzió továbbra is letölthető a gyártó weboldaláról:

[link]

(Van egy utód-termék, a PDF XChange Editor, de az szerintem még mindig nem hozza az elődje minóségét.)

A telepítője angol, de nem kell megijedni, mert telepítés után az Edit -> Preferences menüben át lehet váltani magyar nyelvre; a magyarítás (szinte) hibátlan. Ugyanitt érdemes kikapcsolni a keresésszolgáltatókat.

Az OCR alapból csak pár nyelv felismerését támogatja, a többihez (köztük a magyarhoz) külön kell telepíteni ezt:

[link]

Sajnos ez csak sima HTTP protokollal érhető el, HTTPS-sel nem, emiatt a legtöbb böngésző már hisztizik, de lépjünk túl rajta.

A PDF fájl megnyitása után a Dokumentum -> OCR pages… menüpontban lehet elindítani a felismerést. Ez a rész sajnos nincs magyarítva, de nem ördöngősség: a Primary Language-et kell Hungarian-ra, az Accuracy-t Medium-ra állítani, a többi maradhat az alapbeállításon.

OK-ra kezd el dolgozni, ha végzett, elmenthetjük a fájlt.

A felismert szöveget külön rétegként adja hozzá: nem látjuk azt, de az Eszközök -> Alapvető eszközúk -> Kijelölés eszközt kiválasztva ki tudjuk jelölni. (Ez külön gombként az eszkötáron is kint van.)

Azzal azért számolni kell, hogy a legtökéletesebbnek tűnő nyeranyag esetén is lehetnek (lesznek is) rosszul felismert betűk/szavak, pl. I helyett l, vagy ü helyet ii, stb. Tehát ha a keresés (Ctrl+F vagy távcső ikon) nem találja meg a teljes szót, akkor meg lehet próbálni annak csak egy részletére rákeresni.

Altalában a sima, fekete-fehér doksikkal van a legkevesebb gond, viszont ha a szkennelt szöveg alá volt húzogatva, vagy szövegkiemelőzve, akkor akár eléggé reménytelen is lehet az eredmény.

2021. okt. 7. 04:52
Hasznos számodra ez a válasz?
 9/9 anonim ***** válasza:

Bocsánat, nem tudom mit néztem el hajnalban, de most ellenőrizve a HTTPS-ses [link] link is működik már!

A többi elgépelésért is elnézést kérek!

(#8 voltam)

2021. okt. 7. 08:40
Hasznos számodra ez a válasz?

Kapcsolódó kérdések:




Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!