Kezdőoldal » Számítástechnika » Programok » Hogyan lehet scannelt könyvet...

Hogyan lehet scannelt könyvet szöveggé alakítani?

Figyelt kérdés

Nem tudok a le töltött pdfben keresni, mert a könyv be lett scannelve, szóval a kereső nem ismer fel egy betűt sem. Hogyan lehetne megoldani hogy kereshető legyen? Egy konkrét dolgot szeretnék megtalálni. De nem akarok hetekig olvasni egy 600 oldalas könyvet hogy meglegyen.

2021. okt. 6. 00:13

1/9 anonim

válasza:

OCR-el át kell alakítani előbb a dokumentumot, akkor kereshetővé válik.

Sajnos a karakterfelismerés hatékonysága betűtípus és méret függő, ezen túlmenően maga a szkennelés minősége is befolyásolja.

2021. okt. 6. 00:31

Hasznos számodra ez a válasz?

2/9 anonim

válasza:

Ha magyar nyelvű, akkor rossz híreim vannak.

A magyar elég gáz a felismerés szempontjából.

Ha nincsenek ékezetek, pl. angol nyelvű, akkor elég jó a felismerési arány, de ha magyar, akkor az ingyenes módszerekkel nem fogsz használható eredményt kapni.

2021. okt. 6. 00:40

Hasznos számodra ez a válasz?

3/9 A kérdező kommentje:

Magyar könyv. Próbáltam ilyen ocr programot, de egyik sem engedett 100 mbnál nagyobb filet. Amúgy nagyon jó minőségű szkenn, tök éles, pontos, jól be lehet zummolni.

2021. okt. 6. 00:44

4/9 anonim válasza:

Gyors ötletként, egy pdf szerkesztő programmal darabold fel a könyvet kisebbre, hátha úgy elfogadják. Végső esetben akár oldalanként képként elmented. Persze nagy munka, de képet biztos elfogadnak ezek az átalakitó programok.

2021. okt. 6. 01:54

Hasznos számodra ez a válasz?

5/9 anonim

válasza:

vagy letöltesz egy ocr progit

bár a feltelepítése problémásabb, ha nem értesz hozzá

[link]

2021. okt. 6. 10:27

Hasznos számodra ez a válasz?

6/9 anonim

válasza:

És azt lehet tudni, mit szeretnél megtalálni és melyik könyvben?

2021. okt. 6. 10:51

Hasznos számodra ez a válasz?

7/9 anonim

válasza:

Milyen PDF olvasót használsz? Mert van ám olyan, hogy a PDF-be beleteszik az OCR-el beolvasott tartalmat is, csak abban nem minden olvasó tud keresni.

2021. okt. 6. 11:38

Hasznos számodra ez a válasz?

8/9 anonim

válasza:

Van egy nagyon jó kis ingyenes PDF olvasó, ami (sok más jó tulajdonsága mellett) beépített OCR-t is tartalmaz: PDF XChange VieWer

Már évek óta nem fejlesztik, de az utolsó verzió továbbra is letölthető a gyártó weboldaláról:

[link]

(Van egy utód-termék, a PDF XChange Editor, de az szerintem még mindig nem hozza az elődje minóségét.)

A telepítője angol, de nem kell megijedni, mert telepítés után az Edit -> Preferences menüben át lehet váltani magyar nyelvre; a magyarítás (szinte) hibátlan. Ugyanitt érdemes kikapcsolni a keresésszolgáltatókat.

Az OCR alapból csak pár nyelv felismerését támogatja, a többihez (köztük a magyarhoz) külön kell telepíteni ezt:

[link]

Sajnos ez csak sima HTTP protokollal érhető el, HTTPS-sel nem, emiatt a legtöbb böngésző már hisztizik, de lépjünk túl rajta.

A PDF fájl megnyitása után a Dokumentum -> OCR pages… menüpontban lehet elindítani a felismerést. Ez a rész sajnos nincs magyarítva, de nem ördöngősség: a Primary Language-et kell Hungarian-ra, az Accuracy-t Medium-ra állítani, a többi maradhat az alapbeállításon.

OK-ra kezd el dolgozni, ha végzett, elmenthetjük a fájlt.

A felismert szöveget külön rétegként adja hozzá: nem látjuk azt, de az Eszközök -> Alapvető eszközúk -> Kijelölés eszközt kiválasztva ki tudjuk jelölni. (Ez külön gombként az eszkötáron is kint van.)

Azzal azért számolni kell, hogy a legtökéletesebbnek tűnő nyeranyag esetén is lehetnek (lesznek is) rosszul felismert betűk/szavak, pl. I helyett l, vagy ü helyet ii, stb. Tehát ha a keresés (Ctrl+F vagy távcső ikon) nem találja meg a teljes szót, akkor meg lehet próbálni annak csak egy részletére rákeresni.

Altalában a sima, fekete-fehér doksikkal van a legkevesebb gond, viszont ha a szkennelt szöveg alá volt húzogatva, vagy szövegkiemelőzve, akkor akár eléggé reménytelen is lehet az eredmény.

2021. okt. 7. 04:52

Hasznos számodra ez a válasz?

9/9 anonim

válasza:

Bocsánat, nem tudom mit néztem el hajnalban, de most ellenőrizve a HTTPS-ses [link] link is működik már!

A többi elgépelésért is elnézést kérek!

(#8 voltam)

2021. okt. 7. 08:40

Hasznos számodra ez a válasz?

Kapcsolódó kérdések:

Tudtok olyan könyvolvasót mondani, amelyiken a scannelt pdf cuccok teljesen jól olvashatóak?

Akinek van eink kijelzős e-book olvasó olvassa a PDF-et, és a scannelt PDF-et?

Könyvből scannelt e-book fájl házilag?

Van valami konverter ami scannelt pdf fájlt kindle olvasón olvashatóvá tesz?

Valaki küldene nekem emailben egy lefénymásolt, vagy fel scannelt noki 2680 hoz használat útmutatót? és hogy milyen tartozék van hozzá ha boltban veszed?

Volna e valakinek textima altin 8332-es ipari varrógéphez használati útmutatója? Linket tudna e valaki küldeni? Vagy mailben scannelt változatot küldeni?

Számítástechnika főkategória kérdései »

Számítástechnika - Programok kategória kérdései »

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!