Van egy könyv kód, szeretnék egy olyan programot irni ami bekérné a könyvet (mondjuk pdf-ben) és a kód alapján megkeresi az adott szót majd ezt egy külön fájlban kimenti. Milyen nyelven lenne érdemes megirni? Hogy kezdjek neki?
Aki esetleg nem értené, könyv kód pl 5 14 67 367 na most a számok eggyes szavakat jelölnek
Lefelé hajlott a nap. Búcsúzóul betekintett még az erdőbe, hol hosszúra nyúlt az árnyék.Az 5=Búcsúzóul 14=árnyék és igy tovább.
Annyira primitív feladat, hogy kb bármilyen nyelvben.
A PDF beolvasás lesz a legnehezebb rész belőle.
PHP-ban szerintetek így lehetne?
<?php
$pdf = 'elérés';
readfile($pdf);
?>
@5-ös:
Persze lehet, ha szeretsz bináris fájlokkal dolgozni, és kisujjból megy a PDF formátum specifikációja.
Konkrétan PDF olvasásra kell keresni.
Annyit sikerült C++ ban elérnem hogy a txt kiirja,márcsak azt kéne hogy csak azokat a szavakat irja ki amit én elötte megadok neki,szóval hogy a 15 30 60... adik szavakat irja.Ezt a részét már nemigen értem hogyan kéne megirni.Ami eddig megvan:
#include<iostream>
#include<fstream>
using namespace std;
int main()
{
ifstream stream1("C:\1.txt");
char a[80];
while(!stream1.eof())
{
stream1 >> a;
cout << a << endl;
}
system("PAUSE>>void");
return(0);
}
Most akkor PDF-ből akarod betölteni, vagy txtből? Nagyon nem mindegy. PDF betöltése nem triviális, már csak a nyers formázatlan szöveg beolvasása is több napos feladat egy profi programozó számára. (És nem úgy vettem ki a kérdésedből, hogy te az lennél) Ha PDFből akarsz szöveget betölteni, akkor valamilyen külső komponenst célszerű használnod, de ingyen valószínűleg csak olyat találsz, ami csak bizonyos PDF-eket fog tudni beolvasni. Ha képként tárolja a szöveget (vagy olyat is láttam már, hogy az ékezetes betűkön az ékezet "rajzolva" volt) a PDF, akkor ORC-ezni kell, amire vannak egész jó megoldások, de az nem lesz olcsó. Pl FineReadernek van API-ja, régebben próbáltam, teljesen jól működött, de ez fizetős. Tényleges szöveget tartalmazó PDF beolvasáshoz pl használhatsz PDFBox-ot, ez free. Munkahelyemen foglalkoztunk ilyenekkel, viszonlyag jól működik megfelelő PDF-ekkel.
A fentiek alapján én azt javaslom, hogy ha kezdő vagy, és nem ragaszkodsz a PDF-hez, akkor inkább szöveges fájlt használj. Gyakorlatilag bármilyen nyelven meg lehet írni. Ha szivatni akarod magad, akkor maradhatsz a C++-nál.
Ha egyszerűen akarod, akkor pl írhatod C#-ban vagy pythonban. (Utóbbihoz nem értek, és nem is szeretem, személyszerint egy gány nyelvnek tartom, de sokan favorizálják itt a gyk-n, valaki biztos segít benne)
C#-ba valami hasonló:
string fileName = "konyv.txt";
int[] codes = {1, 4};
string[] words = File.ReadAllText(fileName).Split("\r\n,.:;\"' ".ToCharArray(), StringSplitOptions.RemoveEmptyEntries);
string s = codes.Aggregate(new StringBuilder(), (sb, code) => sb.Append(words[code - 1] + " ")).ToString();
Gyakorlatilag 2 sor kód. Nem mondom, hogy hatékony, és hogy tökéletesen működik, de egy kezdő gyorsan meg tudja írni.
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!