Kezdőoldal » Számítástechnika » Programok » Programozás házi feladathoz...

Programozás házi feladathoz kérek segítséget?

Figyelt kérdés

Egy weboldalból ki kell gyűjteni a linkeket.

Bemeneti adat pl: www.pelda.hu

Kimenet: A talált linkek:

valami.hu

akarmi.hu


A használható eszközök: linux shell script.

Milyen eszközökkel, hogyan érdemes nekiállni?

Lynx? wget? + sed?



2015. febr. 20. 15:56
 1/6 anonim ***** válasza:
32%

Nem vagyok gépközelébe úgyhogy nem tudom kipróbálni. NEkem ez jutott eszembe.

wget CÍM.hu

CíM.html | grep www > linkek.txt

2015. febr. 20. 16:27
Hasznos számodra ez a válasz?
 2/6 anonim ***** válasza:
32%
Regexp-el megadni valami olyasmit hogy *.hu és azt lementeni egy fájlba.
2015. febr. 20. 16:27
Hasznos számodra ez a válasz?
 3/6 anonim ***** válasza:
32%

Kimaradt

cat CíM.html | grep www > linkek.txt

2015. febr. 20. 16:28
Hasznos számodra ez a válasz?
 4/6 anonim ***** válasza:

Én sem tudom kipróbálni, szóval nem esküszöm, de a grep-pel az a gond, hogy sorokat kezel. Ha a html oldal egyetlen sorból áll (nincsenek benne sortörések, vagy nem ott, ahol illene), akkor elég zanza eredményt ad.


Én a "href=" szöveg alapján valamilyen regex kereséssel próbálnám kiszedni a linkeket. "Awk", vagy talán "sed" is működhet. A regex-be bele lehet szőni a kacsacsőr keret is, szóval tetszőleges pontosan meg lehet adni magát a linket.

2015. febr. 21. 07:37
Hasznos számodra ez a válasz?
 5/6 anonim ***** válasza:
46%
Persze gond lehet, ha mondjuk a pelda.hu pl. "default.html"-je más fájlokra is hivatkozik. Azokból már macerásabb kimazsolázni a linkeket. Legalábbis tiszán shell scripttel. :)
2015. febr. 21. 07:39
Hasznos számodra ez a válasz?
 6/6 A kérdező kommentje:

A megoldás "elfogadott" verziója shell script és egy kis Pascal program, ami a "href=" és az első szóköz közötti részt vadássza ki.


Meg van a "megfelelt" köszönöm

2015. febr. 24. 15:28

Kapcsolódó kérdések:




Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!