Web bot pythonban?
Egy botot szeretnék készíteni ami meg nyit egy weboldalt és kimásol egy szöveget onnan.
Keresgéltem az interneten de nem találtam semmi olyan parancsot amivel másolni lehetne.
Van ilyen parancs?
Ha nincs akkor mégis, hogy lehetne ezt megcsinálni?
1. Az adott URL-en levő erőforrást be kell olvasni egy változóba.
Err való az urllib ( [link] illetve [link] ) és a PycURL ( [link] ).
2. A változó tartalmát meg fel kell dolgozni.
Ehhez használhatsz reguláris kifejezéseket ( [link] illetve [link] ), vagy kifejezetten HTML feldolgozására használatos parsereket, mint például a Beautiful Soup ( [link] ), az lxml ( [link] ), stb...
Hát eléggé meredeken akarod kezdeni, de először azt kéne tisztázni, hogy kettes vagy hármas verziót használsz, mert pont ez a rész különbözik bennük.
Azért ez még nem webbot, ez csak egy letöltő. :-)
Ha kezdo vagy, akkor az xml parsereket szerintem hanyagold.
"Azért ez még nem webbot, ez csak egy letöltő. :-)"
A hatar elegge bizonytalan... szerintem egy script, ha bejar egy weblapot, linkeket kovet, akkor az mar bot-nak minosul. Persze nem ad kuld semmit se post/get-tel az weboldalnak. Majd este megoszok egy-ket ilyen crawlert (egy biztosan van, de, amit ncore-ra irtam, az lehet, hogy perl).
Kapcsolódó kérdések:
Minden jog fenntartva © 2025, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!