Linux alatt hogyan lehetne olyan scriptet írni, ami egy stringhez megmondja, hogy hány google találat tartozik hozzá? Gondolom wgettel egyszerűen megoldható.
Egy lehetséges megközelítés:
Én inkább valami szkripttel kezdenék - UTF-8 HTML DOM-szerkezetből kellene kiszedni a tartalmat reguláris kifejezéssel.
Gyorsan össze is raktam egyet Pythonban:
node.js programmal:
// használat: node google.js "kifejezés"
var http = require('http');
var param = process.argv.slice(2)[0];
var options = {
host: 'www.google.hu',
path: '/search?hl=en&q=' + param.replace(/"/g,'').replace(/ /g,'+')
};
callback = function(response) {
var str = '';
response.on('data', function (chunk) {
str += chunk;
});
response.on('end', function () {
var bodyRegex = new RegExp(/\"resultStats\"\D*([\d,]+)/);
var arrMatches = str.match(bodyRegex);
console.log(param + ': ' + arrMatches[1].replace(/,/g,''));
});
}
http.request(options, callback).end();
Kicsit módosítani kell a szkriptet:
a parancssori paraméterben ki kell cserélni a szóközt +-ra, és így átadni az URL-nek.
Az egész keresőkifejezést így kell megadni - példa:
python google_results_num.py '"alma pálinka" -ár sites:.hu'
hálásan köszönöm, viszont a Google kersővel való játszadozás közben észrevettem két dolgot:
Az alábbi két keresés eredménye egy picikét más, nem tök azonos:
alma+korte
alam korte
ezek pedig nagyon különböznek:
alma+korte+site:.hu (331000 találat)
alma korte+site:.hu (2 találat)
"ezek pedig nagyon különböznek:
alma+korte+site:.hu (331000 találat)
alma korte+site:.hu (2 találat)"
Vigyázz, a keresőkifejezésben ha + szerepel, akkor az a Google URL-jében átalakul - éppen ezért finomítottam még a szkripten:
Egyébként két ugyanolyan keresés között lehetnek eltérések a böngészőn belül is.
a te scriptedbe a + jel átalakul ha jól értem, de akkor + jelet hogyan tudnék beírni, mint operátor
Egyébként nem az lenne a legegyszerűbb a scriptnél, ha minden további argumentum megengedett volna és a szóköz szóköz is maradna?
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!