Egyes híroldalak régi tartalmait miért aktuális dátummal tartja nyilván a kereső? Hogy lehet ezt kiszűrni?
Beírtam google-be, hogy "mi várható nyáron", és beállítottam, hogy az elmúlt egy hétből keressen. Erre négy nappal ezelőtti dátummal kidobja a szeretlekmagyarorszag.hu-t Németh Lajos 2019 augusztus végi időjárás-előrejelzésével:
Gyakran belefutok ilyenekbe, és eléggé zavaró. Hogy lehet ezt kiszűrni?
(amúgy nem az időjárás érdekelt, azt amúgy sem lehet megmondani hónapokra előre)
"miért aktuális dátummal tartja nyilván a kereső?"
Feltételezem - nem tudom biztosra, mert a Google kereső forráskódja zárt, így nem láthatok rá - a keresőnél szereplő dátum az indexelés dátumát jelöli, amikor a keresőrobot a keresőoldal adatbázisához adta a kérdéses oldalt, nem a cikk keletkezésének dátumát. És mivel egy dinamikusan változó híroldalról van szó - aminél előfordulhat, hogy gyakran változnak a cikkek - a keresőrobot többször is újraindexeli ugyanazt a cikket (ezek szerint ez 4 napja történt meg).
"Hogy lehet ezt kiszűrni?"
Te ezt végfelhasználóként nem tudod megoldani - a keresőnek kell.
Illetőleg a weboldal tulaja jelezhetné azt - például a "<meta name="revised"..."-kezdetű HTML taggel, vagy a "Last-Modified" HTTP válaszfejléccel - de kérdéses, hogy a keresőrobotok mennyire fogadják el
Egy régi cikk szerint:
esélyes, de erről semmilyen hivatalos megerősítés nincs.
Ott van még erre a célra sitemap.xml:
de egy terjedelmes oldal nem fog ilyet generálni, túl sok erőforrást igényel.
Az az érdekes, hogy a híroldalak többségére nem jellemző (vagy inkább pont ezért bosszantó, tehát sokan mégiscsak meg tudják oldani).
Tehát például itt ez a HVG-írás szintén 2019 augusztusából
(most tekintsünk el a tartalomtól, a lényeg, hogy meglehetősen egyéni címe van)
és beírom a Google-be, hogy "miért ne lehetne Jézus transznemű", és beállítom hozzá, hogy az elmúlt 1 hónapból keressen
akkor annak rendje és módja szerint nem listázza.
#3: Az említett HVG-s cikk esetében:
* az URL-ben ott a dátum
* az elküldött oldal fejlécében ott a közzététel és a módosítás dátuma:
<meta itemprop="datePublished" content="2019-08-26" />
<meta itemprop="dateModified" content="2019-08-27" />
* bár a Facebook használja, de az Opengraph <meta>-tagek is árulkodóak:
<meta property="og:updated_time" content="2019-08-27T09:49:32.0000000+02:00">
<meta property="article:published_time" content="2019-08-26T20:30:00.0000000+02:00" />
<meta property="article:modified_time" content="2019-08-27T09:49:32.0000000+02:00" />
ilyesmik a topiknyitó kérdésben citált oldalon nincsenek, így a keresőrobot nem tudja eldönteni, hogy mikori a cikk.
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!