A Gyakorikérdéseknek akkor több mint 10 millió html fájlja van?
Nekem elég gyorsan betölt.
És akkor a Google hogyan tudja indexelni a kérdéseket?
#7, #8, #9, #10
Nem tudom használtatok-e cache-t (mármint fejlesztőként) vagy csak hallottatok róla, hogy "van ilyen".
Most csak a szerveroldali cache-re gondolok nyilván, a böngésző gyorsítótárazását ne keverjük bele.
Tehát: hogy mit és hogyan cache-elünk az nagyban függ attól, milyen technológiákat használunk. Pl a példánál maradva, vegyük a php-t mint backend szkriptnyelv.
Az összetett php kódot is lehet cache-elni ( [link] így futáskor nem kell minden esetben a szkriptet teljes egészében újra értelmeznie az interpreternek. Ugyanez az elv akkor is, mikor template engine-t használsz: a template-t az első megnyitáskor "lefordítja" és a következő meghívásnál már ezt a generált view-t használja. Így működik pl a blade is. Ez is egyfajta "cache".
A tárolás módja megint más kérdés: lehet file szintű, vagy memcached vagy ami hatékonyabb (csak sajnos a tárhelyszolgáltatók nem szokták támogatni) redis. Ezek is adatbázisokként működnek csak nem relációs adatbázisok. (NoSQL-re keress rá ha részletesebben érdekel, ezen belül pedig a "key–value database" kifejezés alatt fogsz sok hasznos infót találni a témában.)
Visszatérve a felvetésre: az adatbázis is lehet rendkívül gyors, csak megfelelően kell optimalizálni. Sok millió rekord sem fog kifogni rajta, ha jól van megtervezve. Ez megint egy külön szakma amúgy, nem is mennék bele annyira mélyen (én is csak a felszínét kapargatom azon a szinten amennyire szükségem van rá), de a táblák partícionálása, megfelelő indexelése vagy adott esetben temp táblák alkalmazása sokat tud dobni a teljesítményen. (Szintén érdekesség: "Materialized view" működésének nézz utána.) Tehát előfordulhat, hogy vannak adatok amik nem azonnal frissülnek, mivel valós időben túl sok időt venne igénybe és nincs is értelme. Ilyen lehet egy statisztika is.
Feltételezésem szerint biztosan használnak cache-t, de az nem az rdbs helyettesítésére van, hanem kiegészítésére: pl a belépési session-öket lehet ott tárolni. (csak példa.)
Jogos kérdés lehet, hogy sok látogató esetén azért ígyis érezni kéne a lassulást: igen, bár nyilván nem egy mezei gép van mögötte, hanem szerverek vannak clusterben és a terhelés elosztásnak köszönhetően megbírkózik a magas látogatottsággal is.
A kérdésre visszatérve:
(feltételezem) egy template engine van mögötte (smarty/twig/blade/akármi) ami nem egy-egy oldalt, hanem az oldalak egy-egy részét tárolja 1-1 fájlban. Ezt lehetetlen megbecsülni, mert a fejlesztőtől függ, mennyire "darabolja" fel, szóval lehet 10-15, de az is lehet, hogy 200-300 ilyen sablonból épül fel az oldal. (nem egy... az egész.)
"Google hogyan tudja indexelni a kérdéseket?"
Na ez az előzőnél és bonyolultabb és hosszabb választ igényelne. :) Röviden (és pontatlanul): sűrűn meglátogatja az oldalt és a linkeket követve végighalad a weboldalon, majd a tartalmát kiszűri és úgy tárolja le, hogy hatékonyan lehessen keresni hosszú szövegekben is. Sőt, nem ezaz egyetlen módja a feltérképezésnek ( [link] de mint mondtam, ez annyira összetett, hogy megérné inkább külön kérdésbe rakni.
További kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!