Kezdőoldal » Számítástechnika » Weblapkészítés » A Gyakorikérdéseknek akkor...

A Gyakorikérdéseknek akkor több mint 10 millió html fájlja van?

Figyelt kérdés

Azt írják, hogy több mint 10 millió kérdés van, tehát feltételezem 10 millió html fájl?

2021. júl. 23. 23:57

❮ 1 2

11/14 A kérdező kommentje:

Nekem elég gyorsan betölt.

És akkor a Google hogyan tudja indexelni a kérdéseket?

2021. júl. 24. 14:14

12/14 anonim

válasza:

#11 GYK és Google szerverpark mérete esélyel nem ugyanaz :)

2021. júl. 24. 15:20

Hasznos számodra ez a válasz?

13/14 anonim

válasza:

#7, #8, #9, #10

Nem tudom használtatok-e cache-t (mármint fejlesztőként) vagy csak hallottatok róla, hogy "van ilyen".

Most csak a szerveroldali cache-re gondolok nyilván, a böngésző gyorsítótárazását ne keverjük bele.

Tehát: hogy mit és hogyan cache-elünk az nagyban függ attól, milyen technológiákat használunk. Pl a példánál maradva, vegyük a php-t mint backend szkriptnyelv.

Az összetett php kódot is lehet cache-elni ( [link] így futáskor nem kell minden esetben a szkriptet teljes egészében újra értelmeznie az interpreternek. Ugyanez az elv akkor is, mikor template engine-t használsz: a template-t az első megnyitáskor "lefordítja" és a következő meghívásnál már ezt a generált view-t használja. Így működik pl a blade is. Ez is egyfajta "cache".

A tárolás módja megint más kérdés: lehet file szintű, vagy memcached vagy ami hatékonyabb (csak sajnos a tárhelyszolgáltatók nem szokták támogatni) redis. Ezek is adatbázisokként működnek csak nem relációs adatbázisok. (NoSQL-re keress rá ha részletesebben érdekel, ezen belül pedig a "key–value database" kifejezés alatt fogsz sok hasznos infót találni a témában.)

Visszatérve a felvetésre: az adatbázis is lehet rendkívül gyors, csak megfelelően kell optimalizálni. Sok millió rekord sem fog kifogni rajta, ha jól van megtervezve. Ez megint egy külön szakma amúgy, nem is mennék bele annyira mélyen (én is csak a felszínét kapargatom azon a szinten amennyire szükségem van rá), de a táblák partícionálása, megfelelő indexelése vagy adott esetben temp táblák alkalmazása sokat tud dobni a teljesítményen. (Szintén érdekesség: "Materialized view" működésének nézz utána.) Tehát előfordulhat, hogy vannak adatok amik nem azonnal frissülnek, mivel valós időben túl sok időt venne igénybe és nincs is értelme. Ilyen lehet egy statisztika is.

Feltételezésem szerint biztosan használnak cache-t, de az nem az rdbs helyettesítésére van, hanem kiegészítésére: pl a belépési session-öket lehet ott tárolni. (csak példa.)

Jogos kérdés lehet, hogy sok látogató esetén azért ígyis érezni kéne a lassulást: igen, bár nyilván nem egy mezei gép van mögötte, hanem szerverek vannak clusterben és a terhelés elosztásnak köszönhetően megbírkózik a magas látogatottsággal is.

A kérdésre visszatérve:

(feltételezem) egy template engine van mögötte (smarty/twig/blade/akármi) ami nem egy-egy oldalt, hanem az oldalak egy-egy részét tárolja 1-1 fájlban. Ezt lehetetlen megbecsülni, mert a fejlesztőtől függ, mennyire "darabolja" fel, szóval lehet 10-15, de az is lehet, hogy 200-300 ilyen sablonból épül fel az oldal. (nem egy... az egész.)

"Google hogyan tudja indexelni a kérdéseket?"

Na ez az előzőnél és bonyolultabb és hosszabb választ igényelne. :) Röviden (és pontatlanul): sűrűn meglátogatja az oldalt és a linkeket követve végighalad a weboldalon, majd a tartalmát kiszűri és úgy tárolja le, hogy hatékonyan lehessen keresni hosszú szövegekben is. Sőt, nem ezaz egyetlen módja a feltérképezésnek ( [link] de mint mondtam, ez annyira összetett, hogy megérné inkább külön kérdésbe rakni.

2021. júl. 31. 16:15

Hasznos számodra ez a válasz?

14/14 anonim

válasza:

Sorry: a linkek végére odakerült a zárójel, így hibásnak tűnhet mindkét hivatkozás. Itt vannak önállóan:

[link]

(Utolsó voltam. :))

2021. júl. 31. 16:21

Hasznos számodra ez a válasz?

❮ 1 2

További kérdések:

Nethelyen az igyenes webtárhelyhez lehet csatolni meglévő domaint? Én arra nem látok opciót, csak arra, hogy vegyek egyet a nethelytől.

Az atw.hu ingyenes webtárhelye esetén van SMTP?

Saját gépen futó webszerverrel kipróbálható Github projektek? (bővebben lent)

Mit jelent a Google Analytics-ben ez a 3 oszlop pontosan?

Hol találhatom meg a tárhelyszolgáltatóm adatait? (Webnode)

Miért nem működik a webáruházamban az üzenetküldés?

Számítástechnika főkategória kérdései »

Számítástechnika - Weblapkészítés kategória kérdései »

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!