Miért ilyen gagyi a Gyakorikérdések keresője?
A legtöbb adatbáziskereső igen egyszerű feltételekkel tud szűrni az adatokban. Kvázi azt tudja szűrni, hogy az adott karaktersorozat szerepel-e mondjuk a kérdés címében, szövegében. Több keresőszó esetén általában külön-külön szokták szűrni az adatokat, a sorrendben azt teszik előre, amiben több szó is megtalálható a keresőszavak között. Esetleg lehet súlyozni azzal, hogy a címben szereplő találat nagyobb súllyal esik latba, mint a kérdés kifejtésében szereplő találat. A másik lehetőség, hogy csak olyan találatokat ad, amiben minden szó szerepel.
A magyar nyelv sem kedvez a keresőknek. Egy-egy szó lehet összetett szóban is, illetve ragozott alakban is. a „piros” kifejezése valahogy meg kellene találni a „legpirosabb” szót is. Így hát a keresőszavaknak a részleges egyezését is bele kell venni a találati listába.
Azt – mint programozó mondom – már igencsak komplikált megvalósítani, hogy egy öt szóból álló keresőkifejezésnél előbbre rangsorolja azt, amiben az öt szó közvetlen egymás után szerepel, aztán az következzen, amiben kettő, és három szó van ugyanígy egymás után, de akár ragozott alakban is.
A helyesírási hibákat – különírás, egybeírás, kötőjel, betűtévesztés – még nehezebb kiszűrni. Illetve a magyar ragozás itt sem kedvez, mert a „víz” szóban az í hosszú, de a „vizes” szóban rövid. Ha meg nem veszed figyelembe az ékezeteket, akkor a „tévé” keresőkifejezésre a „teve” is meg fog jelenni. Illetve vannak szavak, amiknek teljesen megváltozik az alakjuk „tó” vs. „tavak”. Itt megint nem lehet pusztán karaktersor azonosságot figyelembe venni.
Anno egy webshop keresőjén dolgozva jelentett komoly kihívást a keresés. Mondjuk adott egy Cipő nevű cég, ami szereti a termékei elé odabiggyeszten a C kezdőbetűt. Ez gyárt gumicsizmát, abban is többféle modellt. Különböző színben és méretben is gyártja ezeket. Oké, lesz valami olyan termékrövidítés, hogy GCS3-P42, ahol a GCS a gumicsizmát, a 3-as a harmadik szériás modellt, a P a piros színt, a 42 meg a lábméretet jelenti. Lehet, hogy a saját oldalukon úgy fog szerepelni, hogy Cipő GCS3-P–42. De lehet, hogy egy adott webshop esetén ez CGCS3P42 néven fog futni. Hogy találod meg szövegrésztartalmak elemzésével a „CGCS3P42” keresésre a „Cipő GCS3-P–42”-t? Ilyenkor gyakori megoldás, hogy a terméknél egy nem látható kulcsszólistában felsorolják a termék gyakori alternatív elnevezéseit. De a GYK-n te a kérdésben felsoroltad valahol is azt, hogy „Emmi-dent”, „emmident”, „emmi dent” stb…? Nem. Akkor hogy lehet erre cizelláltabb keresőt írni?
~ ~ ~
A Google keresője mögött egy igen komplex algoritmus és igen komplext indexelési módszer áll, a mesterséges intelligenciát is bevetve. Volt idejük, tőkéjük tökéletesíteni, és mivel ez a fő funkciója érdemes is volt. A GYK-n a keresőt lehetne csiszolgatni hidd el akár évekig is. De minek? A kérdésekre, válaszokra nagyon ritkán kereséssel jutnak el a felhasználók, inkább direkt módon. Vagy a Google keresőjén keresztül. De magának a GYK keresőjének a segítségével ritkán.
~ ~ ~
Viszont jó hír az, hogy az oldal tartalma publikus, regisztráció nélkül is láthatóak a kérdések és válaszok, így a Google be is tudja ezeket indexelni. A Google tud pl. egy adott oldalon belül is keresni. Lásd:
Ennek tudatában aztán még kevésbé van indíttatás arra a GYK fejlesztőinek, hogy pont a kereső finomítgatásával töltsenek el hónapokat.
~ ~ ~
De kicsit olyan a kérdés, hogy ha a Tesla tud önvezető autót építeni, akkor Pista bácsi miért volt lusta önvezetőre építeni a házi barkács talicskáját… Hát talán azért, mert nem egy súlycsoport Pista bácsi sufnija meg a Tesla fejlesztőrészlege… De ez azért némi józan paraszti ésszel magától értődik.
Lehetne okosítani úgy, hogy nem maga próbálna keresni, hanem beírod amit keresel és a google-lel keresteti meg. Mondjuk legyen keresésbe beírjuk ezt: "Miért ilyen gagyi a Gyakorikérdések keresője?" és ez ide irányítana:
Találatok mind a gyakorira mutatna. Ezt te is megtudod a google-ban csinálni, hogy csak ott keresel, de ezt kényelmesebbé lehetne tenni ezzel, hogy csak fentre beírod és kész (másik, hogy sokan nem is tudják, hogy így is lehet a google-ben keresni)
2 legyet ütünk egy csapásra:
- Felokosítjuk a keresőt.
- Költséghatékonyan valósítjuk meg, mivel csak minimálisat kell programozni, mivel a keresés logikáját nem kellene a gyk-nak lefejlesztenie, hanem igénybe venni egy már lefejlesztett hatékonyabb keresőt.
Én 10 perc alatt megtudnám csinálni, ha megkapnám a forráskódot :)
> Lehetne okosítani úgy, hogy nem maga próbálna keresni, hanem beírod amit keresel és a google-lel keresteti meg.
Lehetne. Sőt a Google nyújt kifejezetten ilyen szolgáltatást. Lásd: [link]
Most hirtelen csak úgy találomra egy oldal, ami ezt használja:
Ezzel alapvetően három probléma van:
1. Amióta a Google fizetett hirdetéseket helyez el a találatok listáján, azóta nem annyira tetszetős eszköz. Egy oldalnak az az érdeke, hogy a felhasználó az oldalon maradjon. Oké, a reklám kivezet onnan, de cserébe pénzt hoz. A Google hirdetéses találatai viszont úgy vezetik ki a felhasználót az oldalról, hogy még csak nem is hoz pénzt. A találati lista sem túl testreszabható.
2. A kereső nem csak a kérdésben szereplő szavakkal, hanem a válaszokban szereplő szavakkal, és az oldal navigációjához tartozó szavak alapján is beindexeli az oldalakat. Tehát ha valaki éppen pont az „adatvédelem” szóra keres rá, akkor a Google kvázi az összes GYK-s oldalt kiadja, hiszen mindegyiknek a láblécében szerepel az adatvédelem szó.Oké, igyekszik azért az olyan oldalakat előbbre hozni, amiben többször is szerepel ez a szó, így mégis releváns találatokat hoz jórészt. Illetve itt az is gond, hogy a Google keresőjével azok az oldalak is előjönnek találatként, amik nem kérdések, hanem a GYK saját aloldalai. (Pl.: https://www.gyakorikerdesek.hu/adatvedelmi_szabalyok )
3. Ami viszont már komolyabb gond, hogy a Google időről-időre indexeli újra az oldalakat. A keresés eredményeiben nem lesznek ott a frissen feltett kérdések, viszont ott lesznek olyan kérdések, amiket időközben töröltek.
Illetve jó kérdés, hogy melyik jobb? Egy nem túl okos, de legalább saját készítésű kereső? Vagy egy hiper-szuper kereső, ami viszont ránézésre külső, „konzerv” megoldás. Melyik nyújtja a felhasználónak a „gagyibb” élményfaktort? Mert szerintem akármilyen buta egy saját kereső, érzetre az átlag felhasználónak mégis profibb megoldás, mint betenni egy olyan keresőt amit jellemzően inkább tizenéves Mórickák szoktak betenni a G-Portálos és hasonló tákolmányaikra.
> Költséghatékonyan valósítjuk meg…
Attól, hogy jobb a keresője az oldalnak, attól több kérdést fognak itt feltenni? Nem valószínű. Több választ fognak írni? Az sem valószínű. Költségvetési oldalról a látogatók, illetve az oldalletöltések száma az, ami lényeges, lévén az oldalon található reklámokból van bevétele az oldalnak. Ha a kereső feltuningolására csak 1 órát is szán az üzemeltető, az kidobott pénz. Hiszen az néhány ezer forint óradíjat jelent, és az oldalnak ezzel szemben 0 Ft-tal nő a bevétele.
Az oldal a kritikus tömeg miatt piacvezető. Számtalan konkurens oldal tűnt fel az évek során, majd tűnt el a feledés homályába, mert hiába akármilyen jó egy oldal, ha kevés a kérdező, akkor kevés válaszoló fog rendszeresen visszatérni, ha meg kevés a válaszoló, akkor a kérdésekre nem érkeznek releváns, használható válaszok, így a kérdezők is inkább kérdeznek itt, mint a konkurenciánál. Ezt az ördögi kört maximum nagyon-nagyon erős marketinggel lehetne megtörni, ami óriási tőkebefektetést jelent, ami nagyon kérdéses, hogy miből fog megtérülni.
Az oldal kőkorszaki technológiát és dizájnt mutat. Ezernyi dolog van, amihez én személy szerint előbb nyúlnék hozzá, mint a keresőhöz. Az kevesen használják, még kevesebb embernek van vele problémája. Az már sokkal hasznosabb fejlesztés lenne, ha push üzenettel – akár asztali környezetben, akár mobilon – akkor is érkezne értesítés, hogy válasz érkezett a kérdésemre, vagy új privát üzenetet kaptam, ha éppen nincs nyitva az oldal (mint a Facebook, Messenger esetén). De minek megvalósítani egy ilyet az üzemeltető szempontjából? Nem fogja növelni a bevételét egy fillérrel sem, viszont 0 Ft-nál többe kerül egy ilyen fejlesztés. Az üzemeltető azt a minimális fejlesztést végzi csak el, ami olyan probléma, ami az oldal használhatatlanságát, vagy igen komoly presztízsveszteségét akadályozza meg. Pénzügyileg ez így oké is. A lelkesedés szerintem a fejlesztésre – ha volt valaha is – már rég elfogyott, senki nem akarja jobbá, szebbé tenni ezt az oldalt.
Kérdező, te ezt nagyon elnézted. A GYK keresője jól működik. Az EMMI DENT beírásra ezt adja: [link]
Az első – külön bekeretezett – rész címe: „T̲a̲l̲á̲l̲a̲t̲ ̲a̲ ̲k̲a̲t̲e̲g̲ó̲r̲i̲a̲ ̲c̲í̲m̲e̲k̲b̲e̲n̲ ̲/̲ ̲k̲u̲l̲c̲s̲s̲z̲a̲v̲a̲k̲b̲a̲n̲”. Ezek tehát nem talált kérdések, hanem olyan meglévő (ez esetben csak) kulcsszavak, amelyek legalább részben tartalmazzák a keresett szavakat, és a cím alá írt szövegből kiderül, hogy ha van releváns köztük, akkor bejelölheted későbbi keresésekhez. Nem alkalmasak – még azok sem, amelyek a „További kapcsolódó kulcsszavak”-ra kattintás után jelennek meg -; ennyi, lehet továbblépni; de te v̲a̲l̲a̲m̲i̲é̲r̲t̲ ̲i̲t̲t̲ ̲e̲l̲a̲k̲a̲d̲t̲á̲l̲.
A következő rész címe: „K̲u̲l̲c̲s̲s̲z̲a̲v̲a̲k̲ ̲é̲s̲ ̲a̲ ̲k̲é̲r̲d̲é̲s̲ ̲s̲z̲ö̲v̲e̲g̲e̲ ̲a̲l̲a̲p̲j̲á̲n̲”. E̲z̲ ̲a̲ ̲j̲ó̲ ̲t̲a̲l̲á̲l̲a̲t̲i̲ ̲l̲i̲s̲t̲a̲.
Ennek a kérdésnek a kiírása előtt 3 kérdést láthattál itt; mind olyan, amilyet kerestél. Mint látszik, mindnek szerepel a címében a két keresett szó. Mostani kereséskor, negyedikként, már a te kérdésed is látszik; kulcsszavak alapján.
A következő rész címe: „R̲é̲s̲z̲l̲e̲g̲e̲s̲ ̲t̲a̲l̲á̲l̲a̲t̲o̲k̲ ̲(̲a̲m̲e̲l̲y̲e̲k̲b̲e̲n̲ ̲c̲s̲u̲p̲á̲n̲ ̲a̲ ̲k̲e̲r̲e̲s̲e̲t̲t̲ ̲s̲z̲a̲v̲a̲k̲ ̲t̲ö̲r̲e̲d̲é̲k̲e̲ ̲s̲z̲e̲r̲e̲p̲e̲l̲)̲”.
Itt sok oktatási témakörű kérdés van, ugyanis az Emberi Erőforrások Minisztériuma névrövidítése – jogszabályokban is így használják – EMMI; hozzájuk tartozik az oktatás is. És vannak fogászatokról szóló kérdések, amelyek nevében szerepel a „dent” szó, szórészlet. (A címekben nem mindig látszódnak a keresett szavak, lehet, hogy csak a kérdéshez megadott kulcsszavak alapján listázódnak.)
Úgyhogy, minden rendben van. És teljes körűen eleget tesz annak, ami a Használati Útmutató kereséssel kapcsolatos ismertetőjében olvasható:
„Hogyan működik a keresés?
A keresés a megadott kulcsszavak és a kérdés szövege alapján listázza a találatokat.
A kereső elsősorban a 4 vagy több betűből álló szavakra keres, ennél rövidebb szavaknál csak kulcsszóegyezést vizsgál. Ha háromnál több szót írsz be, a keresés csak az első három szóra történik meg.
Amennyiben több szóra keresel, előre kerülnek azok a találatok, amelyekben több is szerepel a keresett szavakból. Ilyenkor pontos egyezést vizsgál a kereső programja.
Amennyiben csak egy szóra keresel, szó eleji egyezést figyel a kereső programja, azaz az összes olyan találat megjelenik, amely az általad beírt szóval kezdődő szavakat tartalmaz.”
↑
Nagyon köszönöm az igen gazdag és sokoldalú válaszokat! Időzavar miatt máskor visszatérnék és részletesen is reflektálnék. Sok érdekes gondolatot találtam a válaszokban.
Röviden abban látom a hiányát a keresőnek, hogy a háttértudása messze áll az emberétől és emiatt csak szintaktikai szinten, betűsorozatokra keres. Nem hallott a szemantikai ( jelentesalapú), a pragmatikus ( szituációfüggő jelentésre alapozó) és az intencionális (mögöttes, rejtett mondanivaló) alapú keresésről. Vagy csak akár az adatbányászat eredményeiről, módszereiről.
Egyébként a Google-linkes keresés talalatai között volt egy, amelyben másvalaki is gyengének ítélte a keresőt.
Mégegyszer köszönöm, még jövök.
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!