Robotizáció, mesterséges algoritmusok, big data, de nem nevetséges, hogy nem ismeri fel egy robot a Captcha-kat?
Vagy lehet, hogy közben meg felismerik, csak az oldalak üzemeltetőik ezt nem tudják?
Holdra szállás, szuperszonikus repülőgépek, mágnesvonat, de nem nevetséges, hogy Gizi néni még mindig gyalog megy a boltba?
Nyilván ha van rá pénz, idő, energia, szakértelem, akkor van robotizáció, MI, big data. Viszont… Ha egy cég holnapján van egy regisztrációhoz nem kötött üzenetküldő űrlap, akkor arra viszonylag könnyű írni egy scriptet, ami teleszórja SPAM-mel. Egy captcha ennek elejét veszi. Nem triviális feladat egy captchafelisermő algoritmus, főleg ha az első linkelt képednél egy picivel erősebb captcháról van szó. Lehet persze írni rá egy MI-t, vagy algoritmikusan sem megoldhatatlan feladat ez, de egy potenciális SPAM-elő ennyi időt és energiát nem fog fordítani, csakhogy eljuttassa neked az üzenetet, hogy „bojler eladó”.
Azért van az első képnél nehezebb captcha is, amit még az embernek sem feltétlenül triviális megoldania. Pl.: [link]
De a Google is részben azért hagyott fel a szövegkép torzításon alapuló captchával, mert lassan eljutottunk odáig, hogy egy jól megírt szoftver kb. azonos hatékonysággal kezdte felismerni a szöveget, mint az ember.
A második captcha típus informatikai szemmel nézve sokkal kevésbé triviális feladat. Leginkább csak MI-vel oldható meg, ahhoz meg jó nagy adag képpel kellene betanítani az MI-t. Ez sem lehetetlen, de eléggé macerás feladat.
~ ~ ~
> Az, hogy nem tud bepipálni egy Im not robot feliratú checkboxot.
Ez meg egy érdekes megoldás, mert nem pusztán arról van szó, hogy bepipálsz-e egy checkboxot. Ez egy jóval szofisztikáltabb megoldás. A rendszer figyeli, hogy hány kérés jött, milyen időközönként, mennyi idő telt el az oldal betöltése óta, figyeli az esetleges egérmozgást, görgetést, a javascript eseményeket és hasonlókat. Pl. ha egy perc leforgása alatt már a tizedik checkboxot akarod kipipálni, akkor jön a nehezítés, jön a „válaszd ki a közlekedési lámpákat” jellegű feladat.
Eléggé kidolgozott a módszer ahhoz, hogy az automatizált scripteket nagyon nagy találati aránnyal felismerje, és valódi hús-vér embereket kis hibával találjon gyanúsnak.
Ami a felhasználó nézőpontjából egy faék egyszerűségű checkbox kipipálás, az a SPAM-elő script írója szempontjából egy gatyafelkötős feladat, hogy meggyőzően tudja szimulálni a valódi böngészési eseményeket. És nyilván egyetlen IP-ről limitálttá válnak a lehetőségeid, nem SPAM-elhetsz gyorsan, mert akkor jön a képfelismerő feladat. Így meg nem annyira hatékony SPAM-elni, hogy scriptet írj rá. Nem kifizetődő az erre szánt erőfeszítés.
És ráadásul amit 2*Sü írt, annál még bonyolultabbra van kitalálva. Nagy eséllyel a használt captcha a Google fejlesztése, és amíg nincs megoldva, addig valójában a Google oldalán, internetes területén vagy és nem a céloldalon. :) És a Google összes adatát használják benne, még azt is, hogy az adott IP-ről milyen keresések, weboldal látogatások és oldalon tartózkodások voltak. Ha gépi gyorsaságúnak vagy automatikusnak tűnnek az IP keresései akkor jön az újabb captcha.
Figyeli a háttérben az IP-címet, tartózkodási helyet, képernyő felbontást, a használt böngészőt, böngésző bővítményeit, oldal betöltési időt, kattintásokat, görgetést, és még további nem publikus dolgokat is. A Google a háttérben közben már át is tekinti a böngészési előzményeket, hogy emberinek tűnik-e. Egy feltörésekre használt gépen mások a böngészések és az internethasználat is. A háttérellenőrzések egy része nem is publikus, semmit sem közöltek róla.
Például ha a géped és IP kattintási sebességei és böngészési sebességei eltérnek a kitöltés sebességétől, akkor újabb feladatot ad. Meg az egérhasználat mozgástípusa is jellemző, olyan mint egy íráskép és ezt is ellenőrzi a háttérben. Egy szoftver egyből ráugrik a jelölő négyzetre és ez felismerhető önmagában is. Még a kattintás pontos helyét is nézi a jelölő négyzeten belül. Valójában már az oldal megnyitásakor nagyjából meghatározza, hogy ember van mögötte vagy szoftver. A Google elemzi a viselkedés összetevőit a jelölőnégyzet bejelölése előtt, közben és után is, és megállapítja, hogy embernek tűnsz-e.
Én úgy gondolom, hogy legfejlettebb deep learning megoldások már képesek lennének a captcha-k nagyon nagy részét értelmezni.
Az egy másik dolog, hogy átlag hekkeresdit játszó hülyegyerek nem ért hozzá, illetve a komolyabb cyberbűnszervezeteknek sincs hozzáférése olyan szuperszámítógépekhez, ami kell ahhoz, hogy ilyen neurális hálókat építsenek.
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!