Mennyire lenne nehéz leprogramozni egy ilyet kezdőként?
Egy olyan programot szeretnék csinálni, ami valamilyen fabejárós algoritmus alapján végigmenne a gyakorikérdések kategóriáin, majd a kategórián belül a kérdéseken, majd a kérdéseken belül a válaszokon, és ebből egy lokális adatbázist építene a kérdésekből illetve a válaszokból.
Aztán ebben én tudnék SQL lekérdezéseket futtatni, például adott felhasználó (ha kint van a neve) összes válaszát összegyűjteni, milyen kategóriákban szokott kérdezni/válaszolni, jellemzően milyen napszakban stb.
Aztán ha ez már menne rendesen, akkor utána a nem nevesített felhasználóknál (ahol csak a százalék látszik) összegyűjteni az egyforma százalákú válaszokat, majd azokban valamiféle mintát keresni (szavak, kategóriák, időpontok, értékelések stb.) alapján, valamiféle nagyon alapszintű machine learning-gel, abból pedig megtalálni az ugyanazon a felhasználóhoz tartozó válaszokat.
Mennyire lenne ez nehéz egy kezdőnek, és mennyire lenne felhasználóható ez a későbbiekben mint hobbiprojekt?
Kísérletezz. A programozást másképp nem lehet megtanulni. Ha elsőre nem is lesz tökéletes folyamatosan finomíthatod a programot. Olvass utána a témának a neten és próbáld ki az ott tanultakat is. Erről szól az önképzés.
Sokkal jobb egy olyan problémán dolgozva tanulni ami érdekel, mint sok programozó iskolában megírni a százezer-egyedik könyvtári nyilvántartó programot.
Melyik része esélytelen?
Bejárni az oldalt kategóriánként, kérdésenként és válaszonként, és ebből objektumokat kreálni?
Létrehozni belőle egy adatbázissémát és egy lokális adatbázist?
A mintafelismerő, mélytanuló, ML algoritmus?
a % az változik, volt hogy visszanéztem olyan kérdésre amire válaszoltam pár nappal azelőtt és ott még más % szerepelt mert közben le vagy felment és (még) nem írta át, ez lehet zavaró tényező, meg a hasonló patternek / szavak keresése se kis móka, szerintem nem kivitelezhetetlen a kérdés: mennyire lesz pontos és egyáltalán hasznos :D
nem beszélve arról hogy eléggé terjedelmes az adatbázis amit így leszednél, ha egyáltalán ki nem tiltanák az IP-det ha túl sok lekérés jönne róla
Egy crawler.
Egy öntanuló szemantikai analizátor.
Sok-sok tárhely és tengernyi türelem.
A többi csak eltökéltség, kitartás kérdése.
A machine learning csak egy távlati cél.
Elsőre annyi is elég lenne, hogy adott nevű felhasználó összes kérdését/válaszát hozza vissza, ott akkor még a százalékok váltakozása sem lesz probléma.
Egyelőre ez az első nagy cél, idáig mindenképp szeretnék eljutni.
A túl sok kérés probléma lehet, nyilván kellenek közte szünetek, és nem túl sok napra visszamenőlegesen kellene keresni.
Kapcsolódó kérdések:
Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!