Data Analytics specializációhoz Python vagy R nyelvet ajánlanátok?
Mindenhonnan az önlik hogy a Data science/big data analytics/ data mining stb témáknak óriási jövője van.
Általában python vagy R nyelvet szoktak ajánlani hozzá.
Ebben a témában kezdőként melyikkel lenne érdemes nekiállni?
" Ami igazan sokat szamit az a kutatoi szemlelet es az eros statisztikai hatter. Ezeket tenyleg tobb ev elsajatitani."
Én is így látom, hogy erről van itt szó. A python, az R, az SQL nem oylan nehéz programnyelvek, bár tény én csak Matlabban ügyködtem valamennyit régebben így egyikhez sem értek, de néhány dolog miatt én is azt lárom, hogy itt nem a kódolás a leghangsúlyosabb:
Berlin tele van 3 hónapos Data Science Bootcamp-ekkel, amelyeknek az elvégzése után sokszor tényleg elhelyezkednek az emberek adatelemzőként, mert akkora rájuk a kereslet. DEEE:
Ezeket általában PHD-t végzett embereknek ajánlják, és olykor feltétel is PhD oklevél a jelentkezéshez.
Pontosan a kutatói/elemző szemléletmód és tapasztalat miatt.
Szóval miután lehúz valaki 5-8 évet egy Max Planck vagy Helmholtz intézetben és utána elmegy egy ilyen képzésre, az azért nem olyan mintha Pistike vagy Balázska iratkozna be aki otthon mar kodolt egy tankos játékot...
Még ha ezek a kutató illetők nem is kódoltak akkor sem.
És akkor ilyet, hogy után a munkakereséshez beszélni kell németül minimum egy erős tényleges középfokon (vagy legalábbis igencsak ajánlott...) még meg se említettem...
Illetve annyiból a német miatt talán még könnyebb is a helyzet - annak aki beszél németül... - hogy németül beszélő munkanélküli bármiylen adatelemző biztos avgyok benne, hogy egyszerűen nem létezik...
Illetve ha a cég ragaszkodik a német munkanyelvhez, akkor még külföldről se nagyon tudják feltölteni ezeket az állásokat, mert aki programozó beesik ide külföldről az általában nem beszél németül...
Tehát igazából emiatt is tűnik reálisnak a történek.
Vagy rövedin megfogalmazva: aki akademiai szektorból jön PhD végzettséggel az már képes önálló kutatásra és könnyebb egy iylen embert megtanítani kódolni (ez meglehet pár hónap alatt), mint egy gyakorlottabb kódolónál elérni , hogy önálló kutató legyen belőle (ez évekig is eltart...).
Mi a véleményetek?
"Azt ugye tudod, hogy a data science-nek nem sok (semmi) koze van a szoftverfejleszteshez."
Én ezt erősen kétlem, de te magad is hoztál az igazam bizonyítására számos példát, amikor a csomagokat felsoroltad.
Ez a terület igényel komoly információelméleti, statisztikai, valószinűségszámítási, stb. jártasságot, valamint a szükséges high end matek valamely programnyelven való leképezésének, hmm képességét.
Az egy dolog, hogy 3-4 hónapos tanfolyamokon oktatják az ehhez a szakirányhoz elengedhetetlenül szükséges ismereteket, de ez nem jelenti egyben azt, hogy aki egy ilyen tanfolyamot elvégez, az mindjárt null kilométeres big data analyzerré válik, különösen nem, ha korábban nem is volt programfejlesztési gyakorlata.
Lehet, hogy akad cég, amely vagy kényszerből, rászorultságból, vagy csak úgy, lehetőséget biztosít olyanok számára is, akik csak reménybeli fejlesztői ennek a területnek, de csak ebben, én azért nem bíznék.
Öh, nem úgy gondoltam én sem, hogy valaki biológusként dolgozik egy kutatóintézetben 6 évet - ami alatt teszem azt patkány agyat analizált - aztán a biológus PhD elvégzése után elmegy Data science bootcap-be Berlin-be és 3 hónap után már 5000 Euro nettóért lesz Senior Data analyst a Google-nél...
Hanem kb egy úgy hogy egy bootcamp után egy iylen ember kap egy Junior pozíciót egy német cégnél - ha beszél németül is.... - aztán majd kiderül lesz-e belőle valami....
Igazából...nekem itt sokan azt mondták, hogy akkora hiány van kb bármilyen programozóból Németországban, hogy aki beszél németül és egy Snake szintű játékot tud kódolni azt már másnap kb felvezsik junior pozícióba...nemhoyg PhD....akár BSc nélkül is.....anynira nincs ember.
Volt egy spanom aki a TU Münchenen végzett MSc-t mint szoftvermérnök. éllamvizsga után egy héten belül 8 interjúra hívták, és volt hogy olyan emebrek ültek a az interjúztatóik között akiknek még BSc-jük se volt, éretttségivel nyomulta...de viszont kódolni tudtak...
"Ez a terület igényel komoly információelméleti, statisztikai, valószinűségszámítási, stb. jártasságot, valamint a szükséges high end matek valamely programnyelven való leképezésének, hmm képességét"
Szerintem arra alapoznak, hogy ha beesik egy PhD-t végzett biológus, fizikus, kémikus stb a Max Planc intézetből egy Data Science bootcamp-be akkor az előbb utóbb fel tud zárkózni ezekkela dolgokkal.
De Balázska, Pistike, vagy az utca embere, avgy csakúgy akárki nem biztos....
Elon Musk asszem 12 éves tanult meg otthon melegítőben kódolni és csinálta első lövöldözős játékát.
Ez reális, iylen van.
De Data Science területtel nehezebb boldogult volna...
"Ez a terület igényel komoly információelméleti, statisztikai, valószinűségszámítási, stb. jártasságot, valamint a szükséges high end matek valamely programnyelven való leképezésének, hmm képességét."
Igen. Csakhogy az továbbra sem szoftverfejlesztés. Attól, mert Python, R vagy Julia nyelven tudnak írni egy script-et, amiben implementálnak egy nagyon magasszintű matemetikai eljárást, attól az nem szoftverfejlesztés. Azok az ismeretek, amitől programozó jó szofverfejlesztő, teljesen értéktelenek a data science-ben. Nem is véletlenül egy computer science BS, MS diplomával rosszabbak az esélyeid, mint egy biológia phd-vel.
"Lehet, hogy akad cég, amely vagy kényszerből, rászorultságból, vagy csak úgy, lehetőséget biztosít olyanok számára is, akik csak reménybeli fejlesztői ennek a területnek, de csak ebben, én azért nem bíznék."
Maradjunk annyiban, hogy továbbra sincs semmi foglamad a data science-ről, nulla rálátásod van a területre, egy embert nem ismersz aki ezen a területen dolgozik, így nem meglepő módon hibás a területről alkotott véleményed. A legnagyobb, adatelemzéssel (is) foglalkozó cégek alkalmazzák az ilyen "gyorstalpalókon" végzett embereket pl. google, facebook, palantir, blackrock, amzon.
17.:
"Igen. Csakhogy az továbbra sem szoftverfejlesztés. Attól, mert Python, R vagy Julia nyelven tudnak írni egy script-et, amiben implementálnak egy nagyon magasszintű matemetikai eljárást, attól az nem szoftverfejlesztés. Azok az ismeretek, amitől programozó jó szofverfejlesztő, teljesen értéktelenek a data science-ben. Nem is véletlenül egy computer science BS, MS diplomával rosszabbak az esélyeid, mint egy biológia phd-vel."
Én ezt örömmel hallom, de ezt teljesen magabiztosan mondod?
Ha pl valaki egy Software mérnök MSc-vel plusz utána 5 év szoftverfejlesztői tapasztalattal úgy dönt, hogy vált Data science-re, akkor az kb olyan mintha mindent nulláról kezdene???
Ez azért kőkeményen hangzik...
Azt én is érzékeltem "laikusként" hogy a szoftverfejelsztés egy másik világ.
De ennyire semmit nem ér ha valaki jártas benne?
"Elon Musk asszem 12 éves tanult meg otthon melegítőben kódolni és csinálta első lövöldözős játékát.
Ez reális, ilyen van."
Igen, ez reális. Az ő ~ 180 soros, basicben fejlesztett programocskájának színvonala, értéke, abszolút korrelál a jobb képességű 12 évesek szellemi teljesítményével.
"Szerintem arra alapoznak, hogy ha beesik egy PhD-t végzett biológus, fizikus, kémikus stb a Max Planc intézetből egy Data Science bootcamp-be akkor az előbb utóbb fel tud zárkózni ezekkela dolgokkal.
De Balázska, Pistike, vagy az utca embere, avgy csakúgy akárki nem biztos...."
Én úgy gondolom, hogy ezek a tanfolyamok, ha jó szándékúak, akkor azon réteget célozzák, akik PhD-ztek, MSc-ztek valamilyen területen és emellett már van programfejlesztői gyakorlatuk is. Nem kizárt, hogy ez utóbbi készség esetleg előfeltétele is a részvételnek.
A másik lehetőség, hogy a tanfolyamok szervezői csak pénzt kivánnak keresni. Ez utóbbi esetben valószinűleg nem előfeltétel a programozásban való jártasság, hiszen azzal csak szűkítenék saját, khm. lehetőségeiket.
A programfejlesztés, bármilyen alacsony - de még elégséges - színvonalon is történjen, megkiván annyi ismeretet, készséget, amelyet nem lehet 3 vagy 4 hónap alatt megszerezni.
Ezért írtam, hogy egy nagyon jó képességű egyén esélye arra, hogy fejlesztője legyen ennek a területnek, legalább egy, de inkább másfél igen erős év időigénnyel számoljon. Még ez után is jó ideig csak famulusa lehet egy, a témában már otthonosan mozgó személynek, vagy csapatnak.
Amit a kolléga hangsúlyoz, az persze igaz. Tételesen, hogy sok esetben a tisztán IT képzettségűekkel szemben előnyt élvezhetnek más területek művelői, de ez azért van, mert előfeltétel, hogy a cég adatvagyonához legyen valami köze az alkalmazottnak, hiszen hiába a jó képességű fejlesztő, ha nem ismeri azt a tudományterületet, amelynek adathalmazával dolgoznia kell. De hát, ez evidencia. Egy könyvelőprogramot sem képes megírni az, aki nem tud a könyvelésről semmit, hiába brill fejlesztő, amúgy.
Ugyanakkor, tévedés azt hinni, hogy az adatelemző dolga kimerül egy-egy matematikai formula megírásában. Nem, ez még kisebb cégeknél sincs így.
Ezen a területen is létezik MI támogatottság, az alkalmazott rendszerek (amelyekre a kolléga fura módon ki sem tért) már most nagyon komplexek (még az MI-t nélkülözők is!), ráadásul a felelősség is nagy, hiszen az eredmények egyre nagyobb szerepet kapnak a döntéselőkészítésben, mi több, sok helyütt már az adattudósok határozzák meg, hogy a folyamatok mely és mely eleme legyen adatosítva.
Összességében csak azt szerettem volna hangsúlyozni, hogy a 3-4 hónapos tanfolyam nem sok mindenre elég egy olyan személy esetében, akinek nincs szoftver fronton legalább alapszintű fejlesztésbeli jártassága.
No Uraim akkor beszéljünk konkrétan:
Találtam két könyvet a neten, amik valószínűleg hasznosak a témához:
1. Python for Data Analysis, PDF itt: [link]
2. Automate the boring Stuff with Python. PDF itt:
(Ha bármelyik link esetleg nem működik Google-ban azonnal megtaláljátok mind a kettőt)
Tegyük fel, hogy holnap leülök tanulni ezt a két könyvet, megcsinálom a feladatokat, és addig nem állok fel, ameddig el nem sajátítom a bennük lévő tudást, tartson bármeddig is.
Egy online kurzus leírásában láttam, hogy először nem árt jól begyakorolni a Python script-elést - például automatizálási feladatokon keresztül - és amikor már jól megy ugrani egybőla Data Analysis témára.
E két köny tudásának birtokála és a vele járó alapszintű rutin megléte kombinálva egy kb 8 év MSc utáni főállásos analitikai kémiai/anyagtudományi/méréstechnikai kutatási tapasztalattal (én ezzel rendelkezem) mire lenne szerintetek elegendő a Data Analysis/Data Science munkaerőpiacon? (Kódolási tapasztalatom Matlabból van valamennyi régebbről illetve Html CCS-el csináltam régebben egy honlapot, de már egyikből sem emlékszem semmire.)
A tanfolyamtól most tekintsünk el.
A könyvek anyagát véleményem szerint el tudnám sajátítani önállóan is, annyira nem tűnik bonyolultnak.
Tehát a kérdés: mit érne vajon a hátterem a két könyv tudásával kombinálva?
Kapcsolódó kérdések:
Minden jog fenntartva © 2025, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!