Si të bëheni shkencëtar i të dhënave?

Soner Yıldırım

Soner Yildirim, është një autodidakt që ka mësuar shkencën e të dhënave. Ky i fundit, ka dhënë tri sugjerime se si mund të vetë-bëhemi shkencëtarë i të dhënave, duke vetë-mësuar.

Bëni udhëtimin tuaj

Udhëtimi im i shkencës së të dhënave filloi në vitin 2019. Ata që më ndjekin në Medium do ta dinë se më pëlqen të ndaj përvojën time për të mësuar shkencën e të dhënave. Unë shkruaj për gabimet që kam bërë, sfidat me të cilat jam përballuar, mjetet që përdor shpesh, e kështu me radhë.

Në këtë artikull, do të doja të ndaja 3 sugjerime për ata që planifikojnë të bëhen shkencëtarë të të dhënave ose sapo kanë filluar të mësojnë shkencën e të dhënave. Këto bazohen në përvojën time dhe atë që unë vëzhdoj në ekosistemin e shkencës së të dhënave.

Pa vonesë, le të fillojmë.

  1. Jini të shkathët

Gjithnjë e më shumë biznese investojnë në shkencën e të dhënave me synimin për të kthyer të dhënat në vlerë. Forma e kësaj vlere varet nga biznesi dhe industria.

Shitësit me pakicë përdorin shkencën e të dhënave për të menaxhuar inventarin e tyre në mënyrë më efikase duke krijuar modele të sakta dhe të fuqishme të mësimit të makinerive.

Fabrikat mbledhin dhe analizojnë sasi të mëdha të të dhënave të sensorëve për mirëmbajtje parashikuese.

Kam parë disa restorante që zbatojnë sisteme të përpunimit të imazhit për të zbuluar se cilët artikuj janë hedhur në kosh. Kjo i lejon ata të menaxhojnë më mirë se sa duhet të gatuajnë.

Ilustrimi

Lista vazhdon. Ka shumë aplikacione dhe produkte të shkencës së të dhënave të përdorura në një sërë industrish.

Në këtë botë gjithnjë në zgjerim të shkencës së të dhënave, mjetet dhe teknikat evoluojnë dhe zgjerohen gjithashtu. Për të qëndruar konkurrues, shkencëtarët e të dhënave duhet të jenë të shkathët dhe t’i përshtaten ndryshimeve lehtësisht.

Pasi të jeni rehat duke punuar me një mjet të caktuar, duket si humbje kohe për të mësuar një të ri. Megjithatë, mjeti i ri ka të ngjarë të sigurojë performancë më të mirë. Ndiqni përparimet në teknologji dhe kërkime sa më shumë që mundeni dhe mos hezitoni të provoni mjete të reja.

Kjo, natyrisht, nuk do të thotë që ju duhet të mësoni se si të përdorni gjithçka që është në dispozicion. Kjo nuk është e mundur apo e realizueshme. Ndërsa fitoni më shumë përvojë në këtë fushë, do të keni një ndjenjë të asaj që është premtuese dhe ka një potencial që ia vlen të zbulohet. Megjithatë, kërkesa themelore është që ju duhet të jeni gati për ndryshim.

 

  1. Çertifikatat kanë rëndësi, por nuk llogariten

Sasia dhe shumëllojshmëria e burimeve për të mësuar shkencën e të dhënave është e madhe. Mund të lexoni libra, të shikoni mësime, të merrni kurse në internet etj.

Dhe, ekziston realiteti i çertifikatave. Ju mund të gjeni një çertifikatë për pothuajse çdo temë të shkencës së të dhënave. Disa mbulojnë një gamë më të gjerë, ndërsa disa fokusohen në një detyrë specifike si pastrimi i të dhënave me Panda.

Nëse do të ndiqni një rrugë të vetë-mësimit, çertifikatat ju vijnë në ndihmë, në fillim nisa me mbledhjen e disa prej tyre. Dy avantazhet e rëndësishme të çertifikatave janë:

Ato janë shumë më të lira se metodat tradicionale të të mësuarit, siç është diploma master.

Zakonisht ato janë të organizuara dhe të strukturuara mirë, në mënyrë që të njiheni shpejt me këtë fushë.

ilustrimi

Ndërsa jam dakord për përfitimin e çertifikatave, sugjeroj që të mos fokusohemi shumë në to. Të kesh 20 çertifikata nuk do të ketë një ndikim të rëndësishëm në punësimin e menaxherëve ose rekrutuesve. Nuk mendoj se do të kalojnë një listë prej 20 çertifikatash.

Gjithashtu, ato që mësoni nga çertifikatat janë të kufizuara. Shumica e tyre kërkojnë shikimin e mësimeve dhe zgjidhjen e ushtrimeve të thjeshta. Ju mund ta kuptoni një temë duke shikuar një tutorial. Megjithatë, në mënyrë që ta mësoni atë, keni nevojë për përvojë praktike dhe përfshirje aktive.

 

  1. Bëni një projekt që imiton një rrjedhë të tërë pune

Nga jashtë, puna e një shkencëtari të të dhënave duket se është të analizojë të dhënat për të nxjerrë njohuri dhe për të krijuar modele. Kjo ishte ajo që mendoja, të paktën.

Tani që kam futur idetë e mia për atë që bëjnë shkencëtarët e të dhënave janë shumë të ndryshme. Nxjerrja e njohurive nga të dhënat ose krijimi i modeleve është, sigurisht, një pjesë e rëndësishme e saj. Megjithatë, në shumicën e rasteve, ajo që pritet nga një shkencëtar i të dhënave shkon përtej kësaj.

Ajo përfshin shumë atë që dihet se është puna e inxhinierëve të të dhënave. Për shembull, si një shkencëtar i të dhënave, ndoshta do t’ju duhet të merrni pjesë në proceset ETL. Në varësi të kompanisë, mund t’ju duhet të merreni me disa detyra inxhinierike softuerike.

Ajo që mendoj se pjesa më sfiduese është të bësh mësimin e makinerive në prodhim dhe në shkallë.

ilustrimi

Le të themi se ju është caktuar të krijoni një model të mësimit të makinës për parashikimin e shitjeve. Kur mësojmë shkencën e të dhënave, ne zakonisht punojmë në fletore Jupyter. Megjithatë, në jetën reale, modeli juaj duhet të vendoset në prodhim. Mund të jetë përgjegjësia juaj ose do t’ju duhet të merrni pjesë.

Në çdo rast, unë sugjeroj të njiheni me mjetet e përdorura për mësimin e makinerive në prodhim. Nga rruga, nuk duhet të jetë mësimi i makinës. Në vend të kësaj, mund të jetë mbledhja e të dhënave nga disa burime të ndryshme, pastrimi dhe kombinimi i tyre dhe kryerja e disa analizave. Pjesa e përbashkët është se duhet bërë në prodhim.

Ajo që ndihmon më shumë për këto detyra është të bësh një projekt që përfshin hapat e rrjedhës tipike të punës së shkencës së të dhënave në prodhim.

Këtu është një sugjerim i një projekti:

Mblidhni të dhëna të ruajtura në renë kompjuterike (p.sh. kovë S3)

Drejtoni një skript që pastron dhe përpunon paraprakisht të dhënat

Krijoni një model të mësimit të makinerive dhe stërvituni me të dhënat e parapërpunuara

Bëni parashikime

Shkruani parashikimet në re

I gjithë ky proces mund të ekzekutohet në një server EC2 dhe të orkestrohet duke përdorur Airflow. Duke përfunduar me sukses këtë projekt, ju do të fitoni përvojë praktike në fushat e mëposhtme:

Cloud computing

Pastrimi dhe parapërpunimi i të dhënave

Mësimi i makinerisë

Orkestrimi i tubacioneve të të dhënave dhe rrjedhave të punës

Jam shumë i sigurt se ky projekt është shumë më i dobishëm sesa plotësimi i shumë çertifikatave.

Shija e redaktorit

Voton Bujar Osmani, kandidat për president i Maqedonisë Veriore

Kandidati për president i Maqedonisë së Veriut, Bujar Osmani, ka votuar. Në një deklaratë para medieve, Osmani inkurajoi qytetarët të dalin në numër sa më...

Presidentja Osmani nderohet me Çmimin e Evropës nga Fondacioni Pan-Europian

Fondacioni Fondacioni Pan-Evropian Richard Coudenhove-Kalergi i ka ndarë Presidentes së Kosovës Vjosa Osmani, çmimin e ‘Evropës’, për përkushtimin e saj ndaj raporteve me partnerët...

Nis ceremonia e diplomimit të gjeneratës së 59-të të Policisë...

Ka filluar ceremonia e diplomimit të gjeneratës së 59-të të Policisë së Kosovës. Sot diplomojnë 445 kadetë të Policisë së Kosovës. Kryeministri i Republikës së Kosovës,...

Të fundit nga rubrika