Lauke Kaip sukurti savo duomenų mokslo komandą 2022 metais duomenų mokslas bus vienas iš svarbiausių technologinių įgūdžių, kurį turės turėti visi darbuotojai. Bet kaip tiksliai galite padėti savo komandai ugdyti šiuos talentus ir tiksliai nustatyti, ko jiems reikia išmokti? Neseniai duomenų mokslininkų grupei išsiuntėme klausimą, prašydami pateikti bet kokius patarimus kuriant duomenų mokslo komandą. Žemiau pateikiami keli pagrindiniai patiekalai.
Ieškokite talentų savo organizacijoje.
Rinkoje nėra pakankamai žmonių, turinčių reikiamų įgūdžių, kad atitiktų didėjantį analizės gebėjimų, tokių kaip mašininis mokymasis, duomenų mokslas ir duomenų vizualizavimas, poreikį. Dėl šios priežasties šį įgūdį būtina ugdyti organizacijoje.
Pasak Mike'o Coheno, „Udemy“ instruktoriaus, procesas ugdyti talentus namuose reikalauja dvipusės strategijos. Pirmąją dalį sudaro nuolatinis mokymasis ir mokymas. Mike'as mano, kad duomenų mokslas nuolat vystosi į naujas sritis.
Tai rodo, kad jūsų įmonės darbuotojai turėtų reguliariai skirti šiek tiek savo laiko, kad neatsiliktų nuo naujausių sektoriaus pasiekimų ir lavintų pagrindinius matematinius ir statistinius gebėjimus, kuriais remiantis kuriamos duomenų mokslo strategijos.
Stenkitės pasiekti pusiausvyrą tarp savo žinių diapazono ir gylio
Mike'as mano, kad jei bandai žinoti viską, apie ką nors žinai labai mažai. Be to, neįmanoma turėti išsamių žinių duomenų mokslo srityje.
Duomenų mokslininkų tikslas turėtų būti pusiausvyra tarp plačios žinių bazės ir gilaus tam tikrų temų supratimo. Kitaip tariant, Mike'as sako, kad „kiekvienas asmuo turėtų turėti savo gilių žinių apie keletą problemų“.
Greita nuoroda:
Suteikite savo komandos nariams įrankius, kurių jiems reikia duomenų mokslo gebėjimams ugdyti.
Kokios technologijos suteikia jūsų duomenų mokslininkams didžiausią galimybę būti sėkmingiems? Diogo mano, kad efektyviausios duomenų mokslo priemonės yra tos, kurios palengvina bendradarbiavimą. Toliau pateikiamas kai kurių specifinių technologijų, kurias duomenų mokslininkai turės nuosekliai naudoti, sąrašas.
Bendradarbiavimo bloknotų įrankiai Nešiojamieji kompiuteriai yra interaktyvaus skaičiavimo forma, leidžianti duomenų mokslininkams ne tik rašyti ir paleisti kodą, bet ir peržiūrėti rezultatus bei bendradarbiauti atliekant savo atradimus.
Jie skatina bendradarbiavimą ir kartu sukuria greitą grįžtamojo ryšio kilpą. Yra platus nešiojamojo kompiuterio įrankių pasirinkimas, tačiau Jupyter dabar yra dažniausiai naudojama alternatyva.
Pasak Rebecca Vickery, dirbančios „Towards Data Science“, „Duomenų mokslininkai turi naudoti GitHub dėl tos pačios priežasties, kaip tai daro programinės įrangos inžinieriai“, ty bendradarbiauti, „saugiai“ atlikti projektų pakeitimus ir stebėti bei atšaukti pakeitimus. su laiku. „GitHub“ yra versijų valdymo sistema (VCS).
Duomenų bazė, kuri yra greita ir efektyvi, taip pat paprasta pateikti užklausas: norėdami efektyviai atlikti savo pareigas, duomenų mokslininkai turi turėti galimybę kurti ir kurti duomenų bazes, taip pat sąsają su esamomis.
Pasak Sara Metwalli iš „Towards Data Science“, „dėl duomenų bazės organizuotas saugojimas yra saugus, efektyvus ir greitas.
Jie naudojami kaip tinkamo surinktų duomenų organizavimo, saugojimo ir gavimo vadovas. Jei turite duomenų bazes, jums nereikės sugalvoti, ką daryti su savo duomenimis kiekvienam naujam projektui. „Hive“, „Presto“ ir „Redshift“ yra populiarių duomenų bazių valdymo sistemų pavyzdžiai.
Paprastos naudoti prietaisų skydelio technologijos populiarėja, nes daugiau darbuotojų yra suinteresuoti gauti įžvalgų iš duomenų, net jei jie neturi oficialaus duomenų mokslininko titulo. „Tableau“ ir „Looker“ yra duomenų vizualizavimo prietaisų skydelio sprendimų, padedančių lengviau rodyti ir dalytis duomenimis, pavyzdžiai.