в Как да развиете своя екип за наука за данни През 2022 г. науката за данните ще бъде едно от най-важните технологични умения, които всички служители трябва да притежават. Но как точно можете да помогнете на вашия екип в развитието на тези таланти и да посочите точно какво трябва да научат? Наскоро изпратихме въпрос до група учени по данни, като ги помолихме да предоставят всякакви съвети, които биха могли да имат за изграждането на екип за наука за данни. Няколко основни извода са изброени по-долу.
Търсете талант във вашата организация.
На пазара няма достатъчно хора, които да притежават необходимите умения, за да отговорят на нарастващата нужда от способности за анализ като машинно обучение, наука за данни и визуализация на данни. Поради това е абсолютно необходимо да се култивира това умение в рамките на организацията.
Според Майк Коен, инструктор в Udemy, процесът на развиване на таланти вътрешно изисква двупосочна стратегия. Първата част се състои от продължаващо образование и обучение на последователна основа. Майк вярва, че науката за данни винаги се развива в нови области.
Това показва, че вашият вътрешен персонал трябва рутинно да посвещава част от времето си, за да бъде в крак с най-новите постижения в сектора и да освежи основните математически и статистически способности, върху които са изградени стратегиите за наука за данни.
Стремете се да постигнете баланс между обхвата и дълбочината на знанията си
Майк вярва, че ако се опиташ да знаеш всичко, в крайна сметка знаеш много малко за нищо. Освен това не е възможно да имате пълни познания в областта на науката за данните.
Целта на учените по данни трябва да бъде да постигнат баланс между наличието на широка база от знания и задълбочено разбиране на определени теми. Казано по друг начин, Майк казва, че „всеки човек трябва да има собствени задълбочени познания по малък брой проблеми“.
Бърз линк:
Дайте на членовете на вашия екип инструментите, от които се нуждаят, за да изградят своите способности за наука за данни.
Кои технологии предоставят на вашите специалисти по данни най-добрия шанс за успех? Диого вярва, че най-ефективните инструменти за наука за данни са тези, които улесняват съвместната работа. Следва списък на някои от специфичните видове технологии, които специалистите по данни ще трябва да използват последователно.
Инструменти за преносими компютри за съвместна работа Преносимите компютри са форма на интерактивно изчисление, която позволява на специалистите по данни не само да пишат и изпълняват код, но и да преглеждат резултатите и да си сътрудничат в своите открития.
Те насърчават сътрудничеството, като същевременно създават бърза обратна връзка. Има широк избор от налични инструменти за преносими компютри, но Jupyter сега е най-често използваната алтернатива.
Според Ребека Викери, която работи в Towards Data Science, „учените по данни трябва да използват GitHub по почти същата причина, поради която го правят софтуерните инженери“, а именно за сътрудничество, „безопасно“ правене на промени в проекти и възможност за проследяване и връщане назад на промените с течение на времето. GitHub е система за контрол на версиите (VCS).
База данни, която е бърза и ефективна, както и лесна за заявки: За да изпълняват задълженията си ефективно, специалистите по данни трябва да могат да разработват и създават бази данни, както и да взаимодействат със съществуващите.
Според Сара Метуали от Towards Data Science, „Базите от данни правят организираното съхранение безопасно, ефективно и бързо.
” Те служат като ръководство за правилната организация, съхранение и извличане на данните, които се събират. Ако имате бази данни, няма да ви се налага да измисляте какво да правите с вашите данни за всеки нов проект. Hive, Presto и Redshift са примери за популярни системи за управление на бази данни.
Технологиите на таблото за управление, които са лесни за използване, набират популярност, тъй като по-голям брой работници се интересуват от извличане на информация от данни, дори и да не притежават официалната титла специалист по данни. Tableau и Looker са примери за решения за табло за визуализация на данни, които спомагат за по-лесното излагане и споделяне на данни.