В Как развивать команду по науке о данных В 2022 году наука о данных станет одним из важнейших технологических навыков, которыми должны обладать все сотрудники. Но как именно вы можете помочь своей команде в развитии этих талантов и точно определить, чему им нужно научиться? Недавно мы отправили вопрос группе ученых, занимающихся данными, с просьбой дать какие-либо советы, которые они могут дать для создания команды специалистов по данным. Несколько основных выводов перечислены ниже.
Ищите таланты внутри вашей организации.
На рынке недостаточно людей, обладающих необходимыми навыками, чтобы соответствовать растущей потребности в аналитических способностях, таких как машинное обучение, наука о данных и визуализация данных. Поэтому абсолютно необходимо развивать этот навык внутри организации.
По словам Майка Коэна, инструктора Udemy, процесс развитие талантов внутри компании требует двусторонней стратегии. Первый этап состоит из непрерывного образования и обучения на постоянной основе. Майк считает, что наука о данных всегда развивается в новые области.
Это указывает на то, что ваш штатный персонал должен регулярно посвящать часть своего времени тому, чтобы быть в курсе самых последних достижений в отрасли и освежать в памяти фундаментальные математические и статистические способности, на которых строятся стратегии обработки данных.
Стремитесь к достижению равновесия между диапазоном и глубиной своих знаний
Майк считает, что если вы пытаетесь знать все, вы в конечном итоге узнаете очень мало обо всем. Кроме того, невозможно иметь полные знания в области науки о данных.
Цель специалистов по данным должна состоять в том, чтобы найти баланс между наличием широкой базы знаний и глубоким пониманием определенных тем. Другими словами, Майк говорит, что «каждый человек должен иметь собственные глубокие знания по небольшому количеству вопросов».
Прямая ссылка:
Предоставьте членам вашей команды инструменты, необходимые для развития их способностей в области обработки данных.
Какие технологии обеспечивают вашим специалистам по данным наилучшие шансы на успех? Диого считает, что наиболее эффективными инструментами для науки о данных являются те, которые облегчают совместную работу. Ниже приведен список некоторых конкретных видов технологий, которые специалистам по данным необходимо будет использовать на постоянной основе.
Инструменты для совместных блокнотов Блокноты — это форма интерактивных вычислений, которые позволяют специалистам по данным не только писать и запускать код, но также просматривать результаты и совместно работать над своими открытиями.
Они способствуют сотрудничеству, одновременно создавая быструю петлю обратной связи. Существует широкий выбор доступных инструментов для ноутбуков, но Jupyter в настоящее время является наиболее часто используемой альтернативой.
По словам Ребекки Викери, которая работает в Towards Data Science, «ученым, работающим с данными, нужно использовать GitHub почти по той же причине, что и разработчикам программного обеспечения», то есть для совместной работы, «безопасного» внесения изменений в проекты и возможности отслеживать и откатывать изменения. со временем. GitHub — это система контроля версий (VCS).
Быстрая и эффективная база данных, а также простая для запросов: чтобы эффективно выполнять свои обязанности, специалисты по данным должны иметь возможность разрабатывать и создавать базы данных, а также взаимодействовать с существующими.
По словам Сары Метвалли из Towards Data Science, «базы данных делают организованное хранение безопасным, эффективным и быстрым.
Они служат руководством для правильной организации, хранения и поиска собранных данных. Если у вас есть базы данных, вам не придется разбираться, что делать с вашими данными для каждого нового проекта. Hive, Presto и Redshift — примеры популярных систем управления базами данных.
Технологии информационных панелей, которые просты в использовании, набирают популярность, потому что все больше работников заинтересованы в получении информации из данных, даже если они не имеют официального звания специалиста по данным. Tableau и Looker — это примеры решений для панели визуализации данных, которые помогают упростить демонстрацию данных и обмен ими.