在 如何发展你的数据科学团队 到 2022 年,数据科学将成为所有员工应具备的最重要的技术技能之一。 但是,您究竟如何帮助您的团队培养这些人才并确定他们需要学习什么? 最近,我们向一组数据科学家提出了一个问题,要求他们提供有关建立数据科学团队的任何建议。 下面列出了一些主要要点。
在组织内部寻找人才。
市场上没有足够的人具备必要的技能来满足对机器学习、数据科学和数据可视化等分析能力不断增长的需求。 正因为如此,在组织内培养这种技能是绝对必要的。
根据 Udemy 讲师 Mike Cohen 的说法, 内部培养人才 需要双管齐下的策略。 第一个方面是持续的继续教育和培训。 Mike 相信数据科学总是在向新的领域发展。
这表明您的内部员工应该定期花一些时间来了解该领域的最新进展,并温习构建数据科学策略所依据的基本数学和统计能力。
努力在知识的广度和深度之间取得平衡
迈克相信,如果你试图了解一切,你最终会发现对任何事情都知之甚少。 此外,拥有数据科学领域的完整知识也是不可行的。
数据科学家的目标应该是在拥有广泛的知识基础和对某些主题的深入理解之间取得平衡。 换句话说,迈克说“每个人都应该对少数问题有自己深刻的了解。”
快速链接:
为您的团队成员提供培养数据科学能力所需的工具。
哪些技术为您的数据科学家提供了成功的最佳机会? Diogo 认为,数据科学最有效的工具是那些促进协作工作的工具。 以下是数据科学家需要一致使用的一些特定技术的列表。
协作笔记本工具笔记本是一种交互式计算形式,使数据科学家不仅可以编写和运行代码,还可以查看结果并就他们的发现进行协作。
他们促进合作,同时产生快速反馈循环。 有多种笔记本工具可供选择,但 Jupyter 是现在最常用的替代品。
Towards Data Science 的 Rebecca Vickery 表示,“数据科学家需要使用 GitHub 的原因与软件工程师的原因大致相同”,即协作、“安全”地对项目进行更改以及能够跟踪和回滚更改随着时间的推移。 GitHub 是一个版本控制系统(VCS)。
快速有效且易于查询的数据库:为了有效地履行其职责,数据科学家需要能够开发和创建数据库以及与现有数据库的接口。
Towards Data Science 的 Sara Metwalli 表示:“数据库使有组织的存储安全、高效且快速。
它们可以作为正确组织、存储和检索所收集数据的指南。 如果您有数据库,您就不必费力去弄清楚如何处理每个新项目的数据。 Hive、Presto 和 Redshift 是流行数据库管理系统的示例。
易于使用的仪表板技术越来越受欢迎,因为越来越多的员工有兴趣从数据中获取见解,即使他们没有数据科学家的官方头衔。 Tableau 和 Looker 是数据可视化仪表板解决方案的示例,可帮助您更轻松地展示和共享数据。