データサイエンスチームを育成する方法 2022 年には、データ サイエンスはすべての従業員が持つべき最も重要な技術スキルの XNUMX つになるでしょう。 しかし、これらの才能の開発においてチームを支援し、彼らが学ぶ必要があるものを正確に特定するにはどうすればよいでしょうか? 最近、私たちはデータ サイエンティストのグループに質問を送り、データ サイエンス チームを構築するためのアドバイスがあれば教えてほしいと依頼しました。 いくつかの主要な要点を以下に示します。
組織内の人材を探します。
市場には、機械学習、データ サイエンス、データ視覚化などの分析能力に対するニーズの拡大に対応するのに必要なスキルを備えた人材が不足しています。 このため、組織内でこのスキルを育成することが絶対に必要です。
Udemyのインストラクターであるマイク・コーエン氏によると、 社内で人材を育成する 二方向の戦略が必要です。 最初の段階は、一貫した教育とトレーニングを継続することで構成されます。 マイクは、データ サイエンスは常に新しい分野に発展していると信じています。
これは、社内スタッフが、この分野の最新の進歩を常に把握し、データ サイエンス戦略を構築するための基本的な数学的および統計的能力を磨くことに定期的に時間の一部を費やす必要があることを示しています。
知識の範囲と深さのバランスを保つよう努める
マイクは、すべてを知ろうとすると、結局何についてもほとんど知らないことになると信じています。 さらに、データ サイエンスの分野で完全な知識を持つことは現実的ではありません。
データ サイエンティストの目標は、幅広い知識ベースを持つことと、特定のトピックについての深い理解の間でバランスを取ることです。 別の言い方をすれば、マイクは「各個人は少数の問題について独自の深い知識を持つべきだ」と言っています。
クイックリンク:
チームのメンバーに、データ サイエンスの能力を構築するために必要なツールを提供します。
データ サイエンティストが成功する可能性が最も高いのはどのテクノロジーですか? Diogo 氏は、データ サイエンスに最も効果的なツールは、共同作業を促進するツールであると信じています。 以下は、データ サイエンティストが一貫して利用する必要がある特定の種類のテクノロジのリストです。
コラボレーション ノートブック用のツール ノートブックはインタラクティブ コンピューティングの一種で、データ サイエンティストがコードを作成して実行するだけでなく、結果を表示したり、発見に基づいて共同作業したりすることもできます。
これらは協力を促進すると同時に、迅速なフィードバック ループを生み出します。 利用可能なノートブック ツールには幅広い選択肢がありますが、現在では Jupyter が最もよく使用されています。
Towards Data Science で働く Rebecca Vickery 氏によると、「データ サイエンティストは、ソフトウェア エンジニアとほぼ同じ理由で GitHub を使用する必要があります」時間とともに。 GitHub はバージョン管理システム (VCS) です。
迅速かつ効果的で、クエリが簡単なデータベース: データ サイエンティストが職務を効果的に実行するには、データベースを開発および作成できるだけでなく、既存のデータベースと連携できる必要があります。
Towards Data Science の Sara Metwalli 氏は次のように述べています。「データベースにより、組織化されたストレージが安全、効率的、迅速になります。
これらは、収集されたデータを適切に整理、保存、取得するためのガイドとして機能します。 データベースをお持ちであれば、新しいプロジェクトごとにデータをどう扱うかを考える手間がかかりません。 Hive、Presto、Redshift は、一般的なデータベース管理システムの例です。
データ サイエンティストの正式な肩書を持っていなくても、より多くの従業員がデータから洞察を引き出すことに興味を持っているため、使いやすいダッシュボード テクノロジの人気が高まっています。 Tableau と Looker は、データの表示と共有を容易にするデータ視覚化ダッシュボード ソリューションの例です。