En Cómo desarrollar su equipo de ciencia de datos En 2022, la ciencia de datos será una de las habilidades tecnológicas más importantes que todos los empleados deben poseer. Pero, ¿cómo puede ayudar exactamente a su equipo en el desarrollo de estos talentos y determinar qué es lo que necesitan aprender? Recientemente, enviamos una pregunta a un grupo de científicos de datos, pidiéndoles que brindaran cualquier consejo que pudieran tener para construir un equipo de ciencia de datos. Algunas conclusiones importantes se enumeran a continuación.
Búsqueda de talento dentro de su organización.
No hay suficientes personas en el mercado que posean las habilidades necesarias para satisfacer la creciente necesidad de capacidades de análisis, como el aprendizaje automático, la ciencia de datos y la visualización de datos. Por ello, es absolutamente necesario cultivar esta habilidad dentro de la organización.
Según Mike Cohen, instructor de Udemy, el proceso de desarrollando talento internamente requiere una doble estrategia. La primera vertiente se compone de educación y capacitación continuas de manera constante. Mike cree que la ciencia de datos siempre se está desarrollando en nuevas áreas.
Esto indica que su personal interno debería dedicar rutinariamente parte de su tiempo a mantenerse al tanto de los avances más recientes en el sector y repasar las habilidades matemáticas y estadísticas fundamentales sobre las que se construyen las estrategias de ciencia de datos.
Esfuércese por lograr un equilibrio entre el alcance y la profundidad de su conocimiento.
Mike cree que si tratas de saberlo todo, terminas sabiendo muy poco sobre cualquier cosa. Además, no es factible tener un conocimiento completo en el campo de la ciencia de datos.
El objetivo de los científicos de datos debe ser lograr un equilibrio entre tener una amplia base de conocimientos y una comprensión profunda de ciertos temas. Para decirlo de otra manera, Mike dice que “cada individuo debe tener su propio conocimiento profundo de una pequeña cantidad de problemas”.
Enlace rápido:
Proporcione a los miembros de su equipo las herramientas que necesitan para desarrollar sus habilidades de ciencia de datos.
¿Qué tecnologías brindan a sus científicos de datos la mejor oportunidad de tener éxito? Diogo cree que las herramientas más efectivas para la ciencia de datos son aquellas que facilitan el trabajo colaborativo. La siguiente es una lista de algunos de los tipos específicos de tecnologías que los científicos de datos necesitarán utilizar de manera consistente.
Herramientas para cuadernos colaborativos Los cuadernos son una forma de computación interactiva que permite a los científicos de datos no solo escribir y ejecutar código, sino también ver los resultados y colaborar en sus descubrimientos.
Fomentan la cooperación al mismo tiempo que producen un ciclo de retroalimentación rápido. Hay una amplia selección de herramientas para portátiles disponibles, pero Jupyter es ahora la alternativa más utilizada.
Según Rebecca Vickery, que trabaja en Towards Data Science, "los científicos de datos necesitan usar GitHub por la misma razón que los ingenieros de software", que es para colaborar, realizar cambios "seguros" en los proyectos y poder rastrear y revertir los cambios. tiempo extraordinario. GitHub es un sistema de control de versiones (VCS).
Una base de datos que sea rápida y efectiva, así como fácil de consultar: para llevar a cabo sus funciones de manera efectiva, los científicos de datos deben poder desarrollar y crear bases de datos, así como interactuar con las existentes.
Según Sara Metwalli de Towards Data Science, “Las bases de datos hacen que el almacenamiento organizado sea seguro, eficiente y rápido.
Sirven como guía para la correcta organización, almacenamiento y recuperación de los datos que se recopilan. Si tiene bases de datos, no tendrá que pasar por la molestia de averiguar qué hacer con sus datos para cada nuevo proyecto. Hive, Presto y Redshift son ejemplos de sistemas populares de administración de bases de datos.
Las tecnologías de tablero que son fáciles de usar están ganando popularidad porque una mayor cantidad de trabajadores están interesados en obtener información de los datos, incluso si no tienen el título oficial de científico de datos. Tableau y Looker son ejemplos de soluciones de panel de visualización de datos que ayudan a que sea más fácil mostrar y compartir datos.