El papel del científico de datos (alguien que extrae historias y hace descubrimientos a partir de datos) fue famoso declarado el «trabajo más sexy del siglo XXI» en Harvard Business Review en 2012. Hace apenas dos años, los autores, Thomas H. Davenport y DJ Patil, actualizado su pronóstico para observar que los científicos de datos se han vuelto comunes y absolutamente vitales para sus negocios en la era de la inteligencia artificial y el aprendizaje automático (ML).
El rol laboral también ha evolucionado, en parte para bien y en parte para mal. «Se ha institucionalizado mejor, se ha redefinido el alcance del trabajo, la tecnología en la que se basa ha avanzado enormemente y ha aumentado la importancia de la experiencia no técnica, como la ética y la gestión del cambio», observan Davenport y Patil.
Al mismo tiempo, los científicos de datos informan que «pasan gran parte de su tiempo limpiando y discutiendo datos, y ese sigue siendo el caso a pesar de algunos avances en el uso de la propia IA para mejorar la gestión de datos».
Aún más significativo es que «muchas organizaciones no tienen culturas basadas en datos y no aprovechan los conocimientos proporcionados por los científicos de datos», descubren Davenport y Patil. «Ser contratado y bien pagado no significa que los científicos de datos puedan marcar la diferencia para sus empleadores. Como resultado, muchos se sienten frustrados, lo que genera una alta rotación».
La gente respeta a los científicos de datos, pero tiende a no actuar según sus recomendaciones o ideas, según un estudio reciente. encuesta Lo confirma un grupo de 328 profesionales de análisis de Rexer Analytics. Solo el 22% de los científicos de datos dicen que sus iniciativas (modelos desarrollados para permitir un nuevo proceso o capacidad) generalmente llegan a implementarse, observa el coautor de la encuesta Eric Siegel, ex profesor de la Universidad de Columbia y autor de El manual de la IAen un relacionado correo en KDNuggets. Más de cuatro de cada diez encuestados, el 43%, afirma que el 80% o más de sus nuevos modelos no se implementan.
Incluso modificar los modelos existentes no es suficiente en muchos casos. «Al otro lado de todo tipos de proyectos de ML, incluidos modelos de actualización para implementaciones existentes, sólo el 32 % dice que sus modelos se implementan habitualmente», añade Siegel.
¿Cuál es el problema? La interacción entre los equipos de negocios y de ciencia de datos, o la falta de ella, parece estar en el centro de muchos problemas. Sólo el 34% de los científicos de datos dice que los objetivos de los proyectos de ciencia de datos «normalmente están bien definidos antes de comenzar», según la encuesta.
Además, menos de la mitad, el 49%, puede afirmar que los gerentes y tomadores de decisiones en sus organizaciones que deben aprobar la implementación del modelo «en general tienen el conocimiento suficiente para tomar tales decisiones de manera bien informada».
En general, las principales razones citadas para no implementar los modelos de aprendizaje automático recomendados son las siguientes:
- Los tomadores de decisiones no están dispuestos a aprobar el cambio a las operaciones existentes.
- Falta de planificación suficiente y proactiva.
- Falta de comprensión de la forma adecuada de ejecutar la implementación.
- Problemas con la disponibilidad de los datos necesarios para calificar el modelo.
- No hay ninguna persona asignada para supervisar el despliegue.
- El personal no quiere o no puede trabajar eficazmente con los resultados del modelo.
- Obstáculos técnicos para calcular puntuaciones o implementar/integrar el modelo o sus puntuaciones en los sistemas existentes.
La lucha por la implementación se debe a dos factores principales que contribuyen, dice Seigel: «La falta de planificación endémica y las partes interesadas del negocio que carecen de visibilidad concreta. Muchos profesionales de datos y líderes empresariales no han llegado a reconocer que la puesta en funcionamiento prevista del ML debe planificarse con gran detalle y llevarse a cabo». agresivamente desde el inicio de cada proyecto de ML».
Los líderes o profesionales empresariales necesitan una mayor visibilidad «sobre exactamente cómo el ML mejorará sus operaciones y cuánto valor se espera que aporte la mejora», añade. «Necesitan esto para, en última instancia, dar luz verde al despliegue de un modelo y, antes de eso, opinar sobre la ejecución del proyecto durante las etapas previas al despliegue».
Es significativo que el desempeño del proyecto de ML a menudo no se mide, continúa. Con demasiada frecuencia, las mediciones de rendimiento se basan en métricas técnicas arcanas, frente a métricas comerciales, como el ROI.
También: ¿Quieres ser un científico de datos? Haz estas 4 cosas, según líderes empresariales
Aún así, ser científico de datos es un gran trabajo y sigue mejorando, sugiere la encuesta de Rexer. En la encuesta anterior de 2020, el 23 % de los científicos de datos corporativos informaron tener altos niveles de satisfacción laboral, un porcentaje que casi se duplicó al 41 % en esta encuesta más reciente. Solo el 5 por ciento expresa insatisfacción, frente al 12 por ciento en 2020.
El apetito por las habilidades en ciencia de datos también sigue creciendo. Sigue siendo difícil encontrar científicos de datos: el 40% dice estar preocupado por la escasez de talento dentro de sus empresas. La mitad informa que sus organizaciones han intensificado la capacitación interna para impulsar las habilidades en ciencia de datos, mientras que el 39% está trabajando con universidades para promover el interés en la ciencia de datos.