jueves 25, abril 2024
El tiempo - Tutiempo.net
jueves 25, abril 2024

Científicos de datos, claves para cambios organizativos y “en la cresta de la ola”

ESCUCHAR

PROYECCIÓN. SE ENCUENTRAN ENTRE LOS PERFILES DE MAYOR DEMANDA Y MEJORES SUELDOS
Es una de las profesiones con mejores opciones a futuro dentro de Argentina. La frenética actualización tecnológica, la digitalización y la superabundancia de información disponible, requieren hoy de especialistas que logren desentrañar aquella que resulte valiosa para el negocio. Cuatro referentes cordobeses cuentan de qué se trata, cómo impactan y qué viene

Por Carolina Klepp
[email protected]


El campo de la Ciencia de Datos crece a pasos agigantados y, con ella, la necesidad de expertos en la obtención y análisis de información para mejorar los procesos en empresas y organizaciones. 

Un científico de datos (data scientist) transformará una gran cantidad de datos sobre el comportamiento del sistema y de los usuarios en información legible, entendible y útil para el resto.

Quienes estén en la búsqueda de una carrera prometedora para enfocar sus estudios, esta es una de las profesiones con mejores opciones a futuro dentro de Argentina.

Si se tiene en cuenta como el mundo se va actualizando cada vez más en cuanto a tecnologías y digitalización, estos profesionales comparten podio con los de mayor demanda y mejores sueldos.

Ante la abundancia de información disponible, las empresas requieren hoy de especialistas que logren desentrañar aquella que resulte valiosa para el negocio. Las herramientas: matemática, computación, análisis de datos, curiosidad y pasión por resolver problemas.

Para conocer más sobre esta profesión que está en “la cresta de la ola”, Comercio y Justicia consultó a cuatro referentes cordobeses en el tema y les preguntó: 

  • 1. ¿Qué hacen los científicos de datos (data scientist)?
  • 2. ¿Cuál es el futuro de esta profesión cada vez más demandada?
  • 3. ¿Qué cambios puede producir la incorporación de un científico de datos en una empresa u organización que nunca tuvo uno?


Johanna Frau, doctora en matemática, se desempeña como científica de datos en Mercado Libre y forma parte de un equipo de machine learning que es transversal a toda la compañía.

Analiza datos utilizando técnicas estadísticas, e implementa modelos de machine learning para predecir y resolver alguna necesidad puntual de la compañía. También realiza investigaciones y pruebas de conceptos con el objetivo de diseñar un nuevo producto o rediseñar uno viejo. 

1. Me gusta pensar el rol de data scientist como aquella persona que resuelve problemas de la vida real usando modelos matemáticos (algoritmos) y un conjunto de datos (usualmente grande) desde una perspectiva aplicada. Estas soluciones, en general, responden a necesidades particulares -ya sea de un empresa, una institución o bien de una persona concreta- y permiten tomar decisiones a diferentes niveles y con distintos impactos. Los problemas reales pueden ir desde optimizar un presupuesto para poder realizar una mejor distribución del dinero, recomendar películas, series o publicaciones de una red social o plataforma para mejorar la experiencia de los usuarios, hasta detectar tumores “automáticamente” usando imágenes médicas para agilizar o acompañar el diagnóstico médico. 

2. Está profesión va a continuar evolucionando como lo hizo siempre. El rol no es nuevo, solo que antes se conocía con otros nombres y con el boom de los datos hoy escuchamos Científico de Datos o Ciencia de datos por todos lados.
Personalmente, pensando en el futuro, una de las cosas que me gustaría es que sigamos prestando atención a los sesgos que les transmitimos a los algoritmos a través de los datos que recolectamos. Tenemos que seguir incorporando distintas herramientas para mitigar ese sesgo y a su vez formarnos en cuestiones éticas. Los algoritmos de machine learning están cada vez más presentes en nuestra vida diaria y nosotros como personas que los programamos no debemos perder de vista eso. No menos importante es seguir trabajando por tener equipos más diversos e inclusivos dando lugar cada vez a grupos históricamente excluidos en el rubro de la tecnología.

3. Una de las características de un data scientist es que, por su formación, suele aportar una mirada analítica en general o acerca de un problema. Desde este lugar, creo que una empresa u organización puede enriquecerse mucho de su mirada. Como consecuencia de esto, sus análisis pueden permitir mejorar procesos internos o relaciones con eventuales clientes. Un aspecto importante a tener en cuenta es que la incorporación de un rol de este tipo debe estar acompañada idealmente por un contexto que acompañe. Esto implica por ejemplo, un equipo con otros roles de machine learning, un stack tecnológico donde poder realizar análisis y pruebas y algún norte claro por dónde empezar a trabajar. 


Milagro Teruel, doctora en ciencias de la computación y cofundadora de Mujeres en Tecnología Córdoba (MeTCba), trabaja como research software engineer para Microsoft Research, desde Córdoba pero con un equipo de Estados Unidos. 


Actualmente, busca mejorar la eficiencia de grandes modelos de procesamiento de lenguaje natural por medio de la compresión del modelo para hacerlo más sencillo, y el uso de aprendizaje a partir de interacciones con humanos que puedan proveer ayuda o correcciones directas al modelo. “Si bien este trabajo no es lo que se consideraría tradicionalmente data science, sí provee herramientas para realizar otros proyectos, por ejemplo bots que funcionen como asistentes a jugadores de Minecraft, ¡dentro del mismo juego!”, describe. 

1. El concepto de ciencia de datos es muy flexible, se utiliza para definir un montón de técnicas, roles y abordajes distintos. Lo que hacemos es programar herramientas que aprendan resolver problemas solas a partir de un conjunto de datos. Por ejemplo, que aprendan a hacer resúmenes de libros después de leer muchos libros y sus resúmenes que aparecen en Wikipedia. En mi experiencia, he tenido la posibilidad de colaborar con otras disciplinas como economía, sociología y medicina, en la resolución de problemas prácticos muy interesantes. Uno de mis favoritos fue detectar si el texto de una historia clínica es un diagnóstico de covid positivo o no, para poder llevar registro del aumento de casos.

2. La tendencia dentro del área es el desarrollo de programas, llamados modelos, generales que pueden aprender tareas nuevas con facilidad. Al mismo tiempo, la comunidad de las ciencias de la computación busca aplicarlos a diversos problemas, pero que en general son de gran alcance, como puede ser la detección automática de rostros.
En mi opinión, a medida que estos problemas se resuelven surge una necesidad de colaborar con expertos de otros dominios que conozcan y estudien otro tipo de problemas. Cada vez más personas que no se formaron en programación van a utilizar o interactuar con estos modelos para otros problemas particulares y de menor alcance, como puede ser la detección de discurso de odio de acuerdo al dialecto y modismos de cada sub-población, convirtiéndose también en data scientists. Esto va a llevar a un enriquecimiento de todas las ciencias, cuando se comiencen a aplicar herramientas basadas en inteligencia artificial para todo tipo de situaciones.

3. Lo primero que se aborda en una empresa que no utiliza inteligencia artificial y que quiere innovar en algunas áreas es el estudio de dicho problema y los datos disponibles. Luego, se comienza por aplicar métodos básicos, lo que ya se ha probado por años de experiencia que dan buen resultado. Eso generalmente soluciona u optimiza el problema en 60% o hasta 80%, y se puede observar el impacto en menos de un año de trabajo. Luego, con la solución funcionando, se itera sobre el problema para mejorar cada vez más los resultados. Pero hay que tener en cuenta, siempre existen riesgos porque no todos los problemas tienen soluciones conocidas o datos disponibles, hay que seguir los consejos de las personas expertas y no exigir resultados imposibles.


Nicolás Wolovick, es doctor en Ciencias de la Computación y trabaja con científicos de datos. Es director del Centro de Computación de Alto Desempeño (CCAD-UNC) que forma parte del Nodo AI Córdoba junto a la Famaf, el Córdoba Technology Cluster y el Ministerio de Ciencia y Tecnología provincial.

Promueve la ciencia de datos y el aprendizaje automático. Su trabajo es brindar cómputo y almacenamiento a quienes necesitan, tanto en el sistema científico tecnológico de la UNC como así también provincial y nacional, además, trata de hacer negocios con empresas que necesiten de esta tecnologías y los apoya para que lo empiecen utilizar. 

1. La ley de Moore, esa ley de mercado que dice que cada 18 meses o dos años se duplica la cantidad de transistores que se pueden poner en un chip, hace que se empuje todo de manera exponencial para adelante, en particular la cantidad de datos que se puedan producir y las simulaciones que se puedan adquirir vía todos los sensores que uno se imagine (cámaras, micrófonos, teclados, mouse, etcétera) y también la cantidad de almacenamiento. Eso hace que la cantidad de datos aumente exponencialmente y ya se necesite una especialidad que trabaje con el foco en datos. Hay que pensar que en 1980 la cantidad de datos que podía generar por ejemplo la Municipalidad de Córdoba era muy baja, era saber la gente que pagaba sus impuestos municipales y no mucho más. Ahora sabe un montón de cosas sobre los contribuyentes, los ciudadanos, porque sabe dónde están los colectivos, quienes se suben a cada colectivo y a qué hora, sabe de esas personas cómo interactúan con la web, almacenan las vacunas que tienen puestas, todo eso es la tarea y el área de un científico o científica de datos. 

2. Esta profesión es muy importante y va a ser una línea transversal a un montón de profesiones. Se necesita ser científico de datos si uno es bióloga/o, geólogo/a si trabaja en pozos petrolíferos, también para hacer medicina generalista porque hay que hacer muchas estadísticas e inferencias a partir de las cosas que se ven. En general, se necesita elevar el nivel de conocimiento de esta área de la ciencia a todas las otras ciencias. Así como la programación, la ciencia de datos va a cruzar a todas las ciencias, en el presente ya lo es y en el futuro aún más. 

3. Sobre los cambios que puede producir la incorporación de un científico de datos en una empresa u organización que nunca tuvo uno, puedo decir que es saber cuál es la estrategia de acopio, uso y limpieza de datos. Además, entender cuáles son las implicancias respecto a la privacidad y a la protección de los datos. Saber bajo qué leyes están siendo mirados porque hoy los datos son realmente valiosos y están regulados legalmente.

Jorge Sánchez es doctor en Ciencias de la Ingeniería, lidera un equipo de investigación en Mercado Libre, dentro del Área de Aprendizaje Automático o machine learning.

1. Lo que hace un data scientist es tratar de darles sentido a datos, a información cruda, de manera que pueda ser utilizada con algún fin. A veces estamos metidos en un universo de información que es tanta y tan diversa que para poder sacar medidas accionables necesitamos procesar esa información. El rol de los data scientist es justamente ese, darle sentido a información que puede estar no estructurada. 

2. Es una profesión cada vez más demandada y esto no creo que cambie en el mediano plazo. Hay cada vez más ofertas de formación tanto terciaria como superior, de grado y posgrado, que tratan de cubrir la gran demanda que hay hoy en día. Tanto en Argentina como en la región y en el mundo se trata de recursos que son muy valorados porque no hay muchos recursos con esta formación. 


3. Si la empresa nunca tuvo un data scientist o una persona trabajando con datos, incorporar uno habla de una intención de cambio en la forma de abordar ciertos problemas y procesos, lo cual siempre es positivo ir adaptándose e innovando en este sentido. Lo que un científico de datos le va a dar a una empresa es la capacidad de analizar algunas dimensiones que quizás no son tan evidentes con métodos tradicionales. 

La capacidad de resumir datos, condensar o asimilar tendencias que son difíciles de ver en flujos de información tradicionales, hace que quizás surjan nuevas posibilidades dentro de la empresa que no se habían tenido en cuenta simplemente porque la información que refleja no era visible. Creo que esa es una de las principales cosas que puede dar al comienzo un data scientist dentro de una empresa. 


LAS TRES COSAS QUE MÁS ME GUSTAN DE LA PROFESIÓN

“Lo que más me gusta de mi profesión, que es ejercer la promoción del uso de tecnologías de computación de alto desempeño, es ver cómo a la gente le cambia la vida el poder de cómputo y la capacidad de almacenamiento”, afirma Nicolás Wolovick, director del Centro de Computación de Alto Desempeño (CCAD-UNC).

Jorge Sánchez, líder de investigación en Mercado Libre, disfruta “estar expuesto y trabajando sobre temas que están en la cresta de la ola, ser testigo y actor en algún sentido, de cambios tecnológicos que uno los puede ver día a día prácticamente”. Además, destaca los grupos de trabajo y el nivel de curiosidad de los integrantes, algo que se logra en equipos que trabajan en machine learning, data science. También apuntó a las perspectivas de crecimiento y el hecho de estar formando futuro en algún sentido.

Para Milagro Teruel lo que más le gusta son los problemas nuevos, advierte que las técnicas que se usan cambian a un ritmo tan vertiginoso que nunca deja de aprender y fascinarse con cada nueva teoría o herramienta.
Lo otro que destaca es la programación: “Es una actividad muy gratificante cuando uno encuentra una solución simple y elegante a un problema complejo. Es como resolver un misterio. Diría que hasta tiene un componente estético cuando uno ve un sistema bien diseñado y eficiente”.

Finalmente, enfatiza la estabilidad económica y buena remuneración que brindan los trabajos relacionados con la programación, lo que permite también disfrutar de otros aspectos de la vida con más tranquilidad.

En tanto, Johanna Frau, data scientist en Mercado Libre, estar en aprendizaje constante es una de las cosas que le apasiona. “Todo el tiempo hay conceptos nuevos relacionados con machine learning que surgen a partir de distintas publicaciones de investigación o librerías de programación nuevas (o ya existentes pero con versiones mejoradas) que optimizan nuestro trabajo diario en cuanto a tiempo de implementación”. Luego destaca que es una profesión multidisciplinaria y diversa que le permite enriquecerse con otras miradas y el desafío de resolver problemas distintos con su cuota creativa e innovadora. 

.

FIGURITAS DIFÍCILES


El puesto de científico/a de datos (data scientists) es uno de los “perfiles más buscados”, en el mercado laboral, según datos recientes de la Cámara de la Industria Argentina del Software (Cessi).

Ese organismo reportó que quedan “15 mil puestos sin cubrir” en el país, de los cuales “5.000 a 10.000 corresponden a compañías del sector IT”.

Entre los perfiles más buscados se destacan científicos/as de datos, programadores para automatización de testing, diseñadores de aplicaciones mobile y especialistas en machine learning y en robotización en general. 

Hay muchas empresas en el mundo que explotan grandes cantidades de datos, desde Amazon, Google y Facebook hasta locales, grandes y pymes e incluso start-ups, que cuentan o comenzaron a formar equipos con estos perfiles. 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Leé también

Más populares

¡Bienvenid@ de nuevo!

Iniciá sesión con tu usuario

Recuperar contraseña

Ingresá tu usuario o email para restablecer tu contraseña.

Are you sure want to unlock this post?
Unlock left : 0
Are you sure want to cancel subscription?