Role Overview

Mantener comunicación con los stakeholders para comprender el negocio y los puntos de dolor planteados por el cliente.
Definir los datos necesarios para abordar el problema y diseñar una solución que aporte valor al negocio.
Procesar los datos de la forma más eficiente (utilizando herramientas de AWS como S3, Athena, Jupyter Notebooks para comprender y procesar datos).
Desarrollar análisis exploratorios (EDA) que permitan validar los datos con el cliente y generar insights y resultados a través de recursos de data storytelling.
Identificar el tipo de problema (clasificación, regresión, series temporales, etc.) y seleccionar el mejor enfoque de solución para generar valor en el menor tiempo posible.
Implementar el procesamiento de datos y feature engineering para preparar los datos antes del entrenamiento y testeo del modelo.
Evaluar la calidad de los datos mediante controles de calidad.
Diseñar, construir, ajustar y testear algoritmos, y desplegar los modelos.
Desarrollar una estrategia para validar los resultados del modelo en producción.

Requirements

Título en Ciencias de la Computación, Ingeniería en Sistemas, Estadística, Matemática u otras áreas cuantitativas.
Maestría o PhD en estas áreas es un plus.
Experiencia con herramientas de Data Science como Python, Jupyter Notebooks, Spark o R.
Conocimiento del paradigma de Programación Orientada a Objetos (OOP).
Experiencia con librerías de Python como Pandas, Numpy, Scikit-learn, Keras, XGBoost y LightGBM (conocimiento de Keras, PyTorch o TensorFlow es un plus).
Experiencia con herramientas de visualización de datos como Matplotlib, Plotly, Seaborn o GGPlot.
Experiencia con infraestructura cloud en AWS (S3, SageMaker, Athena, Lambdas, etc.).
Conocimiento del framework Scrum para gestión de proyectos.
Manejo de herramientas de gestión de tareas como Trello o Jira.
Experiencia en versionado de código con herramientas como Git o Bitbucket.
Conocimientos de virtualización (Docker).
Experiencia +1 año trabajando en proyectos reales.
+1 año realizando tareas de proyectos y seguimiento de bugs en plataformas como JIRA o Trello.
+2 años realizando análisis sobre datos reales en: Analítica descriptiva, Analítica diagnóstica, Analítica prescriptiva.
+2 años realizando este tipo de tareas sobre fuentes de datos reales.
+2 años generando visualizaciones básicas sobre datos reales: Descripción de distribuciones (boxplot, histogramas, gráficos de torta), Correlación con variable objetivo (scatter plots, matriz de correlación), Series temporales, Importancia de variables, Correcto reporting en lenguaje de negocio.
Experiencia en Feature Extraction en proyectos reales sobre: Datos tabulares, Series temporales, Texto.
Experiencia con algoritmos basados en árboles (Random Forest, Gradient Boosting Machines).
Al menos un proyecto real desarrollado en: Aprendizaje supervisado, Aprendizaje no supervisado.
+1 año comunicando resultados de análisis.
Al menos un proyecto real con implementación de testing A/B.

Tech Stack

AWS
Cloud
Docker
Keras
Numpy
Pandas
Python
PyTorch
Scikit-Learn
Spark
Tensorflow

Senior Data Scientist

Key skills

About this role

Role Overview

Requirements

Tech Stack

Benefits