Python · OpenAI API · AWS Bedrock · Docker · Streamlit · Kubernetes · Neo4J · Pandas · Apache Airflow · PostgreSQL · Flask
Durante este periodo trabajé en dos proyectos: During this period I worked on two projects:
Mejorar la herramienta interna para transformación de datos. Improving the internal data transformation tool.
Una herramienta que permite a un usuario técnico insertar en el grafo de conocimiento nuevos registros, partiendo de diversos formatos como son: csv, json, xlsx, txt, etc. A tool that allows a technical user to insert new records into the knowledge graph from various formats: csv, json, xlsx, txt, etc.
La herramienta te permite traducir el modelo de datos del formato de origen al modelo de datos del formato de destino. The tool lets you translate the data model from the source format to the destination format.
El lenguaje de programación principal que utilicé en este proyecto fue Python, la librería principal fue Streamlit. The main programming language I used in this project was Python; the main library was Streamlit.
Trabajar mano a mano con una farmacéutica para realizar consultas a nuestra base de datos. Working hand in hand with a pharmaceutical company to query our database.
Último mayor hito fue trabajar mano a mano con una farmacéutica para realizar consultas a nuestra base de datos unificada de 3 Millones de pacientes. The biggest milestone was working directly with a pharmaceutical company to query our unified database of 3 million patients.
Utilizando Neo4J como base de datos de grafos y Python como lenguaje de transformación de datos, logramos dar respuesta a sus preguntas, consultas que nunca se habían realizado a esta escala. Using Neo4J as the graph database and Python for data transformation, we answered their questions — queries that had never been performed at this scale before.
Quizá lo más impresionante es la capacidad para entender el impacto que un medicamento tiene en distintas poblaciones de pacientes. Este fue nuestro gran hito como empresa y equipo. Perhaps the most impressive aspect was the ability to understand the impact a drug has on different patient populations. This was our biggest milestone as a company and team.
Personalmente fui el que desarrolló la transformación de datos desde los formatos originales en bases de datos SQL, con distintos modelos de datos hasta generar los informes finales entregados al cliente. Personally, I developed the data transformation pipeline from the original SQL database formats — across different data models — through to the final reports delivered to the client.
También utilicé modelos del lenguaje (LLM) para extraer diagnósticos médicos y condiciones médicas relacionadas con la infertilidad de ficheros de texto libre (txt), para obtener mayor resolución en la población con la que estábamos trabajando. I also used large language models (LLMs) to extract medical diagnoses and infertility-related conditions from free-text files (txt), to get higher resolution on the patient population we were working with.
Nuestro trabajo culminó con una publicación en una revista científica americana y los resultados están clasificados. Our work culminated in a publication in an American scientific journal; the results are classified.
PostgreSQL · MSSQL · SQL Server · Neo4J · Python · VIM · Bash · Docker · Milvus DB · Kubernetes
Python · data analysis libraries
AI-assisted clinical note-taking tool for healthcare professionals.
Herramienta de toma de notas clínicas asistida por IA para profesionales sanitarios.
Co-author of a peer-reviewed poster published in Value in Health Vol. 29 S6 (code HSD44). Led the analysis of 198,782 IVF/ICSI cycles from 42 US clinics (2010–2024), in collaboration with Ferring Pharmaceuticals & Cercle AI.
Co-autor de un póster científico publicado en Value in Health Vol. 29 S6 (código HSD44). Lideré el análisis de 198.782 ciclos FIV/ICSI de 42 clínicas estadounidenses (2010–2024), en colaboración con Ferring Pharmaceuticals y Cercle AI.