Über Bastien
- choisir le bon outil pour le bon problème (LLM et qualité du prompt, modèle spécialisé, règles, ou combinaison)
- construire des systèmes coût-efficaces en production
- la gestion de l'intégration avec les processus existants (ce qui peut vouloir dire de les remplacer)
- la maintenabilité du système et donc la possibilité d'itérer
- l'évaluation de la performance: le LLM aura quasi-toujours une réponse plausible, ce qui ne veut pas dire qu'elle est bonne !
Englisch
Muttersprachlich oder zweisprachig
Russisch
Verhandlungssicher
Projekt- und Berufserfahrung
- SIGNIA THERAPEUTICSNER BiomédicalBIOTECHNOLOGIENovember 2021 - Dezember 2021 (2 Monate)- Module de constitution de corpus biomédicaux utilisant les API Pubmed, ClinicalTrials et EPO.- Module de constitution de bases de données canoniques (UMLS, Gene Ontology).- Module de reconnaissance d'entités nommées (Scispacy, Scibert, FAISS)
- Sanofi PasteurModèle de prédiction du risque d'apparition d'une pathologiePHARMAZEUTISCHE INDUSTRIEJuli 2021 - Januar 2022 (6 Monate)TélétravailPipeline d'automatisation d'extraction de données issues de pdf (librairies Tabula, Pandas)Développement d'un modèle de prédiction du risque d'apparition d'une pathologie dans différentes régions (librairies Scikit-Learn, Tensorflow, Statsmodels, Catboost, GPBoost, MERF)Déploiement d'un outil d'interaction cartographique avec le modèle (librairies Streamlit, Folium. Hébergement sur AWS)
- Science FeedbackMoteur de recherche sémantique spécifique à un corpus biomédicalPRESSE & MEDIENMärz 2021 - August 2021 (5 Monate)Paris, FrankreichDéveloppement d'un moteur de recherche sur mesure (y compris interface) visant à identifier, sur la base de mots-clés techniques, les chercheurs les plus pertinents :- A partir de la donnée issue de la base d'articles de recherche Pubmed, nettoyage et constitution d'une base de données d'articles scientifiques (2.3 millions d'articles, 20 millions de mots-clés, 30 millions d'auteurs).- Embedding des mots-clés scientifiques à l'aide d'un modèle BioBert (HuggingFace Transformers)- Déploiement d'une base de données ElasticSearch optimisée pour la recherche de similarité vectorielle entre requête utilisateur et mots clés de la base de données (temps de réponse < 0.4 seconde)- Déploiement d'une base de données DynamoDB pour le stockage des données non-vectorielles (métadonnées de l'article, abstract, affiliations des auteurs...)- Développement d'une interface utilisateur avec StreamlitHébergé sur AWS, déployé dans des containers Docker communiquant entre eux via FastAPI.
Bewertungen
Empfehlungen
Sei die erste Person, die Bastien empfiehlt
Teile Deine Erfahrung aus der Zusammenarbeit mit diesem Freelancer.
Diese Freelancer passen auch zu Ihren Kriterien
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Ausbildung und Abschlüsse
- MasterHEC Paris2015Double diplôme avec l'université de Saint-Pétersbourg en Russie.
Zertifizierungen
- Computer Vision and Image AnalysisEdX2020
- Natural Language ProcessingDeeplearning.ai2020