You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Bastien CarnielBC

Bastien Carniel

NLP | GPT | Machine Learning

800 €/Tag
21 Projekte
Paris, FR
8-15 Jahre

Durchschnittliche Reaktionszeit: 12h

Über Bastien

Data scientist spécialisé dans le déploiement de systèmes IA en production, notamment autour des LLM appliqués à des processus métiers concrets (automatisation, extraction d’information, assistants internes, structuration de données).

Formation école de commerce à l’origine, mais avec plusieurs années à des postes très techniques : recherche à grande échelle sur l’analyse de réseaux sociaux, lead technique d’équipes data/IA, et mise en production de modèles NLP et ML.

Je travaille aujourd’hui beaucoup sur les architectures LLM modernes : RAG, orchestration d’appels modèles, embeddings, vector databases, pipelines Python, APIs, déploiement cloud et monitoring. Stack typique : Python, OpenAI / Mistral / open-source LLMs, LangChain / LlamaIndex, Postgres / vector DB, FastAPI, Docker.

Cela dit, dans la plupart des projets que je vois, la difficulté est maintenant rarement technique, les briques existant déjà. La valeur vient plutôt de :
  • choisir le bon outil pour le bon problème (LLM et qualité du prompt, modèle spécialisé, règles, ou combinaison)
  • construire des systèmes coût-efficaces en production
  • la gestion de l'intégration avec les processus existants (ce qui peut vouloir dire de les remplacer)
  • la maintenabilité du système et donc la possibilité d'itérer
  • l'évaluation de la performance: le LLM aura quasi-toujours une réponse plausible, ce qui ne veut pas dire qu'elle est bonne !
Lorsque possible, je privilégie les solutions européennes (Airtable -> Baserow, OpenAI -> Mistral, AWS -> OVHCloud, etc)
  • Englisch

    Muttersprachlich oder zweisprachig

  • Russisch

    Verhandlungssicher

Vor Ort möglich
Paris (bis zu 50 km), Avignon (bis zu 50 km)

Projekt- und Berufserfahrung

  • SIGNIA THERAPEUTICS
    NER Biomédical
    BIOTECHNOLOGIE
    November 2021 - Dezember 2021 (2 Monate)
    - Module de constitution de corpus biomédicaux utilisant les API Pubmed, ClinicalTrials et EPO.

    - Module de constitution de bases de données canoniques (UMLS, Gene Ontology).

    - Module de reconnaissance d'entités nommées (Scispacy, Scibert, FAISS)
    NLP Python Docker moteur de recherche
  • Sanofi Pasteur
    Modèle de prédiction du risque d'apparition d'une pathologie
    PHARMAZEUTISCHE INDUSTRIE
    Juli 2021 - Januar 2022 (6 Monate)
    Télétravail
    Pipeline d'automatisation d'extraction de données issues de pdf (librairies Tabula, Pandas)

    Développement d'un modèle de prédiction du risque d'apparition d'une pathologie dans différentes régions (librairies Scikit-Learn, Tensorflow, Statsmodels, Catboost, GPBoost, MERF)

    Déploiement d'un outil d'interaction cartographique avec le modèle (librairies Streamlit, Folium. Hébergement sur AWS)


    Streamlit Scikit-learn TensorFlow AWS
  • Science Feedback
    Moteur de recherche sémantique spécifique à un corpus biomédical
    PRESSE & MEDIEN
    März 2021 - August 2021 (5 Monate)
    Paris, Frankreich
    Développement d'un moteur de recherche sur mesure (y compris interface) visant à identifier, sur la base de mots-clés techniques, les chercheurs les plus pertinents :

    - A partir de la donnée issue de la base d'articles de recherche Pubmed, nettoyage et constitution d'une base de données d'articles scientifiques (2.3 millions d'articles, 20 millions de mots-clés, 30 millions d'auteurs).

    - Embedding des mots-clés scientifiques à l'aide d'un modèle BioBert (HuggingFace Transformers)

    - Déploiement d'une base de données ElasticSearch optimisée pour la recherche de similarité vectorielle entre requête utilisateur et mots clés de la base de données (temps de réponse < 0.4 seconde)

    - Déploiement d'une base de données DynamoDB pour le stockage des données non-vectorielles (métadonnées de l'article, abstract, affiliations des auteurs...)

    - Développement d'une interface utilisateur avec Streamlit

    Hébergé sur AWS, déployé dans des containers Docker communiquant entre eux via FastAPI.
    Elasticsearch NLP API Streamlit Docker Amazon DynamoDB

Bewertungen

4,9

Von 17 Bewertungen

F

Florence

SANOFI PASTEUR

Bewertet am 23.2.2024

Merci encore à Bastien qui comprend tout à fait le contexte scientifique, s'adapte aux problèmes de qualité des données sources et aux besoins du client, et livre dans les temps.
F

Florence

Sanofi Pasteur

Bewertet am 28.9.2022

Bastien is able to understand complex scientific contexts, make user-friendly proposals and deliver under very tight timelines.

Empfehlungen

Sei die erste Person, die Bastien empfiehlt

Teile Deine Erfahrung aus der Zusammenarbeit mit diesem Freelancer.

Diese Freelancer passen auch zu Ihren Kriterien

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Ausbildung und Abschlüsse

  • Master
    HEC Paris
    2015
    Double diplôme avec l'université de Saint-Pétersbourg en Russie.

Zertifizierungen

Fähigkeiten

Kategorien