You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Stefan LangSL

Stefan Lang

Senior Data Scientist / Bioinformatician

960 €/Tag
Jena, DE
8-15 Jahre

Durchschnittliche Reaktionszeit: 1h

Über Stefan

Homepage: slang-it.de

Ich habe bereits Kunden aus verschiedenen Industrien bei der Umsetzung ihrer Projekte unterstützt. So konnte ich Erfahrung in vielen Bereichen der Forschung und Entwicklung sammeln.

Ob Softwareentwicklung, Training künstlicher Intelligenzen, Datenanalyse, mathematische Modellierung oder Laborarbeit, es gibt kaum einen Bereich des maschinellen Lernens und der Bioinformatik in dem ich noch nicht tätig war.

Ich verfüge über fundierte Kenntnisse des gesamten Software-Lebenszyklus, von der Entwicklung eines Prototyps, über Validierung der Methoden, bis zur Überführung in die Produktion.

Gerne bringe ich meine Ideen und meine langjährige Erfahrung in der Entwickung intelligenter Software auch in Ihr nächstes Projekt ein.
  • Deutsch

    Muttersprachlich oder zweisprachig

  • Englisch

    Verhandlungssicher

Nur remote
Führt Projekte hauptsächlich remote aus

Projekt- und Berufserfahrung

  • -
    Natürliche Sprachverarbeitung (NLP), Knowledge Graphs, Graph-RAG
    Oktober 2024 - Juli 2025 (9 Monate)
    Resultate:
    Entwicklung eines Programms zur automatisierten Extraktion von Informationen
    aus Text-Dokumenten (z.B. Websites, PDF-Dokumente, ...), Aggregation der
    Informationen in einer Graph-Datenbank (Knowledge-Graph) und Abfrage der Informationen mittels eines generativen Sprachmodells (Graph-RAG). Das Programm kann eigenständig durch Abfrage der Wissensdatenbank entscheiden welche Informationen aus den Dokumenten unbekannt sind und diese der Wissensdatenbank hinzufügen. Dabei können alle Informationen gesammelt werden oder der Nutzer kann die Themenbereiche einschränken.

    Methoden:
    • Extraktion: Named-Entity-Recognition und Extraktion von Relationen zwischen den Entitäten aus den Dokumenten durch wahlweise ein generatives Sprachmodell oder (effizientere) NER-Modelle (wenn die Themenbereiche vorgegeben sind).
    • Knowledge-Graph-Erstellung: Gesammelte Informationen aus den Dokumenten werden mit der aktuellen Wissensdatenbank verglichen und, wenn noch nicht bekannt, der Datenbank hinzugefügt (entweder als neue Knoten / Kanten oder als Zusatzinformation zu bestehenden Knoten / Kanten). Ist die Information bereits aus anderen Dokumenten bekannt erhöht dies die Zuverlässigkeit der Information.
    • Graph-RAG: Abfrage von Informationen aus der Datenbank ist durch natürliche Sprache mittels eines generativen Sprachmodells möglich, welches die natürliche Sprache in eine Datenbank-Abfrage überführen kann und aus den gesammelten Informationen eine Antwort generiert.


    Langchain LangGraph GraphRAG Knowledge graph Natural Language Processing (NLP)
  • _
    Natürliche Sprachverarbeitung (NLP), große Sprachmodelle (LLMs), Chat-Bots.
    SOFTWARE-HERSTELLER
    April 2024 - Juli 2024 (3 Monate)
    Resultate:

    Entwicklung eines Llama-3 Chat-Bots, welcher verschiedene Werkzeuge (Kunden-Datenbanken, Web-Suche, Chat, ...) benutzen kann um Nutzerfragen zu beantworten. Der Bot kann komplett auf kundeneigenen Servern gehostet werden, was auch die Verarbeitung sensibler Daten ermöglicht.

    Methoden

    • Daten-Pipeline: Pytorch-Lightning Modul um Text-Dokumente mittels eines (kleinen) Sprachmodells in einen Vektorraum zu überführen (Jina-V2 Text-Embeddings) und zusammen mit beliebigen (auch verschachtelten) Metadaten in einer Vektordatenbank zu speichern
    • Chat-Bot: LangGraph-Agent mit Llama-3 LLM um Nutzerfragen zu beantworten. Der Agent hat verschiedene Werkzeuge zur Verfügung um Informationen über die Frage aus den verknüpften Datenbanken und dem Internet zu sammeln oder Rückfragen an den Nutzer zu stellen, wenn die Frage unklar ist. Anhand der gesammelten Informationen erstellt der Agent dann eine Antwort (Retrieval-Augmented Generation, RAG)

    Pytorch Langchain NLP RAG Chatbot
  • _
    Computer Vision, Optical Character Recognition (OCR)
    SOFTWARE-HERSTELLER
    Februar 2024 - April 2024 (2 Monate)
    Resultate:


    Modul um Text in Bildern zu erkennen und mit einem kundenspezifischen Template zu vergleichen.

    Methoden

    • OCR: Identifikation von Text-Blöcken in Bildern & Erkennung des Textes
    • Matching: Lokale Ähnlichkeitsbestimmung des erkannten Textes mit einem kundenspezifischen Template unter Berücksichtigung möglicher OCR-Fehler

    Python Java OCR NLP Computer Vision

Empfehlungen

Sei die erste Person, die Stefan empfiehlt

Teile Deine Erfahrung aus der Zusammenarbeit mit diesem Freelancer.

Diese Freelancer passen auch zu Ihren Kriterien

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Ausbildung und Abschlüsse

  • M.Sc. Bioinformatik
    Friedrich-Schiller-Universität Jena
    2015

Fähigkeiten (48)

Kategorien