You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Michael WagnerMW

Michael Wagner

Edge AI Engineer | Generative AI & Embedded System

960 €/Tag
München, DE
3-7 Jahre

Durchschnittliche Reaktionszeit: 1h

Über Michael

Edge AI Engineer | Generative AI & Embedded Systems

Spezialist für Edge AI & High-Performance Inferenz. Ich verbinde 6 Jahre Embedded-Erfahrung (C, Robotik) mit tiefem Know-how in Generative AI (LLM-Optimierung, Agents). Ich sorge dafür, dass moderne KI-Modelle auch außerhalb der Cloud performant und zuverlässig laufen.

Schwerpunkte: Generative AI (LLMs, Agents), Edge AI / On-Device Inference, Embedded Software Engineering, Robotics & Sensor Fusion.


Generative AI & LLM Engineering:
  • Inference Optimization: vLLM, llama.cpp, TensorRT-LLM, Quantisierung (GGUF, AWQ, GPTQ, int8), Speculative Decoding (EAGLE), Model Pruning.
  • Frameworks & Tools: PyTorch, Hugging Face (Transformers, PEFT, TRL), LangChain, LangGraph, LlamaIndex.
  • Agentic AI: Entwicklung autonomer Agenten, Function Calling, MCP, Multi-Agent Systems.
  • RAG: Aufbau von Retrieval-Augmented Generation Pipelines, Vektordatenbanken (Pinecone, ChromaDB), Embeddings.


Embedded Systems & C/C++:
  • Core: C/C++, Embedded Linux (Yocto/Buildroot), RTOS.
  • Robotics: Inverse Kinematik, Sensorfusion (IMU), Regelungstechnik, ROS/ROS2, dlib.
  • Kommunikation: CAN-Bus (J1939, CANopen), SPI, I2C, MQTT, TCP/IP.


Software Architecture & DevOps:
  • Sprachen: Python & C (Expert), C++, TypeScript/JavaScript.
  • Infrastructure: Docker, Kubernetes (K8s), AWS (EC2, S3, Lambda), NVIDIA GPU Container.
  • CI/CD: GitLab CI, GitHub Actions, CMake, Make.
  • Web/Backend: FastAPI, Flask, Next.js, Supabase, PostgreSQL, GraphQL.


Methoden & Soft Skills:
  • Anforderungsanalyse, Mentoring.
  • Sprachen: Deutsch (Muttersprache), Englisch (Verhandlungssicher).
  • Deutsch

    Muttersprachlich oder zweisprachig

  • Englisch

    Verhandlungssicher

Vor Ort möglich
München (bis zu 50 km)

Projekt- und Berufserfahrung

  • Internal R&D
    LLM Inferenz-Optimierung & Fine-Tuning
    Dezember 2025 - Januar 2026 (1 Monat)
    - Ziel: Evaluation und Implementierung von SOTA-Techniken zur Beschleunigung der LLM-Inferenz auf hardwarebeschränkten Systemen.
    - Performance: Anwendung von int8-Quantisierung (via `llmcompressor`) auf Qwen-Modelle. Steigerung des Durchsatzes um 50% (>5000 Tokens/s) bei gleichbleibender Genauigkeit (GSM8K).
    - Advanced AI: Untersuchung von Speculative Decoding (Training eines EAGLE-Draft-Modells) sowie Durchführung von Fine-Tuning (SFT & LoRA).
    - Tech Stack: Python, vLLM, Hugging Face (PEFT, TRL), Kubernetes, Docker, NVIDIA Dynamo
    Python vllm Hugging Face Kubernetes NVIDIA Dynamo
  • Proof of Concept (PoC)
    Deployment eines lokalen LLMs (Edge AI)
    Dezember 2025 - Januar 2026 (1 Monat)
    - Aufgabe: Ersetzen einer Cloud-Lösung durch ein lokales LLM (Privacy & Latenz).
    - Lösung: Custom Build von `llama.cpp` mit CPU-spezifischen Optimierungen. Benchmarking von GGUF-Quantisierungen.
    - Integration: Anbindung an Open WebUI via API als Drop-In Replacement.
    - Tech Stack: Linux, Docker, CMake, Open WebUI, Python, llama.cpp
    Python llama.cpp Docker Quantization GGUF
  • Proof of Concept (PoC)
    Automatisierung Kundenbestellungen
    Dezember 2025 - Januar 2026 (1 Monat)
    - Aufgabe: Abbildung und Automatisierung eines Bestellprozesses.
    - Lösung: Modellierung in BPMN (Camunda) und Automatisierung mithilfe mehrerer Python-Worker (Bestandsprüfung, Rechnung, Auslieferung).
    - Tech Stack: Linux, Camunda 7, Python, PostgreSQL, Docker
    Python Camunda Docker PostgreSQL

Empfehlungen

Sei die erste Person, die Michael empfiehlt

Teile Deine Erfahrung aus der Zusammenarbeit mit diesem Freelancer.

Diese Freelancer passen auch zu Ihren Kriterien

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Ausbildung und Abschlüsse

  • M.Sc. Robotics, Cognition, Intelligence
    Technische Universität München
    2018
    Vereint interdisziplinäre Kenntnisse aus den Bereichen Robotik, künstliche Intelligenz, Maschinelles Lernen und Kognitive Systeme. Ziel ist es, intelligente, autonome Systeme zu verstehen und zu entwickeln.

Fähigkeiten

Kategorien