Über Michael
- Inference Optimization: vLLM, llama.cpp, TensorRT-LLM, Quantisierung (GGUF, AWQ, GPTQ, int8), Speculative Decoding (EAGLE), Model Pruning.
- Frameworks & Tools: PyTorch, Hugging Face (Transformers, PEFT, TRL), LangChain, LangGraph, LlamaIndex.
- Agentic AI: Entwicklung autonomer Agenten, Function Calling, MCP, Multi-Agent Systems.
- RAG: Aufbau von Retrieval-Augmented Generation Pipelines, Vektordatenbanken (Pinecone, ChromaDB), Embeddings.
- Core: C/C++, Embedded Linux (Yocto/Buildroot), RTOS.
- Robotics: Inverse Kinematik, Sensorfusion (IMU), Regelungstechnik, ROS/ROS2, dlib.
- Kommunikation: CAN-Bus (J1939, CANopen), SPI, I2C, MQTT, TCP/IP.
- Sprachen: Python & C (Expert), C++, TypeScript/JavaScript.
- Infrastructure: Docker, Kubernetes (K8s), AWS (EC2, S3, Lambda), NVIDIA GPU Container.
- CI/CD: GitLab CI, GitHub Actions, CMake, Make.
- Web/Backend: FastAPI, Flask, Next.js, Supabase, PostgreSQL, GraphQL.
- Anforderungsanalyse, Mentoring.
- Sprachen: Deutsch (Muttersprache), Englisch (Verhandlungssicher).
Deutsch
Muttersprachlich oder zweisprachig
Englisch
Verhandlungssicher
Projekt- und Berufserfahrung
- Internal R&DLLM Inferenz-Optimierung & Fine-TuningDezember 2025 - Januar 2026 (1 Monat)- Ziel: Evaluation und Implementierung von SOTA-Techniken zur Beschleunigung der LLM-Inferenz auf hardwarebeschränkten Systemen.- Performance: Anwendung von int8-Quantisierung (via `llmcompressor`) auf Qwen-Modelle. Steigerung des Durchsatzes um 50% (>5000 Tokens/s) bei gleichbleibender Genauigkeit (GSM8K).- Advanced AI: Untersuchung von Speculative Decoding (Training eines EAGLE-Draft-Modells) sowie Durchführung von Fine-Tuning (SFT & LoRA).- Tech Stack: Python, vLLM, Hugging Face (PEFT, TRL), Kubernetes, Docker, NVIDIA Dynamo
- Proof of Concept (PoC)Deployment eines lokalen LLMs (Edge AI)Dezember 2025 - Januar 2026 (1 Monat)- Aufgabe: Ersetzen einer Cloud-Lösung durch ein lokales LLM (Privacy & Latenz).- Lösung: Custom Build von `llama.cpp` mit CPU-spezifischen Optimierungen. Benchmarking von GGUF-Quantisierungen.- Integration: Anbindung an Open WebUI via API als Drop-In Replacement.- Tech Stack: Linux, Docker, CMake, Open WebUI, Python, llama.cpp
- Proof of Concept (PoC)Automatisierung KundenbestellungenDezember 2025 - Januar 2026 (1 Monat)- Aufgabe: Abbildung und Automatisierung eines Bestellprozesses.- Lösung: Modellierung in BPMN (Camunda) und Automatisierung mithilfe mehrerer Python-Worker (Bestandsprüfung, Rechnung, Auslieferung).- Tech Stack: Linux, Camunda 7, Python, PostgreSQL, Docker
Empfehlungen
Sei die erste Person, die Michael empfiehlt
Teile Deine Erfahrung aus der Zusammenarbeit mit diesem Freelancer.
Diese Freelancer passen auch zu Ihren Kriterien
Agatha Frydrych
Backend Java Software Engineer
4.7
(3)
2
Baptiste Duhen
Fullstack developer
4.6
(4)
5
Amed Hamou
Senior Lead Developer
4
(2)
7
Audrey Champion
Web developer
4.3
(3)
4
Ausbildung und Abschlüsse
- M.Sc. Robotics, Cognition, IntelligenceTechnische Universität München2018Vereint interdisziplinäre Kenntnisse aus den Bereichen Robotik, künstliche Intelligenz, Maschinelles Lernen und Kognitive Systeme. Ziel ist es, intelligente, autonome Systeme zu verstehen und zu entwickeln.