Beschreibung

90% des PoC IA meurent avant la prod.

Causes : architecture usine à gaz, coûts d'inférence (OpenAI/Gemini) explosifs, latence et zéro monitoring.

Ingénieur IA & Backend, je ne crée pas de prototypes jetables. Je reconstruis des pipelines LLM lents, coûteux ou instables pour les faire scaler en production.

J'accompagne les Startups & Scale-ups qui bloquent sur l'exécution technique et l'infra de leurs projets AI.

► MON APPROCHE :

La simplification. Je supprime les couches inutiles (ex: remplacer un RAG complexe + Redis par un pipeline asynchrone Kafka + Prompt Engineering solide). J'implémente un routing intelligent pour diviser vos coûts par 3 et un vrai LLMOps pour une observabilité totale.

► CE QUE JE METS EN PLACE (Stack & Expertise) :

Backend & Infra : Python, FastAPI, Pydantic v2, asyncio, Kafka, S3, PostgreSQL, Redis.
Ingénierie LLM : LangGraph, Function Calling, Schema-first JSON, Prompt Engineering, Routing multi-modèles (Gemini 2.5, OpenAI).
LLMOps & Monitoring : Tracking tokens/coûts, Rate-limiting, DLQ, Prometheus, Grafana.
Déploiement : Docker, Kubernetes (K8s), AWS (EKS, Bedrock), vLLM, RunPod, CI/CD.

► RÉSULTATS CONCRETS :

Pipeline d'extraction (Scale-up SOLV) : Remplacement d'un système instable par une archi Kafka minimaliste. 50k+ docs traités, 99.2% de succès, coûts d'API ÷3.
Clustering à contraintes IA : Conception d'un algo hybride scalable là où DBSCAN/K-Means échouaient sémantiquement.
Automatisation (Venio AI) : Plateforme d'agents livrée en prod via spec OpenAPI.

💡 "Exécution de niveau senior dès le premier jour — livraisons transverses sur le backend, le DevOps et l’ensemble du stack IA." — Luca F. (CTO, Venio AI)

► MODALITÉS :

• Full remote (Fuseau EU) | Missions 3-6 mois | Dispo immédiate.

On regarde sous le capot de votre infra LLM ? Contactez-moi.

Branchenexpertise

Sprachen

Französisch
Muttersprachlich oder zweisprachig
Englisch
Verhandlungssicher
Spanisch
Verhandlungssicher

Arbeitsortpräferenzen

Vor Ort möglich

Paris (bis zu 50 km)

SOLV
Production LLM Engineer
Oktober 2025 - Heute (8 Monate)
Bruxelles, Belgien
Scale-up belge de stakeholder analytics & risk management pour projets d'infrastructure complexes.

Pipeline d'extraction documentaire LLM :
Reconstruction complète d'un pipeline d'extraction instable (Redis + embeddings + RAG + modèles premium, crash à 10+ docs) par un système Kafka async minimaliste en Python/FastAPI.
→ 50 000+ documents traités, 99.2% succès, coût divisé par 3

Algorithme de clustering à contraintes :
Conception et implémentation d'un algorithme hybride : extraction de features par LLM (orientation, entités, nature) injectées comme pénalités dans la matrice de distance avant clustering hiérarchique. A résolu les limites de deux tentatives précédentes (DBSCAN, HDBSCAN+K-Means).

Routing multi-modèles & LLMOps :
Routing intelligent Gemini Flash ↔ Gemini 2.5 Pro (fallback OpenAI), sélection selon complexité/coût. Dashboards Prometheus/Grafana en production (p95 latence, coûts, densité d'extraction), rate-limiting, retries exp-backoff, DLQ.
LLM Python LLMOps RAG Langchain
Venio AI
AI Engineer
Februar 2025 - September 2025 (7 Monate)
Reggio d'Émilie, Italien
Startup d'automatisation par agents IA pour entreprises non-tech.

Plateforme d'agents conversationnels :
Construction en Python/FastAPI d'une plateforme d'agents LLM : le système comprend le besoin utilisateur en langage naturel, génère un agent adapté et expose un endpoint API prêt à l'emploi. Génération automatique d'outils agents depuis specs OpenAPI.

Benchmarking & déploiement :
Suite de benchmarking (accuracy, coût, latence) pour comparer modèles LLM et prompts avant mise en production. Déploiements automatisés Docker/Kubernetes via GitLab CI/CD.
FastAPI Docker Python LLM Agent IA
ONECLICKHIRED
Fondateur
Januar 2025 - September 2025 (8 Monate)
SaaS IA : parsing de CV + outreach personnalisé automatisé. Stack complète construite en solo : React/TS, Fastify, PostgreSQL, Redis/BullMQ, Stripe.

Intégration LLM multi-providers (Gemini + OpenAI), jobs asynchrones fiables. 150 inscriptions.
LLM PostgreSQL intelligence artificielle

Gesamte Berufserfahrung von Julien ansehen

Sei die erste Person, die Julien empfiehlt

Teile Deine Erfahrung aus der Zusammenarbeit mit diesem Freelancer.

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

Baptiste Duhen

Fullstack developer

4.6

(4)

Amed Hamou

Senior Lead Developer

(2)

Audrey Champion

Web developer

4.3

(3)

Anmelden, um Profile zu sehen

Ingénieur, IA
EPITA
2025
Ingénieur, IA
MP
CPGE N.D. de Sion
2022
MP

Julien Cardi

Freelance IA | Expert LLM & RAG | Python · FastAPI

Über Julien

Projekt- und Berufserfahrung

Empfehlungen

Diese Freelancer passen auch zu Ihren Kriterien

Ausbildung und Abschlüsse

Fähigkeiten

Kategorien