You're seeing this page as if you were . The main menu is still yours, though. Exit from immersion
Julien CardiJC

Julien Cardi

Freelance IA | Expert LLM & RAG | Python · FastAPI

EUR 500/Tag
Paris, FR
3-7 Jahre

Durchschnittliche Reaktionszeit: 1h

Über Julien

90% des PoC IA meurent avant la prod.
Causes : architecture usine à gaz, coûts d'inférence (OpenAI/Gemini) explosifs, latence et zéro monitoring.


Ingénieur IA & Backend, je ne crée pas de prototypes jetables. Je reconstruis des pipelines LLM lents, coûteux ou instables pour les faire scaler en production.


J'accompagne les Startups & Scale-ups qui bloquent sur l'exécution technique et l'infra de leurs projets AI.


► MON APPROCHE :
La simplification. Je supprime les couches inutiles (ex: remplacer un RAG complexe + Redis par un pipeline asynchrone Kafka + Prompt Engineering solide). J'implémente un routing intelligent pour diviser vos coûts par 3 et un vrai LLMOps pour une observabilité totale.


► CE QUE JE METS EN PLACE (Stack & Expertise) :
  • Backend & Infra : Python, FastAPI, Pydantic v2, asyncio, Kafka, S3, PostgreSQL, Redis.
  • Ingénierie LLM : LangGraph, Function Calling, Schema-first JSON, Prompt Engineering, Routing multi-modèles (Gemini 2.5, OpenAI).
  • LLMOps & Monitoring : Tracking tokens/coûts, Rate-limiting, DLQ, Prometheus, Grafana.
  • Déploiement : Docker, Kubernetes (K8s), AWS (EKS, Bedrock), vLLM, RunPod, CI/CD.
► RÉSULTATS CONCRETS :
  • Pipeline d'extraction (Scale-up SOLV) : Remplacement d'un système instable par une archi Kafka minimaliste. 50k+ docs traités, 99.2% de succès, coûts d'API ÷3.
  • Clustering à contraintes IA : Conception d'un algo hybride scalable là où DBSCAN/K-Means échouaient sémantiquement.
  • Automatisation (Venio AI) : Plateforme d'agents livrée en prod via spec OpenAPI.

💡 "Exécution de niveau senior dès le premier jour — livraisons transverses sur le backend, le DevOps et l’ensemble du stack IA." — Luca F. (CTO, Venio AI)


► MODALITÉS :
• Full remote (Fuseau EU) | Missions 3-6 mois | Dispo immédiate.


On regarde sous le capot de votre infra LLM ? Contactez-moi.
  • Französisch

    Muttersprachlich oder zweisprachig

  • Englisch

    Verhandlungssicher

  • Spanisch

    Verhandlungssicher

Vor Ort möglich
Paris (bis zu 50 km)

Projekt- und Berufserfahrung

  • SOLV
    Production LLM Engineer
    Oktober 2025 - Heute (8 Monate)
    Bruxelles, Belgien
    Scale-up belge de stakeholder analytics & risk management pour projets d'infrastructure complexes.


    Pipeline d'extraction documentaire LLM :
    Reconstruction complète d'un pipeline d'extraction instable (Redis + embeddings + RAG + modèles premium, crash à 10+ docs) par un système Kafka async minimaliste en Python/FastAPI.
    → 50 000+ documents traités, 99.2% succès, coût divisé par 3


    Algorithme de clustering à contraintes :
    Conception et implémentation d'un algorithme hybride : extraction de features par LLM (orientation, entités, nature) injectées comme pénalités dans la matrice de distance avant clustering hiérarchique. A résolu les limites de deux tentatives précédentes (DBSCAN, HDBSCAN+K-Means).


    Routing multi-modèles & LLMOps :
    Routing intelligent Gemini Flash ↔ Gemini 2.5 Pro (fallback OpenAI), sélection selon complexité/coût. Dashboards Prometheus/Grafana en production (p95 latence, coûts, densité d'extraction), rate-limiting, retries exp-backoff, DLQ.
    LLM Python LLMOps RAG Langchain
  • Venio AI
    AI Engineer
    Februar 2025 - September 2025 (7 Monate)
    Reggio d'Émilie, Italien
    Startup d'automatisation par agents IA pour entreprises non-tech.


    Plateforme d'agents conversationnels :
    Construction en Python/FastAPI d'une plateforme d'agents LLM : le système comprend le besoin utilisateur en langage naturel, génère un agent adapté et expose un endpoint API prêt à l'emploi. Génération automatique d'outils agents depuis specs OpenAPI.


    Benchmarking & déploiement :
    Suite de benchmarking (accuracy, coût, latence) pour comparer modèles LLM et prompts avant mise en production. Déploiements automatisés Docker/Kubernetes via GitLab CI/CD.
    FastAPI Docker Python LLM Agent IA
  • ONECLICKHIRED
    Fondateur
    Januar 2025 - September 2025 (8 Monate)
    SaaS IA : parsing de CV + outreach personnalisé automatisé. Stack complète construite en solo : React/TS, Fastify, PostgreSQL, Redis/BullMQ, Stripe.


    Intégration LLM multi-providers (Gemini + OpenAI), jobs asynchrones fiables. 150 inscriptions.
    LLM PostgreSQL intelligence artificielle

Empfehlungen

Sei die erste Person, die Julien empfiehlt

Teile Deine Erfahrung aus der Zusammenarbeit mit diesem Freelancer.

Diese Freelancer passen auch zu Ihren Kriterien

AgathaA

Agatha Frydrych

Backend Java Software Engineer

4.7

(3)

2

BaptisteB

Baptiste Duhen

Fullstack developer

4.6

(4)

5

AmedA

Amed Hamou

Senior Lead Developer

4

(2)

7

AudreyA

Audrey Champion

Web developer

4.3

(3)

4

Ausbildung und Abschlüsse

  • Ingénieur, IA
    EPITA
    2025
    Ingénieur, IA
  • MP
    CPGE N.D. de Sion
    2022
    MP

Fähigkeiten

Kategorien