Évaluation RAG : Métriques, Benchmarks et Production — 2 jours
Formation technique intensive pour les ML Engineers, développeurs IA et équipes MLOps qui construisent des systèmes RAG et veulent garantir leur fiabilité en production. Vous apprendrez à mesurer la fidélité, la pertinence et le rappel de contexte avec des outils open-source (Ragas, TruLens, DeepEval), à automatiser l'évaluation dans vos pipelines CI/CD, et à mettre en place un monitoring continu. Cas réel : audit d'un système RAG qui répondait correctement à 61% des questions — amélioration à 89% en 3 semaines grâce à un framework d'évaluation structuré.
AI Act : la formation IA devient obligatoire avant le 2 aout 2026
Anticipez la mise en conformite de votre entreprise. Voir nos formations
Ce que vous allez construire et apprendre
Des competences immediatement applicables dans votre contexte professionnel
- ✓Comprendre et calculer les 7 métriques fondamentales RAG (Faithfulness, Answer Relevance, Context Recall, Context Precision, Context Relevance, Answer Correctness, Answer Similarity)
- ✓Instrumenter un pipeline RAG existant avec Ragas et TruLens en moins d'une heure
- ✓Construire un dataset d'évaluation gold-standard avec génération synthétique (TestsetGenerator)
- ✓Automatiser l'évaluation dans un pipeline CI/CD avec seuils de qualité (quality gates)
- ✓Détecter les dégradations de performance en production avec des alertes temps-réel
- ✓Diagnostiquer les causes racines des échecs RAG (retrieval vs. generation vs. chunking)
- ✓Comparer et choisir entre Ragas, TruLens et DeepEval selon votre stack
Programme detaille
4 modules · 14h de formation intensive
Programme détaillé par demi-journée
4 demi-journées · 14h de formation
Public cible et prérequis
Ce programme est fait pour vous si vous êtes
- ✓ML Engineers et AI Engineers qui déploient des systèmes RAG en production
- ✓Développeurs Python ayant construit des pipelines LangChain ou LlamaIndex
- ✓Équipes MLOps souhaitant intégrer l'évaluation dans leurs pipelines CI/CD
- ✓Data Scientists qui veulent garantir la qualité de leurs chatbots documentaires
- ✓Tech Leads responsables de la fiabilité de systèmes IA en production
Prérequis détaillés
- ●Avoir construit et déployé au moins un pipeline RAG (LangChain, LlamaIndex, ou implémentation custom)
- ●Maîtriser Python à un niveau intermédiaire : async/await, dataclasses, pandas, pytest
- ●Avoir une expérience pratique avec au moins une base de données vectorielle (Chroma, Pinecone, Weaviate, pgvector)
- ●Avoir utilisé une API LLM (Claude, OpenAI, Mistral) en production, avec gestion des erreurs et retry logic
Modalités pédagogiques et moyens
Approche pédagogique
- ●Formation orientée production : chaque concept est ancré dans des incidents réels documentés
- ●Apprentissage par la pratique : 70% du temps sur des ateliers avec des pipelines RAG défaillants fournis
- ●Diagnostic actif : les participants reçoivent des systèmes RAG avec des bugs à identifier et corriger
- ●Benchmarking comparatif : évaluation en direct de Ragas, TruLens et DeepEval sur le même pipeline
- ●Parcours progressif : métriques → datasets → monitoring → CI/CD, avec montée en compétence graduelle
Moyens et ressources fournis
- ✓Plateforme e-learning Talki Academy avec accès post-formation (6 mois)
- ✓Crédits API Claude et OpenAI fournis pour tous les exercices d'évaluation (quota suffisant)
- ✓Environnement sandbox préconfiguré : LangChain, Ragas, TruLens, DeepEval, Chroma, LangFuse
- ✓5 pipelines RAG défaillants fournis (cas réels anonymisés) pour les exercices de diagnostic
- ✓Dataset d'évaluation pré-annoté (500 paires question/réponse/contexte) prêt à utiliser
- ✓Dépôt GitHub privé avec tous les scripts d'évaluation, templates CI/CD et dashboards Grafana
- ✓Enregistrements vidéo des sessions (accès 6 mois)
Évaluation et suivi
Modalités d'évaluation
- ●Auto-positionnement en amont : questionnaire sur les métriques RAG et l'expérience en production
- ●Quiz d'ancrage à la fin de chaque module (4 quiz, seuil de réussite : 70%)
- ●Cas pratique fil rouge : auditer un pipeline RAG fourni, identifier les 3 problèmes principaux, implémenter les corrections et atteindre un Faithfulness ≥ 0.85 et Context Recall ≥ 0.80
- ●Auto-évaluation des compétences acquises en fin de formation
- ●Évaluation à froid à 60 jours : questionnaire de transfert sur les métriques mesurées en production
Accompagnement
Assistance technique et pédagogique joignable entre 9h et 18h (jours ouvrés) par email à support@talki-academy.fr. Réponse sous 24h ouvrées. Accès au forum communautaire des apprenants et au canal Slack dédié aux équipes MLOps.
Résultats de la formation
Indicateurs mesurés auprès des apprenants sur les 12 derniers mois
Formation accessible aux personnes en situation de handicap. Contactez-nous à accessibilite@talki-academy.fr pour étudier les adaptations nécessaires (supports, rythme, outils).
Parcours apprenant avant et après la formation
Engagement apprenant
En amont de la formation : connectez-vous à votre espace apprenant pour compléter le questionnaire de positionnement (métriques RAG connues, stack utilisée, cas d'usage principal). Votre formateur adaptera les exercices à votre contexte. Guide d'installation de l'environnement sandbox envoyé par email 5 jours avant.
Transfert de compétences
À l'issue de la formation : accédez à votre dépôt GitHub avec tous les scripts produits, les templates CI/CD et les dashboards Grafana prêts à déployer. Un point de suivi individuel est proposé à J+30 pour répondre aux questions d'implémentation dans votre contexte.
Pour qui est cette formation ?
Profils vises
Prerequis
- ●Expérience pratique avec un système RAG (LangChain, LlamaIndex ou équivalent)
- ●Python intermédiaire (niveau confortable avec async, dataclasses, pandas)
- ●Notions de bases de données vectorielles (Chroma, Pinecone, Weaviate ou équivalent)
- ●Avoir utilisé une API LLM (Claude, OpenAI ou équivalent) en production
Modalites
Financement
Reste à charge potentiel : 0€
Nos formations sont éligibles à la prise en charge OPCO dans le cadre du plan de développement des compétences. Selon votre OPCO (ATLAS, OPCO2i, AFDAS, AKTO...), la formation peut être financée à 100%.
- ✓Nous gérons les démarches administratives OPCO
- ✓Convention de formation et programme fournis
- ✓Attestation officielle en fin de formation
- ✓Déductible en charges pour votre entreprise
Évaluation RAG : Métriques, Benchmarks et Production
- ✓2 jours intensifs
- ✓12 participants max
- ✓Livrables production-ready
- ✓Support post-formation 30 jours
* Dans le cadre du plan de développement des compétences. Consultez votre OPCO.
Aller plus loin
Ressources vidéo recommandées
Une sélection de vidéos des meilleurs experts pour approfondir chaque module de la formation.
Module 1
Module 2
Module 3
Module 4
Prochaine session disponible
Session en Juillet 2026. Places limitees a 12 participants.
Decouvrez aussi nos autres formations
Toutes incluses dans votre abonnement a 9,99 €/mois
Claude API
Maîtrisez l'API Claude de la première requête à la mise en production
IA Entrepreneurs
Boostez votre productivité avec un assistant IA personnalisé
Gouvernance IA
Conformité RGPD, éthique et bonnes pratiques pour déployer l'IA
Financement OPCO
Vérifiez votre éligibilité OPCO en 30 secondes
Nous vérifions votre éligibilité et vous rappelons sous 24h avec les démarches complètes. La formation peut être intégralement prise en charge.




