Contexte
Un cabinet de services professionnels traitait entre 80 et 150 factures fournisseurs par mois, provenant de prestataires variés dans des formats différents (PDF, email avec pièce jointe, parfois papier scanné).
Le traitement était manuel : réception, lecture, extraction des données clés (montant, TVA, date, référence), saisie dans l'outil comptable, vérification, validation. Une charge estimée à 15-20h/mois pour l'équipe administrative.
Volume mensuel : 80-150 factures Formats entrants : PDF natif (60%), PDF scanné (30%), email formaté (10%) Temps de traitement moyen par facture : 8-12 minutes Taux d'erreur de saisie : estimé à 5-8% (nécessitant une correction ultérieure)
Agent déployé
Architecture
L'agent est un pipeline en 3 étapes :
Étape 1 — Réception et classification L'agent surveille une boîte email dédiée et un dossier partagé. À chaque nouvelle facture reçue, il la classe (facture fournisseur, avoir, duplicata probable) et l'achemine vers le pipeline de traitement.
Étape 2 — Extraction Extraction des champs clés via vision LLM (pour les PDFs) et parsing structuré :
- Émetteur (nom, SIRET, adresse)
- Date de facture et date d'échéance
- Numéro de facture
- Lignes de détail avec montants HT/TTC
- TVA et taux applicable
- Coordonnées bancaires (pour vérification)
Étape 3 — Vérification et import L'agent vérifie la cohérence des données extraites (total HT + TVA = TTC, SIRET format valide, fournisseur connu dans la base). Si la vérification passe, il prépare l'import dans l'outil comptable. Si elle échoue, il route vers un humain avec le détail du problème identifié.
Garde-fous critiques
- Aucune validation automatique des paiements — l'agent prépare les données, un humain valide
- Toute facture d'un nouveau fournisseur (non connu dans la base) est systématiquement routée vers un humain
- Les montants supérieurs à un seuil défini requièrent une validation manuelle
- Log complet de chaque action pour traçabilité comptable
Déploiement
Semaine 1 : Audit du process existant, identification des formats de factures reçus, définition des champs à extraire, configuration de l'environnement.
Semaines 2-3 : POC sur 60 factures historiques (20 par type de format), mesure des taux d'extraction, ajustement des prompts pour les cas difficiles (PDFs mal scannés, layouts inhabituels).
Semaines 4-5 : Intégration avec l'outil comptable, déploiement en mode "shadow" (l'agent traite ET l'humain traite en parallèle pour vérification), puis passage en production sur les factures standards.
Résultat
Note : résultats basés sur les observations des premières semaines en production — à confirmer sur une période plus longue.
Le traitement des factures PDF natifs (format le plus fréquent) est largement automatisé. L'équipe administrative intervient principalement sur les cas d'exception : nouveaux fournisseurs, PDFs de mauvaise qualité, incohérences détectées.
Le taux d'erreur de saisie sur les factures traitées automatiquement est inférieur au taux de référence manuel, principalement parce que l'agent vérification détecte des incohérences qui passaient inaperçues.
Point d'attention majeur : les PDFs scannés avec une résolution insuffisante génèrent des extractions peu fiables. Une étape de préprocessing (amélioration qualité image) a dû être ajoutée pour ce sous-ensemble.
Ce qu'on referait pareil : les guardrails conservateurs sur les nouveaux fournisseurs et les montants élevés.
Ce qu'on ferait différemment : prévoir dès le départ le traitement des PDFs de mauvaise qualité comme un cas d'usage distinct nécessitant sa propre logique.