Comment nous avons aidé un ERP viticole à ne plus perdre ses week-ends en nettoyage de données
30 000 références de vins mal saisies. Des week-ends entiers perdus. Voici comment nous avons changé la donne.
Feb 10, 2026
Alexis dirige Gostan, un système de gestion des stocks de vin basé à Bordeaux. Ses clients sont des restaurants et des bars à vin : des lieux où un sommelier doit pouvoir faire confiance au catalogue, mettre à jour le stock en quelques secondes, et ne jamais dire à un client « en fait, on n'en a plus ».
Le problème ? Chaque intégration d'un nouveau client signifiait des milliers de lignes de données désordonnées. Des noms de vins orthographiés de trois façons différentes. Des producteurs avec des fautes de frappe. Des appellations qui se ressemblaient presque, mais pas tout à fait.
Chaque intégration pouvait dévorer des soirées et des week-ends entiers. Du temps qu'Alexis aurait dû consacrer à développer son activité. Ou à sa famille.
Le vrai coût des données mal structurées
Ce n'était pas qu'un simple désagrément, cela coûtait de l'argent. Quand « Château Margaux 2018 » existe sous trois entrées distinctes, on obtient :
- Des ventes manquées (le stock affiche zéro alors que le vin est disponible)
- Des clients perdus
- Des heures de réconciliation manuelle
Alexis et son équipe étaient épuisés. Ils avaient essayé les outils classiques. Rien ne fonctionnait assez bien sur des données viticoles — trop de quasi-doublons légitimes, trop de complexité métier.
Ce que nous avons construit ensemble
Nous avons abordé le problème en deux phases.
Phase 1 : Nettoyer les données existantes
Plus de 30 000 références de vins. Nous avons construit un pipeline combinant :
- Du RAG pour croiser les noms avec des bases de référence et faire remonter les correspondances canoniques les plus probables
- Un classifieur pour détecter les quasi-doublons et expliquer pourquoi deux entrées font probablement référence au même vin
- Des LLMs pour générer des fiches propres et standardisées (producteur, appellation, millésime)
- Du clustering sémantique pour regrouper les entrées similaires au-delà de la simple comparaison de chaînes
L'élément clé : un workflow de validation basé sur Excel. L'équipe d'Alexis pouvait valider les corrections rapidement avant l'import dans l'ERP. L'IA propose, l'humain approuve.
Phase 2 : Rendre l'onboarding indolore
Désormais, quand un nouveau client arrive avec son tableur chaotique, le pipeline fait le gros du travail. Ce qui prenait un week-end ne prend plus qu'une fraction du temps.
Et après ?
Nous explorons maintenant la mise à jour d'inventaire par image — prendre une photo, mettre à jour le catalogue. L'objectif : rendre la gestion des stocks fluide pour Alexis et ses clients.
Tout cela fonctionne sur des pipelines de modèles propriétaires et privés. Les données viticoles restent des données viticoles.
Si vous êtes confronté à des catalogues produits désordonnés, des incohérences de nommage ou des intégrations clients pénibles — c'est exactement le type de problème que l'IA gère bien. Contactez-nous si vous souhaitez explorer ce qui est possible.