Les gens adorent les promesses vagues sur l'IA. "Économisez 80% de vos coûts dev." "Vos agents travaillent 24/7." Mais personne ne publie les vrais chiffres.
Voilà les miens.
Le contexte
J'ai 7 agents IA qui tournent en permanence sur mes projets personnels. Chacun a un rôle, un budget mensuel, et un historique de tokens consommés. Voici exactement ce que ça coûte.
Les budgets alloués par agent
| Agent | Rôle | Budget alloué/mois |
|---|---|---|
| 🧠 Jarvice | CEO, coordination | 150€ |
| 🔧 Builder | Dev AutoPrestige | 100€ |
| ⚡ Flashman | Dev Flash Cards Generator | 100€ |
| ✍️ Scribe | Dev + blog valentin.business | 50€ |
| 🎓 Sinaps | Tuteur Slack | 50€ |
| 🚀 Megaphone | Marketing Twitter | 30€ |
| 🛡️ Sentinel | Ops & monitoring | 20€ |
| TOTAL | 500€/mois |
Ce sont des plafonds. Les agents ne consomment que quand ils travaillent.
Ce qu'ils consomment réellement
En pratique, 50 à 80€/mois selon l'intensité d'activité. Pourquoi l'écart avec les 500€ de budget ?
Raison 1 : les agents attendent. Un agent sans issue ouverte ne consomme rien. Sentinel coûte quasiment 0€ sur la plupart des journées — il fait des vérifications légères (HTTP 200 ?, git status) et son rapport du matin tient en quelques milliers de tokens.
Raison 2 : les modèles légers pour les tâches légères. Le morning brief de Sentinel : Gemini Flash. Les reviews de code : Claude Sonnet. L'architecture complexe : Claude Opus. Je ne paie pas Opus pour vérifier un status HTTP.
Raison 3 : le caching. Le contexte système (MEMORY.md, AGENTS.md, SOUL.md) est mis en cache entre les sessions. Sur les longues sessions de coding, le cache prefix réduit les coûts de 40-60%.
Décomposition réelle d'une journée type
Prenons une journée où Builder implémente une issue moyenne (environ 2h de travail) :
Morning brief (Sentinel) : ~2 000 tokens → ~0.01€ Audit sites + crons : ~1 500 tokens → ~0.01€ Issue checkout + lecture : ~3 000 tokens → ~0.02€ Exploration codebase : ~8 000 tokens → ~0.05€ Implémentation + itérations : ~25 000 tokens → ~0.20€ Écriture tests : ~10 000 tokens → ~0.08€ Rédaction PR + commentaire : ~5 000 tokens → ~0.04€ TOTAL journée (1 agent actif) : ~55 000 tokens → ~0.41€
Une issue complète, de checkout à PR mergée : moins de 50 centimes.
Comparaison avec les alternatives
| Option | Coût pour 1 issue moyenne |
|---|---|
| Freelance junior (320€/jour) | 160-320€ |
| Agence web | 300-500€ |
| Agent IA (Builder) | 0.30-0.80€ |
Rapport de 400 à 1000x.
Je précise : un agent ne remplace pas un développeur humain pour tout. Les décisions d'architecture, les revues complexes, les choix produit — c'est moi. Mais pour les issues bien spécifiées ? La différence est difficile à ignorer.
Les coûts cachés
Ce que les gens oublient de compter :
Mon temps. Je passe environ 30-45 minutes par jour sur Paperclip : review des PRs, merge, rédaction des nouvelles issues. Ce temps a une valeur. Si je le valorise à mon TJM (320€/jour), c'est environ 20-30€/jour de "coût caché".
Les outils. OpenClaw : gratuit (open source). Paperclip : accès beta gratuit pour l'instant. Vercel : plan hobby (0€). Turso : plan gratuit. Clerk : plan gratuit. Le seul vrai coût récurrent, c'est les tokens API.
L'infrastructure de monitoring. Sentry (plan gratuit), GitHub Actions (plan gratuit sur repo privé limité). Aucun coût.
Coût total réel sur les premiers mois
| Mois | Tokens API | Coût réel |
|---|---|---|
| Janvier 2026 | Mise en place, tests | ~15€ |
| Février 2026 | 4-5 agents actifs | ~35€ |
| Mars 2026 (à date) | 7 agents, plein régime | ~45€ (estimé 60-70€ fin de mois) |
Total cumulé : ~95€ pour 3 mois de fonctionnement.
Pendant ces 3 mois :
- ~30 PRs mergées sur AutoPrestige
- ~10 articles de blog publiés
- Flash Cards Generator live avec 2000+ utilisateurs actifs
- Ce site (valentin.business) entièrement construit et déployé
Ce que ça m'a vraiment coûté
En termes de temps : 45 minutes/jour pour piloter l'équipe.
En argent : ~95€ sur 3 mois.
Pour ce résultat, sans financement extérieur, en parallèle d'une alternance et d'un mastère.
C'est le modèle que j'explore. Pas parce que c'est parfait, mais parce que les chiffres le justifient.
Si tu veux voir les issues ouvertes, les PRs en cours, ou le dashboard Paperclip en temps réel — suis-moi sur Twitter →. Je thread tout.