Blog

Experiments, open data, opinions. Not algorithm-optimised content.

Articles currently available in French only.

Ne mettez pas tous vos LLM dans le même panier : le cas pour le multi-provider

Anthropic tombe, OpenAI change ses tarifs, Mistral sort un modèle qui écrase tout le monde. Si votre stack n'est pas multi-provider, vous êtes exposé.

Read →

Générer des slides avec l'IA : ce que j'ai appris en construisant IRIS

Pas un wrapper ChatGPT. Un système agentique bout en bout qui pense la structure, choisit le contenu, et produit des présentations cohérentes. Retour d'expérience.

Read →

EPM en 2025 : pourquoi les outils du marché ne sont plus adaptés

SAP BPC, Oracle Hyperion, Anaplan — des outils pensés pour un monde d'avant le cloud, avant l'IA, avant la vitesse actuelle. Il est temps de repenser la consolidation financière.

Read →

Pourquoi un ETL no-code c'est pas une mauvaise idée

Les data engineers ricaneront. Pourtant, 80% des transformations de données ne nécessitent pas d'écrire du code. Voici pourquoi j'ai construit YATA.

Read →

GPT-4o suffit. Arrêtez de sortir l'artillerie lourde pour des tâches simples

Opus 4.6 pour classifier un email ? Vraiment ? Un benchmark honnête sur quand utiliser quel modèle — et ce que ça coûte de se tromper.

Read →

Spark + appels API : maximiser le débit sans faire exploser vos rate limits

Comment orchestrer des millions d'appels API depuis Spark en respectant les TPM et RPM — sans retry en cascade, sans job qui foire à 3h du matin.

Read →

LangGraph vs ReAct vs CrewAI : lequel pour vos agents en 2025

Trois approches pour orchestrer des agents LLM. Trois philosophies différentes. Un seul bon choix selon votre contexte — voici comment choisir.

Read →

Pourquoi 80% des projets IA meurent après le POC

Le POC fonctionne. L'équipe est enthousiaste. Six mois plus tard, le projet est mort. Voici les vraies raisons — et comment les éviter.

Read →

Qdrant : ce que les autres bases vectorielles ne vous diront pas sur les gros volumes

FAISS, Pinecone, Weaviate, Qdrant — j'ai tous utilisé. Voici pourquoi Qdrant s'impose quand le volume grossit et que la prod ne pardonne pas.

Read →

Machine learning : arrêtez d'optimiser vos modèles, optimisez vos données

On passe des semaines à tuner des hyperparamètres. On devrait passer ces semaines à nettoyer, enrichir et comprendre les données.

Read →

Détection de fraude : le métier vaut plus que votre modèle

Après avoir déployé un système de détection de fraude en production avec un impact à 7 chiffres, voilà ce que j'aurais voulu savoir avant.

Read →

PostgreSQL, MongoDB, Elasticsearch, Redis, DuckDB : arrêtez de choisir par habitude

La plupart des équipes choisissent leur base de données par défaut, pas par réflexion. Un panorama honnête des 5 bases que tout data engineer devrait connaître.

Read →