Apprendre les outils du développement IA, un sujet à la fois.
Ce site rassemble les technologies que je découvre en cours de DevIA.
Pour chacune : à quoi elle sert, un exemple concret, et un guide pas à pas
pour l'installer et l'essayer.
Sujets disponibles
Chaque fiche suit la même structure : présentation, cas d'usage, installation et exemple à copier-coller.
IDE
Environnement
UV
Le gestionnaire de paquets et d'environnements Python ultra-rapide, écrit en Rust.
pip
L'installateur de paquets Python livré avec Python : la stack historique pip + venv + requirements.txt.
Docker
Conteneurise tes applications pour qu'elles tournent partout, à l'identique.
Kubernetes
Orchestrer plein de conteneurs Docker en production, automatiquement.
Traefik
Reverse proxy moderne pour conteneurs : autodiscovery via labels Docker, HTTPS Let's Encrypt automatique, dashboard intégré.
Portainer
UI web pour gérer Docker (et Kubernetes) : visualiser les conteneurs, déployer des stacks, consulter logs et console à la souris.
Jupyter
Le carnet interactif où on mélange code Python, texte et graphiques pour explorer ses données.
Web & API
FastAPI
Construis des APIs Python rapides, validées et auto-documentées.
Streamlit
Transforme un script Python en application web interactive en quelques lignes.
Pydantic
Validation et parsing de données par annotations de type Python : le moteur sous FastAPI, devenu standard de fait.
httpx
Le client HTTP moderne : même API que requests, plus async et HTTP/2. L'outil pour parler à une API externe depuis Python.
Outils & Tests
GitHub
Hébergement Git en ligne, collaboration, pull requests et workflows.
GitLab
Plateforme DevOps tout-en-un : Git, Merge Requests, CI/CD, registry et monitoring sous le même toit. Auto-hébergeable.
Forgejo
Forge légère, libre (AGPL), auto-hébergeable. Fork communautaire de Gitea porté par Codeberg e.V. — l'option DIY / souveraine.
CI/CD
Automatiser tests, builds et déploiements à chaque push avec GitHub Actions.
pytest
Le framework de référence pour tester son code Python simplement.
Ruff
Linter et formatter Python ultra-rapide, écrit en Rust : remplace flake8, black, isort et pyupgrade en un seul outil.
pre-commit
Lancer automatiquement Ruff, pytest et autres checks avant chaque commit Git — via des hooks versionnés dans le repo.
mypy
Type-checker statique pour Python : vérifie la cohérence des annotations sans exécuter le code. Complète Ruff et Pydantic.
MLOps
MLflow
Suivre tes expériences ML, versionner tes modèles et les passer en production.
Prefect
Orchestrer tes pipelines ML/data en Python : planning, retries, caching et UI temps réel.
DVC
« Data Version Control » : Git pour les datasets et modèles trop gros pour Git, avec stockage déporté sur un remote (MinIO, S3…).
Messagerie & tâches
Kafka
Le journal d'événements distribué : flux massifs lus par plusieurs consommateurs en parallèle.
RabbitMQ
Broker de messages éprouvé pour distribuer des tâches entre services, avec acks et retries.
Redis
Le couteau suisse en mémoire : cache, broker, compteur, sessions, pub/sub, le tout en microsecondes.
Celery
Exécuter des tâches Python en arrière-plan via un broker, avec retries et tâches périodiques.
Flower
L'UI temps réel pour superviser Celery : workers, tâches, échecs, débit.
Logs
logging (stdlib)
Le module de journalisation livré avec Python : loggers, handlers, formatters, niveaux. Le standard incontournable.
Loguru
La lib Python qui rend les logs plaisants : couleurs, rotation, JSON, capture d'exceptions, le tout en une ligne d'import.
Loki
Le « Prometheus des logs » par Grafana : centralisation légère, basée sur des labels, requêtable en LogQL.
Monitoring
Prometheus
Collecter les métriques de tes services en temps réel, les stocker et les requêter avec PromQL.
Grafana
Construire des dashboards et des alertes au-dessus de Prometheus (ou d'autres sources).
Uptime Kuma
Surveiller la disponibilité de tes services et recevoir une notif dès que ça tombe.
Scraping
BeautifulSoup
Parser du HTML en Python pour en extraire les données : sélecteurs CSS, recherche par balise, navigation dans l'arbre.
Selenium
Piloter un vrai navigateur depuis Python pour scraper les pages dynamiques que requests ne voit pas.
Playwright
L'alternative moderne à Selenium par Microsoft : auto-wait intégré, 3 navigateurs avec une seule API, plus rapide.
Données
SQLite
Une base de données SQL dans un seul fichier — sans serveur, sans configuration.
PostgreSQL
La base de données relationnelle open-source de référence. Le choix par défaut dès qu'on dépasse SQLite.
SQLAlchemy
Parler à une base de données SQL avec des objets Python plutôt que du SQL brut.
Supabase
Un backend complet prêt à l'emploi : Postgres, auth, API REST, stockage, temps réel.
pandas
Manipuler des données tabulaires en Python : charger, filtrer, grouper, agréger.
PySpark
L'API Python d'Apache Spark : pandas-like, mais distribué sur un cluster pour traiter des téraoctets.
Polars
Une alternative à pandas écrite en Rust : multi-threadée, mode lazy, beaucoup plus rapide sur les gros fichiers.
matplotlib
La bibliothèque de visualisation historique de Python : courbes, histogrammes, scatter, base de tout l'écosystème de viz.
NumPy
La brique fondamentale du calcul scientifique en Python : tableaux multidim, opérations vectorisées, algèbre linéaire.
DuckDB
Le « SQLite de l'analytique » : base SQL embarquée, ultra-rapide sur les agrégations, lit Parquet et CSV directement.
MongoDB
La base NoSQL « document » la plus connue : stocke du JSON sans schéma figé, utile quand les enregistrements sont hétérogènes.
Stockage
Modèles IA
YOLO
« You Only Look Once » : la famille de modèles de détection d'objets en temps réel. Théorie, versions et usage Ultralytics.
scikit-learn
La bibliothèque de référence du machine learning classique : régression, classification, clustering, pipelines.
PyTorch
Le framework de deep learning de Meta : tenseurs GPU, autograd, réseaux de neurones — le standard de la recherche et de l'industrie.
Hugging Face
Le « GitHub des modèles IA » : hub de modèles pré-entraînés et lib transformers pour les utiliser en quelques lignes.
Ollama
Faire tourner des LLMs (Llama, Mistral…) en local en une commande, avec une API HTTP style OpenAI.
Pillow
La lib Python de manipulation d'images « simple » : ouvrir, redimensionner, convertir, dessiner. Brique image de base.
OpenCV
La bibliothèque de référence pour la vision par ordinateur : traitement d'image, vidéo, détection — bien plus que Pillow.
LangChain
Le framework généraliste pour applications LLM : RAG, agents, chains, tools — un couteau suisse pour brancher un LLM au monde réel.
LlamaIndex
Le framework focalisé RAG : indexer des documents et interroger un LLM avec un contexte pertinent — en 5 lignes utiles.
Documentation
Retours d'expérience
Retex — CI/CD du site
Comment j'ai mis en place la CI sur ce site, les 5 erreurs rencontrées, et le pattern fail-loud / fail-soft auquel on a abouti.
Mettre un projet sur GitHub
De git init à un site live sur GitHub Pages : le parcours pas à pas.
Retex — Injection au build
Afficher la date du dernier push dans le footer : pourquoi on l'injecte côté CI plutôt qu'en JS au chargement.
Retex — pre-commit sur ce site
Brancher pre-commit sur un repo non-Python : choix des hooks, pas de doublon avec lychee, intégration dans le CI fail-loud / fail-soft.