Docker Compose pour l'IA : Guide Complet de l'Environnement de Développement Full-Stack

Dans cet article, je partage mon expérience de configuration d'un environnement de développement local pour les API IA, en utilisant Docker Compose comme orchestrateur central. Après avoir testé de nombreuses configurations, j'ai trouvé une solution robuste qui révolutionne le prototypage rapide de vos applications IA.

Comparatif des Solutions d'API IA en 2026

Critère	HolySheep AI	API OpenAI	Services Relais
Coût moyen	¥1 = $1 (économie 85%+)	$100+ / mois	$30-80 / mois
Latence	<50ms garantie	80-200ms	60-150ms
GPT-4.1	$2.50 / MTok	$8 / MTok	$5-6 / MTok
Claude Sonnet 4.5	$4 / MTok	$15 / MTok	$8-10 / MTok
Gemini 2.5 Flash	$0.60 / MTok	$2.50 / MTok	$1.50 / MTok
DeepSeek V3.2	$0.15 / MTok	N/A	$0.42 / MTok
Paiement	WeChat, Alipay, USDT	Carte internationale	Limité
Crédits gratuits	✓ Inclus	$5 initial	Rare

S'inscrire ici pour profiter de ces tarifs compétitifs et des crédits offerts.

Architecture de l'Environnement Docker Compose

Mon setup complet comprend :

Frontend : Next.js 14 avec App Router
Backend API : FastAPI avec uvicorn
Base de données : PostgreSQL 16
Cache : Redis 7
Reverse Proxy : Nginx
OLLAMA : pour les modèles locaux en fallback

Structure du Projet

ai-fullstack/
├── docker-compose.yml
├── backend/
│   ├── Dockerfile
│   ├── requirements.txt
│   ├── app/
│   │   ├── main.py
│   │   ├── config.py
│   │   ├── routers/
│   │   └── services/
├── frontend/
│   ├── Dockerfile
│   ├── package.json
│   └── src/
├── nginx/
│   └── nginx.conf
└── .env

Configuration Docker Compose Principale

version: '3.8'

services:
  # Backend FastAPI
  backend:
    build:
      context: ./backend
      dockerfile: Dockerfile
    container_name: ai-backend
    ports:
      - "8000:8000"
    environment:
      - HOLYSHEEP_API_KEY=${HOLYSHEEP_API_KEY}
      - DATABASE_URL=postgresql://user:password@db:5432/aiapp
      - REDIS_URL=redis://cache:6379
      - OLLAMA_BASE_URL=http://ollama:11434
    env_file:
      - .env
    volumes:
      - ./backend:/app
      - ollama-models:/root/.ollama
    depends_on:
      - db
      - cache
      - ollama
    networks:
      - ai-network
    restart: unless-stopped

  # Frontend Next.js
  frontend:
    build:
      context: ./frontend
      dockerfile: Dockerfile
    container_name: ai-frontend
    ports:
      - "3000:3000"
    environment:
      - NEXT_PUBLIC_API_URL=http://backend:8000
    depends_on:
      - backend
    networks:
      - ai-network
    restart: unless-stopped

  # Base de données PostgreSQL
  db:
    image: postgres:16-alpine
    container_name: ai-db
    environment:
      - POSTGRES_USER=user
      - POSTGRES_PASSWORD=password
      - POSTGRES_DB=aiapp
    volumes:
      - postgres-data:/var/lib/postgresql/data
    ports:
      - "5432:5432"
    networks:
      - ai-network
    restart: unless-stopped

  # Cache Redis
  cache:
    image: redis:7-alpine
    container_name: ai-cache
    ports:
      - "6379:6379"
    volumes:
      - redis-data:/data
    networks:
      - ai-network
    restart: unless-stopped

  # Modèles locaux OLLAMA
  ollama:
    image: ollama/ollama:latest
    container_name: ai-ollama
    ports:
      - "11434:11434"
    volumes:
      - ollama-models:/root/.ollama
    networks:
      - ai-network
    restart: unless-stopped

  # Reverse Proxy Nginx
  nginx:
    image: nginx:alpine
    container_name: ai-nginx
    ports:
      - "80:80"
      - "443:443"
    volumes:
      - ./nginx/nginx.conf:/etc/nginx/nginx.conf:ro
      - ./nginx/ssl:/etc/nginx/ssl:ro
    depends_on:
      - frontend
      - backend
    networks:
      - ai-network
    restart: unless-stopped

networks:
  ai-network:
    driver: bridge

volumes:
  postgres-data:
  redis-data:
  ollama-models:

Configuration du Backend FastAPI avec HolySheep AI

# backend/requirements.txt
fastapi==0.109.0
uvicorn[standard]==0.27.0
httpx==0.26.0
pydantic==2.5.3
python-dotenv==1.0.0
asyncpg==0.29.0
redis==5.0.1
sqlalchemy[asyncio]==2.0.25
python-multipart==0.0.6

# backend/app/config.py
from pydantic_settings import BaseSettings
from functools import lru_cache

class Settings(BaseSettings):
    # HolySheep AI Configuration
    holysheep_api_key: str
    holysheep_base_url: str = "https://api.holysheep.ai/v1"
    
    # Database
    database_url: str
    
    # Redis
    redis_url: str
    
    # Ollama fallback
    ollama_base_url: str = "http://ollama:11434"
    use_local_fallback: bool = True
    
    class Config:
        env_file = ".env"

@lru_cache()
def get_settings() -> Settings:
    return Settings()

# backend/app/services/ai_service.py
import httpx
from typing import Optional, Dict, Any
from config import get_settings

class AIService:
    def __init__(self):
        self.settings = get_settings()
        self.base_url = self.settings.holysheep_base_url
        self.api_key = self.settings.holysheep_api_key
        self.headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }
    
    async def chat_completion(
        self,
        model: str,
        messages: list,
        temperature: float = 0.7,
        max_tokens: int = 2048
    ) -> Dict[str, Any]:
        """Appel à l'API HolySheep AI"""
        async with httpx.AsyncClient(timeout=60.0) as client:
            response = await client.post(
                f"{self.base_url}/chat/completions",
                headers=self.headers,
                json={
                    "model": model,
                    "messages": messages,
                    "temperature": temperature,
                    "max_tokens": max_tokens
                }
            )
            response.raise_for_status()
            return response.json()
    
    async def embeddings(
        self,
        model: str,
        input_text: str
    ) -> list:
        """Génération d'embedding via HolySheep"""
        async with httpx.AsyncClient(timeout=30.0) as client:
            response = await client.post(
                f"{self.base_url}/embeddings",
                headers=self.headers,
                json={
                    "model": model,
                    "input": input_text
                }
            )
            response.raise_for_status()
            return response.json()["data"][0]["embedding"]

Instance globale
ai_service = AIService()

# backend/app/main.py
from fastapi import FastAPI, HTTPException, Depends
from fastapi.middleware.cors import CORSMiddleware
from pydantic import BaseModel
from typing import List, Optional
from services.ai_service import ai_service

app = FastAPI(
    title="AI Full-Stack API",
    description="API unifiée utilisant HolySheep AI",
    version="1.0.0"
)

app.add_middleware(
    CORSMiddleware,
    allow_origins=["http://localhost:3000"],
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)

class ChatRequest(BaseModel):
    model: str = "gpt-4.1"
    messages: List[dict]
    temperature: float = 0.7
    max_tokens: int = 2048

class ChatResponse(BaseModel):
    response: str
    model: str
    usage: dict
    latency_ms: float

@app.post("/api/chat", response_model=ChatResponse)
async def chat_endpoint(request: ChatRequest):
    import time
    start = time.time()
    
    try:
        result = await ai_service.chat_completion(
            model=request.model,
            messages=request.messages,
            temperature=request.temperature,
            max_tokens=request.max_tokens
        )
        
        latency = (time.time() - start) * 1000
        
        return ChatResponse(
            response=result["choices"][0]["message"]["content"],
            model=result["model"],
            usage=result["usage"],
            latency_ms=round(latency, 2)
        )
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.get("/health")
async def health_check():
    return {
        "status": "healthy",
        "holysheep_api": "connected",
        "latency": "<50ms"
    }

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

Dockerfile Backend

# backend/Dockerfile
FROM python:3.11-slim

WORKDIR /app

Dépendances système
RUN apt-get update && apt-get install -y \
    gcc \
    libpq-dev \
    && rm -rf /var/lib/apt/lists/*

Installation des dépendances Python
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

Copie du code
COPY . .

Exposition du port
EXPOSE 8000

Démarrage
CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8000", "--reload"]

Configuration Nginx

# nginx/nginx.conf
events {
    worker_connections 1024;
}

http {
    upstream backend {
        server backend:8000;
    }
    
    upstream frontend {
        server frontend:3000;
    }
    
    server {
        listen 80;
        server_name localhost;
        
        # Frontend
        location / {
            proxy_pass http://frontend;
            proxy_http_version 1.1;
            proxy_set_header Upgrade $http_upgrade;
            proxy_set_header Connection 'upgrade';
            proxy_set_header Host $host;
            proxy_cache_bypass $http_upgrade;
        }
        
        # API Backend
        location /api {
            proxy_pass http://backend;
            proxy_http_version 1.1;
            proxy_set_header Host $host;
            proxy_set_header X-Real-IP $remote_addr;
            proxy_read_timeout 60s;
        }
    }
}

Script de Démarrage Rapide

#!/bin/bash
start-ai-stack.sh

set -e

echo "🚀 Démarrage de l'environnement AI Full-Stack..."

Création du fichier .env si inexistant
if [ ! -f .env ]; then
    cat > .env << EOF
HOLYSHEEP_API_KEY=YOUR_HOLYSHEEP_API_KEY
DATABASE_URL=postgresql://user:password@localhost:5432/aiapp
REDIS_URL=redis://localhost:6379
OLLAMA_BASE_URL=http://localhost:11434
EOF
    echo "⚠️  Fichier .env créé. Ajoutez votre clé API HolySheep !"
fi

Téléchargement des modèles Ollama
echo "📦 Téléchargement des modèles Ollama..."
docker exec -it ai-ollama ollama pull llama2
docker exec -it ai-ollama ollama pull mistral

Démarrage des services
echo "🐳 Démarrage des conteneurs Docker..."
docker-compose up -d

echo "✅ Stack AI démarrée !"
echo "   - Frontend: http://localhost:3000"
echo "   - API: http://localhost:8000"
echo "   - Swagger: http://localhost:8000/docs"
echo "   - Ollama: http://localhost:11434"

Test de l'Intégration HolySheep

#!/usr/bin/env python3
test_holysheep.py
import httpx
import asyncio
import time

async def test_holysheep():
    api_key = "YOUR_HOLYSHEEP_API_KEY"
    base_url = "https://api.holysheep.ai/v1"
    
    headers = {
        "Authorization": f"Bearer {api_key}",
        "Content-Type": "application/json"
    }
    
    models_to_test = [
        "gpt-4.1",
        "claude-sonnet-4.5",
        "gemini-2.5-flash",
        "deepseek-v3.2"
    ]
    
    for model in models_to_test:
        start = time.time()
        
        try:
            async with httpx.AsyncClient(timeout=30.0) as client:
                response = await client.post(
                    f"{base_url}/chat/completions",
                    headers=headers,
                    json={
                        "model": model,
                        "messages": [{"role": "user", "content": "Bonjour !"}],
                        "max_tokens": 50
                    }
                )
                
                latency = (time.time() - start) * 1000
                
                if response.status_code == 200:
                    result = response.json()
                    print(f"✅ {model}: {latency:.2f}ms | Coût: ${result['usage']['total_tokens'] * 0.0001:.4f}")
                else:
                    print(f"❌ {model}: Erreur {response.status_code}")
                    
        except Exception as e:
            print(f"❌ {model}: {str(e)}")

if __name__ == "__main__":
    asyncio.run(test_holysheep())

Commandes Utiles Docker Compose

# Démarrer toute la stack
docker-compose up -d

Voir les logs en temps réel
docker-compose logs -f

Logs d'un service spécifique
docker-compose logs -f backend

Redémarrer un service
docker-compose restart backend

Arrêter et supprimer les volumes
docker-compose down -v

Reconstruire après modification
docker-compose up -d --build

Statut des conteneurs
docker-compose ps

Accéder au shell d'un conteneur
docker exec -it ai-backend /bin/bash

Vérifier les ressources utilisées
docker stats

Erreurs courantes et solutions

1. Erreur : "Connection refused" vers HolySheep API

# ❌ Erreur typique
httpx.ConnectError: [Errno 111] Connection refused

✅ Solution : Vérifier la configuration de l'API key
Dans .env:
HOLYSHEEP_API_KEY=votre_cle_api_reelle

✅ Vérifier dans le conteneur
docker exec -it ai-backend env | grep HOLYSHEEP

Cause : La variable d'environnement n'est pas chargée ou la clé API est incorrecte. Solution : Redémarrez les conteneurs après modification du fichier .env : docker-compose restart backend

2. Erreur : "ModuleNotFoundError: No module named 'pydantic'"

# ❌ Erreur typique
ModuleNotFoundError: No module named 'pydantic'

✅ Solution : Reconstruire l'image Docker
docker-compose down
docker-compose build --no-cache backend
docker-compose up -d backend

✅ Alternative : Installer les dépendances manuellement dans le conteneur
docker exec -it ai-backend pip install -r requirements.txt

Cause : Le volume monte le code local sur /app mais écrase le WORKDIR. Solution : Ajoutez un point de montage en lecture seule ou reconstruisez l'image.

3. Erreur : PostgreSQL "Connection refused" ou timeout

# ❌ Erreur typique
sqlalchemy.exc.OperationalError: could not connect to server

✅ Solution : Vérifier l'ordre de dépendance et les variables
Dans docker-compose.yml, backend doit dépendre de db:
services:
  backend:
    depends_on:
      db:
        condition: service_healthy

✅ Ajouter un healthcheck pour PostgreSQL
  db:
    healthcheck:
      test: ["CMD-SHELL", "pg_isready -U user"]
      interval: 5s
      timeout: 5s
      retries: 5

Cause : Le backend démarre avant PostgreSQL. Solution : Configurez un healthcheck et la condition de dépendance comme indiqué.

4. Erreur : Latence élevée ou timeout avec HolySheep

# ❌ Symptôme : Latence > 500ms ou timeout

✅ Solutions à appliquer :
1. Vérifier la connectivité réseau
docker exec -it ai-backend ping -c 3 api.holysheep.ai

2. Augmenter le timeout dans httpx
async with httpx.AsyncClient(timeout=120.0) as client:
    ...

3. Implémenter un fallback Ollama local
async def chat_with_fallback(messages):
    try:
        return await ai_service.chat_completion(messages)
    except Exception:
        # Utiliser Ollama local comme fallback
        return await ollama_service.chat(messages)

Cause : Problème de réseau, firewall, ou timeout trop court. Solution : Vérifiez la connectivité et augmentez les timeouts.

5. Erreur : Ollama ne démarre pas ou modèles manquants

# ❌ Erreur typique
Error: could not find llama2 in the model store

✅ Solution : Télécharger explicitement les modèles
docker exec -it ai-ollama ollama pull llama2
docker exec -it ai-ollama ollama pull mistral
docker exec -it ai-ollama ollama pull nomic-embed-text

✅ Vérifier les modèles disponibles
docker exec -it ai-ollama ollama list

✅ Redémarrer le service
docker-compose restart ollama

Cause : Les modèles ne sont pas pré-chargés dans le volume persistent. Solution : Téléchargez les modèles manuellement après le premier démarrage.

Variables d'Environnement Requises

# .env - Configuration complète

HolySheep AI (OBLIGATOIRE)
HOLYSHEEP_API_KEY=YOUR_HOLYSHEEP_API_KEY

Base de données PostgreSQL
DATABASE_URL=postgresql://user:password@db:5432/aiapp

Cache Redis
REDIS_URL=redis://cache:6379

Ollama (optionnel, pour fallback local)
OLLAMA_BASE_URL=http://ollama:11434
USE_LOCAL_FALLBACK=true

Configuration optionnelle
LOG_LEVEL=INFO
CORS_ORIGINS=http://localhost:3000

Comparatif des Solutions d'API IA en 2026

Architecture de l'Environnement Docker Compose

Structure du Projet

Configuration Docker Compose Principale

Configuration du Backend FastAPI avec HolySheep AI

Instance globale

Dockerfile Backend

Dépendances système

Installation des dépendances Python

Copie du code

Exposition du port

Démarrage

Configuration Nginx

Script de Démarrage Rapide

start-ai-stack.sh

Création du fichier .env si inexistant

Téléchargement des modèles Ollama

Démarrage des services

Test de l'Intégration HolySheep

test_holysheep.py

Commandes Utiles Docker Compose

Voir les logs en temps réel

Logs d'un service spécifique

Redémarrer un service

Arrêter et supprimer les volumes

Reconstruire après modification

Statut des conteneurs

Accéder au shell d'un conteneur

Vérifier les ressources utilisées

Erreurs courantes et solutions

1. Erreur : "Connection refused" vers HolySheep API

httpx.ConnectError: [Errno 111] Connection refused

✅ Solution : Vérifier la configuration de l'API key

Dans .env:

✅ Vérifier dans le conteneur

2. Erreur : "ModuleNotFoundError: No module named 'pydantic'"

ModuleNotFoundError: No module named 'pydantic'

✅ Solution : Reconstruire l'image Docker

✅ Alternative : Installer les dépendances manuellement dans le conteneur

3. Erreur : PostgreSQL "Connection refused" ou timeout

sqlalchemy.exc.OperationalError: could not connect to server

✅ Solution : Vérifier l'ordre de dépendance et les variables

Dans docker-compose.yml, backend doit dépendre de db:

✅ Ajouter un healthcheck pour PostgreSQL

4. Erreur : Latence élevée ou timeout avec HolySheep

✅ Solutions à appliquer :

1. Vérifier la connectivité réseau

2. Augmenter le timeout dans httpx

3. Implémenter un fallback Ollama local

5. Erreur : Ollama ne démarre pas ou modèles manquants

Error: could not find llama2 in the model store

✅ Solution : Télécharger explicitement les modèles

✅ Vérifier les modèles disponibles

✅ Redémarrer le service

Variables d'Environnement Requises

HolySheep AI (OBLIGATOIRE)

Base de données PostgreSQL

Cache Redis

Ollama (optionnel, pour fallback local)

Configuration optionnelle

Monitoring et Débogage

Ressources connexes

Articles connexes

🔥 Essayez HolySheep AI