Vous cherchez à exécuter vos Model Context Protocol Servers sans gérer d'infrastructure ? AWS Lambda + API Gateway offre une solution serverless attractive avec un modèle de coût à l'exécution, mais attention aux pièges de latence à froid et aux limites de durée. Après avoir déployé des dizaines de MCP Servers en production, je vous partage mon retour d'expérience complet.
Pourquoi Deployer MCP Server en Serverless ?
Le déploiement serverless de MCP Server répond à un besoin concret : réduire les coûts d'infrastructure pour des charges de travail variables. Lambda facture à la milliseconde (100ms minimum), tandis qu'un serveur dédié tourne 24/7. Pour un usage intermittent avec des pics à 500 requêtes/minute puis des silences de 2 heures, le serverless divise mes coûts par 4 par rapport à une instance EC2 t3.medium.
Néanmoins, ce n'est pas une solution universelle. Les MCP Servers avec des sessions longues, des websockets persistantes ou des modèles de machine learning lourd nécessiteront une infrastructure dédiée. Lambda impose une limite de 15 minutes par exécution et 250 Mo de stockage éphémère.
Comparatif : HolySheep vs AWS Lambda vs API Directes
| Critère | HolySheep AI | AWS Lambda + API Gateway | API OpenAI Directes | API Anthropic Directes |
|---|---|---|---|---|
| Coût GPT-4.1 | $8/1M tokens | $8 + infra Lambda | $8 | - |
| Coût Claude Sonnet 4.5 | $15/1M tokens | $15 + infra Lambda | - | $15 |
| Latence moyenne | <50ms | 100-300ms (cold start) | 200-800ms | 300-1000ms |
| Méthodes de paiement | WeChat, Alipay, USD | Carte bancaire, AWS credits | Carte bancaire | Carte bancaire |
| Langues supportées | 中文, English, Français | Configuration manuelle | English | English |
| Crédits gratuits | ✅ Oui | ❌ Non (payant dès 1ère requête) | $5 offre initiale | $5 offre initiale |
| Économie vs prix US | 85%+ (taux ¥1=$1) | Prix US standard | Prix US standard | Prix US standard |
| Profil idéal | Développeurs Chine/APAC, coûts critiques | Architectures AWS existantes | Budgets entreprise US | Projets Claude-first |
Pour qui / Pour qui ce n'est pas fait
✅ Cette solution est faite pour :
- Les applications avec des pics de charge imprévisibles et des périodes d'inactivité
- Les équipes ayant déjà une infrastructure AWS et souhaitant centraliser leurs MCP
- Les prototypes qui nécessitent un déploiement rapide sans configuration Kubernetes
- Les workloads avec des temps d'exécution courts (<5 minutes)
❌ Cette solution n'est pas faite pour :
- Les MCP Servers avec des sessions persistantes ou des connexions websockets longues
- Les modèles de ML personnalisés lourds (>500 Mo) nécessitant GPU
- Les applications temps réel avec des exigences de latence <50ms constantes
- Les entreprises en zone APAC cherchant à optimiser les coûts avec WeChat/Alipay
Architecture Technique : MCP Server sur Lambda
Prérequis et Configuration IAM
Installation des dépendances AWS CLI et SAM
curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "awscliv2.zip"
unzip awscliv2.zip && sudo ./aws/install
Configuration des credentials
aws configure
AWS Access Key ID: [votre clé]
AWS Secret Access Key: [votre secret]
Default region name: us-east-1
Default output format: json
Création du rôle IAM pour Lambda
aws iam create-role \
--role-name mcp-server-lambda-role \
--assume-role-policy-document '{
"Version": "2012-10-17",
"Statement": [{
"Effect": "Allow",
"Principal": {"Service": "lambda.amazonaws.com"},
"Action": "sts:AssumeRole"
}]
}'
Attachement des policies nécessaires
aws iam attach-role-policy \
--role-name mcp-server-lambda-role \
--policy-arn arn:aws:iam::aws:policy/service-role/AWSLambdaBasicExecutionRole
Structure du Projet SAM
template.yaml - AWS SAM Configuration
AWSTemplateFormatVersion: '2010-