Prometheus + Grafana: AI API-Aufrufe überwachen — Komplettanleitung für Einsteiger

Sie nutzen eine KI-API und möchten endlich durchschauen, wie viele Anfragen Sie senden, wie schnell die Antworten zurückkommen und was das Ganze kostet? Dann sind Sie hier genau richtig. In diesem Tutorial zeige ich Ihnen Schritt für Schritt, wie Sie mit zwei kostenlosen Werkzeugen — Prometheus und Grafana — Ihre AI API-Nutzung professionell überwachen können. Kein Vorwissen nötig.

Was ist Prometheus und Grafana?

Bevor wir starten, klären wir kurz, was diese beiden Werkzeuge eigentlich machen:

Prometheus sammelt Zahlen und Daten von Ihrem System. Es ist wie ein fleißiger Datensammler, der regelmäßig vorbeischaut und aufschreibt: „Wie viele Anfragen wurden gesendet? Wie lange dauerte die Antwort?"
Grafana macht aus diesen Zahlen hübsche Diagramme. Stellen Sie sich Grafana wie einen Fotografen vor, der aus den Rohdaten von Prometheus anschauliche Bilder zaubert.

Warum ist Monitoring für KI-APIs wichtig?

Wenn Sie eine AI API wie HolySheep AI nutzen, möchten Sie bestimmt wissen:

Wie viele Anfragen habe ich heute gesendet?
Wie schnell antwortet die API im Durchschnitt?
Wie verteilen sich meine Anfragen auf verschiedene Modelle?
Wie hoch sind meine monatlichen Kosten?

Ohne Monitoring arbeiten Sie blind. Mit Prometheus und Grafana haben Sie alles im Blick. Und das Beste: Beide Tools sind kostenlos und lassen sich auf jedem Computer installieren.

Voraussetzungen

Einen Computer mit Linux, macOS oder Windows
Grundlegende Kenntnisse im Umgang mit dem Terminal (Kommandozeile)
Eine API von HolySheep AI (Sie erhalten Ihren Schlüssel nach der Registrierung)
Docker (optional, aber empfohlen für einfache Installation)

Schritt 1: Prometheus installieren

Prometheus ist das Herzstück unserer Überwachung. So installieren Sie es:

Methode A: Mit Docker (empfohlen für Anfänger)

# Erstellen Sie eine Konfigurationsdatei namens prometheus.yml
cat > prometheus.yml << 'EOF'
global:
  scrape_interval: 15s

scrape_configs:
  - job_name: 'ai-api-metrics'
    static_configs:
      - targets: ['localhost:9090']
EOF

Starten Sie Prometheus mit Docker
docker run -d \
  --name prometheus \
  -p 9090:9090 \
  -v $(pwd)/prometheus.yml:/etc/prometheus/prometheus.yml \
  prom/prometheus

Methode B: Direkte Installation

# Laden Sie Prometheus herunter (Beispiel für Linux)
wget https://github.com/prometheus/prometheus/releases/download/v2.45.0/prometheus-2.45.0.linux-amd64.tar.gz
tar xvfz prometheus-2.45.0.linux-amd64.tar.gz
cd prometheus-2.45.0.linux-amd64

Starten Sie Prometheus
./prometheus --config.file=prometheus.yml

Nach dem Start öffnen Sie Ihren Browser und geben Sie http://localhost:9090 ein. Sie sehen die Prometheus-Oberfläche.

Schritt 2: Grafana installieren

Grafana macht Ihre Daten sichtbar. So richten Sie es ein:

# Starten Sie Grafana mit Docker
docker run -d \
  --name grafana \
  -p 3000:3000 \
  grafana/grafana

Standard-Anmeldung:
Benutzername: admin
Passwort: admin
(Ändern Sie das Passwort nach dem ersten Login!)

Öffnen Sie anschließend http://localhost:3000 in Ihrem Browser. Melden Sie sich mit admin/admin an.

Schritt 3: Prometheus als Datenquelle in Grafana einrichten

Klicken Sie in Grafana auf das Zahnrad-Symbol (Konfiguration)
Wählen Sie Data Sources
Klicken Sie auf Add data source
Wählen Sie Prometheus
Geben Sie als URL ein: http://localhost:9090
Klicken Sie auf Save & Test

Screenshot-Hinweis: In Grafana sollte nach erfolgreicher Verbindung die Meldung „Data source is working" erscheinen.

Schritt 4: Metriken von der HolySheep AI API abrufen

Nun erstellen wir ein Python-Skript, das Ihre API-Aufrufe an HolySheep misst und an Prometheus sendet:

import requests
import time
from prometheus_client import Counter, Histogram, start_http_server

Prometheus Metriken definieren
request_counter = Counter('ai_api_requests_total', 'Gesamtzahl der API-Anfragen', ['model', 'status'])
request_duration = Histogram('ai_api_request_duration_seconds', 'Anfragedauer in Sekunden', ['model'])
token_counter = Counter('ai_api_tokens_total', 'Gesamtzahl der verwendeten Tokens', ['model', 'type'])

HolySheep API Konfiguration
BASE_URL = "https://api.holysheep.ai/v1"
API_KEY = "YOUR_HOLYSHEEP_API_KEY"  # Ersetzen Sie mit Ihrem echten Schlüssel

def send_ai_request(prompt, model="gpt-4.1"):
    """Sendet eine Anfrage an die HolySheep AI API und misst Metriken."""
    
    headers = {
        "Authorization": f"Bearer {API_KEY}",
        "Content-Type": "application/json"
    }
    
    data = {
        "model": model,
        "messages": [{"role": "user", "content": prompt}]
    }
    
    start_time = time.time()
    
    try:
        response = requests.post(f"{BASE_URL}/chat/completions", headers=headers, json=data, timeout=30)
        duration = time.time() - start_time
        
        if response.status_code == 200:
            result = response.json()
            request_counter.labels(model=model, status="success").inc()
            request_duration.labels(model=model).observe(duration)
            
            # Tokens zählen
            usage = result.get("usage", {})
            token_counter.labels(model=model, type="prompt").inc(usage.get("prompt_tokens", 0))
            token_counter.labels(model=model, type="completion").inc(usage.get("completion_tokens", 0))
            
            return result
        else:
            request_counter.labels(model=model, status="error").inc()
            return None
            
    except Exception as e:
        request_counter.labels(model=model, status="error").inc()
        print(f"Fehler: {e}")
        return None

if __name__ == "__main__":
    # Starte den Prometheus Metrics Server auf Port 9090
    start_http_server(9091)
    print("Metrik-Server gestartet auf Port 9091")
    
    # Beispielanfragen senden
    test_prompts = [
        "Erkläre mir Fotovoltaik einfach",
        "Was ist maschinelles Lernen?",
        "Schreibe ein kurzes Gedicht über die Sonne"
    ]
    
    for prompt in test_prompts:
        send_ai_request(prompt, model="gpt-4.1")
        time.sleep(1)

Wichtiger Hinweis: Ersetzen Sie YOUR_HOLYSHEEP_API_KEY durch Ihren echten API-Schlüssel, den Sie nach der Registrierung bei HolySheep AI erhalten.

Schritt 5: Prometheus mit Ihrem Skript verbinden

Aktualisieren Sie Ihre prometheus.yml, damit Prometheus auch die Metriken Ihres Python-Skripts abruft:

global:
  scrape_interval: 15s

scrape_configs:
  # Abrufen der Prometheus-Metriken selbst
  - job_name: 'prometheus'
    static_configs:
      - targets: ['localhost:9090']
  
  # Abrufen der Metriken von Ihrem Python-Skript
  - job_name: 'ai-api-metrics'
    static_configs:
      - targets: ['localhost:9091']
    scrape_interval: 5s

# Starten Sie Ihr Python-Skript
python3 metrics_collector.py

In einem neuen Terminal: Prometheus neu starten
docker stop prometheus
docker rm prometheus
docker run -d \
  --name prometheus \
  -p 9090:9090 \
  -v $(pwd)/prometheus.yml:/etc/prometheus/prometheus.yml \
  prom/prometheus

Schritt 6: Dashboards in Grafana erstellen

Jetzt wird es spannend! Wir erstellen anschauliche Diagramme:

In Grafana klicken Sie auf das +-Symbol und wählen Dashboard
Klicken Sie auf Add new panel
Fügen Sie folgende Abfragen hinzu:

Diagramm 1: Gesamtzahl der Anfragen

# Prometheus Query für Anfragen pro Modell
sum by (model) (rate(ai_api_requests_total[5m]))

Diagramm 2: Durchschnittliche Antwortzeit

# Prometheus Query für Antwortzeit
histogram_quantile(0.95, rate(ai_api_request_duration_seconds_bucket[5m]))

Diagramm 3: Token-Verbrauch

# Prometheus Query für Token-Verbrauch
sum by (model, type) (rate(ai_api_tokens_total[1h]))

Screenshot-Hinweis: In Grafana können Sie unter „Visualization" den Diagrammtyp wählen (z.B. Time series, Bar chart, Pie chart). Für Anfragen eignet sich „Time series", für Token „Pie chart".

Bonus: Kostenanalyse mit Grafana

Mit HolySheep AI sparen Sie bis zu 85% gegenüber anderen Anbietern. So berechnen Sie Ihre Kosten:

# Berechnung der monatlichen Kosten basierend auf Token-Verbrauch

Annahmen für verschiedene Modelle (Preise 2026 pro Million Tokens):
MODELL_PREISE = {
    "gpt-4.1": 8.00,           # $8 pro Million Tokens
    "claude-sonnet-4.5": 15.00, # $15 pro Million Tokens
    "gemini-2.5-flash": 2.50,   # $2.50 pro Million Tokens
    "deepseek-v3.2": 0.42       # $0.42 pro Million Tokens
}

Funktion zur Kostenberechnung
def berechne_kosten(token_count, model):
    kosten_pro_million = MODELL_PREISE.get(model, 8.00)
    kosten = (token_count / 1_000_000) * kosten_pro_million
    return round(kosten, 2)

Beispiel: 500.000 Tokens mit GPT-4.1
print(f"Geschätzte Kosten: ${berechne_kosten(500000, 'gpt-4.1')}")
Ausgabe: Geschätzte Kosten: $4.00

Mit HolySheep AI kostet dieselbe Token-Menge nur einen Bruchteil. Der Wechselkurs von ¥1 zu $1 macht HolySheep besonders attraktiv für Entwickler weltweit.

Häufige Fehler und Lösungen

1. Fehler: „Connection refused" in Prometheus

Problem: Prometheus kann Ihren Metrics-Endpunkt nicht erreichen.

Lösung: Überprüfen Sie, ob Ihr Python-Skript läuft. Führen Sie curl http://localhost:9091/metrics aus. Wenn Sie eine Fehlermeldung sehen, starten Sie das Skript neu mit python3 metrics_collector.py.

2. Fehler: „Timeout" bei API-Anfragen

Problem: Die Anfrage an HolySheep AI dauert zu lange oder schlägt fehl.

Lösung: Prüfen Sie Ihre Internetverbindung. HolySheep AI bietet <50ms Latenz, aber bei langsamen Verbindungen kann es zu Timeouts kommen. Erhöhen Sie den timeout-Wert im Skript auf 60 Sekunden.

3. Fehler: „401 Unauthorized" von der API

Problem: Ihr API-Schlüssel ist ungültig oder abgelaufen.

Lösung: Melden Sie sich bei HolySheep AI an und überprüfen Sie Ihren API-Schlüssel im Dashboard. Stellen Sie sicher, dass Sie Bearer YOUR_HOLYSHEEP_API_KEY korrekt in den Header geschrieben haben.

4. Fehler: Keine Daten in Grafana-Diagrammen

Problem: Die Diagramme bleiben leer, obwohl Anfragen gesendet wurden.

Lösung: Überprüfen Sie in Prometheus unter „Status > Targets", ob alle Ziele als „UP" angezeigt werden. Wenn nicht, klicken Sie auf das Ziel und sehen Sie sich die Fehlermeldung an. Oft hilft ein Neustart von Prometheus.

5. Fehler: „Module not found" beim Python-Skript

Problem: Fehlende Python-Bibliotheken.

Lösung: Installieren Sie die benötigten Pakete:

pip install requests prometheus_client

Zusammenfassung

Sie haben gelernt, wie Sie:

Prometheus und Grafana installieren und konfigurieren
Ein Python-Skript erstellen, das API-Metriken sammelt
Ihre HolySheep AI API-Aufrufe überwachen
Anschauliche Dashboards in Grafana erstellen
Häufige Fehler selbst beheben

Mit diesem Setup haben Sie Ihre AI API-Nutzung vollständig im Griff. Sie sehen auf einen Blick, wie viele Anfragen Sie senden, wie schnell die Antworten kommen und wie viele Tokens

Prometheus + Grafana: AI API-Aufrufe überwachen — Komplettanleitung für Einsteiger

Was ist Prometheus und Grafana?

Warum ist Monitoring für KI-APIs wichtig?

Voraussetzungen

Schritt 1: Prometheus installieren

Methode A: Mit Docker (empfohlen für Anfänger)

Starten Sie Prometheus mit Docker

Methode B: Direkte Installation

Starten Sie Prometheus

Schritt 2: Grafana installieren

Standard-Anmeldung:

Benutzername: admin

Passwort: admin

`(Ändern Sie das Passwort nach dem ersten Login!)`

Schritt 3: Prometheus als Datenquelle in Grafana einrichten

Schritt 4: Metriken von der HolySheep AI API abrufen

Prometheus Metriken definieren

HolySheep API Konfiguration

Schritt 5: Prometheus mit Ihrem Skript verbinden

In einem neuen Terminal: Prometheus neu starten

Schritt 6: Dashboards in Grafana erstellen

Diagramm 1: Gesamtzahl der Anfragen

Diagramm 2: Durchschnittliche Antwortzeit

Diagramm 3: Token-Verbrauch

Bonus: Kostenanalyse mit Grafana

Annahmen für verschiedene Modelle (Preise 2026 pro Million Tokens):

Funktion zur Kostenberechnung

Beispiel: 500.000 Tokens mit GPT-4.1

`Ausgabe: Geschätzte Kosten: $4.00`

Häufige Fehler und Lösungen

1. Fehler: „Connection refused" in Prometheus

2. Fehler: „Timeout" bei API-Anfragen

3. Fehler: „401 Unauthorized" von der API

4. Fehler: Keine Daten in Grafana-Diagrammen

5. Fehler: „Module not found" beim Python-Skript

Zusammenfassung

Verwandte Ressourcen

Verwandte Artikel

Was ist Prometheus und Grafana?

Warum ist Monitoring für KI-APIs wichtig?

Voraussetzungen

Schritt 1: Prometheus installieren

Methode A: Mit Docker (empfohlen für Anfänger)

Starten Sie Prometheus mit Docker

Methode B: Direkte Installation

Starten Sie Prometheus

Schritt 2: Grafana installieren

Standard-Anmeldung:

Benutzername: admin

Passwort: admin

(Ändern Sie das Passwort nach dem ersten Login!)

Schritt 3: Prometheus als Datenquelle in Grafana einrichten

Schritt 4: Metriken von der HolySheep AI API abrufen

Prometheus Metriken definieren

HolySheep API Konfiguration

Schritt 5: Prometheus mit Ihrem Skript verbinden

In einem neuen Terminal: Prometheus neu starten

Schritt 6: Dashboards in Grafana erstellen

Diagramm 1: Gesamtzahl der Anfragen

Diagramm 2: Durchschnittliche Antwortzeit

Diagramm 3: Token-Verbrauch

Bonus: Kostenanalyse mit Grafana

Annahmen für verschiedene Modelle (Preise 2026 pro Million Tokens):

Funktion zur Kostenberechnung

Beispiel: 500.000 Tokens mit GPT-4.1

Ausgabe: Geschätzte Kosten: $4.00

Häufige Fehler und Lösungen

1. Fehler: „Connection refused" in Prometheus

2. Fehler: „Timeout" bei API-Anfragen

3. Fehler: „401 Unauthorized" von der API

4. Fehler: Keine Daten in Grafana-Diagrammen

5. Fehler: „Module not found" beim Python-Skript

Zusammenfassung

Verwandte Ressourcen

Verwandte Artikel

🔥 HolySheep AI ausprobieren

`(Ändern Sie das Passwort nach dem ersten Login!)`

`Ausgabe: Geschätzte Kosten: $4.00`