ReAct Agent模式详解与Python实现：从Timeout到生产级应用

Es war 23:47 Uhr an einem Freitagabend, als mir mein Produktionssystem einen kritischen Fehler meldete: ConnectionError: timeout after 30s. Mein KI-Agent, der für die automatische Datenanalyse verantwortlich war, hing fest und konnte keine Anfragen mehr verarbeiten. Nach drei Stunden Debugging wurde mir klar: Ich hatte die ReAct-Agent-Architektur (Reasoning + Acting) nicht korrekt implementiert. In diesem Tutorial zeige ich Ihnen, wie Sie diesen Fehler vermeiden und eine robuste ReAct-Agent-Implementierung mit HolySheep AI aufbauen.
什么是ReAct Agent模式？

ReAct (Reasoning + Acting) ist eine Agent-Architektur, die Sprachmodelle mit der Fähigkeit ausstattet, sequentiell zu denken und zu handeln. Das Kernprinzip: Das Modell generiert nicht nur Antworten, sondern erstellt eine Kette von Gedanken, Entscheidungen und Aktionen, die es ihm ermöglicht, komplexe mehrstufige Aufgaben zu lösen.

ReAct Agent Basisarchitektur
class ReActAgent:
    def __init__(self, api_key, model="gpt-4.1"):
        self.client = OpenAI(
            api_key=api_key,
            base_url="https://api.holysheep.ai/v1"  # HolySheep AI Endpoint
        )
        self.model = model
        self.max_iterations = 10
        self.thought_history = []
    
    def think(self, state: dict) -> str:
        """Erzeugt einen Reasoning-Schritt basierend auf dem aktuellen Zustand"""
        prompt = f"""Du bist ein ReAct-Agent. Analysiere die Situation:
        
Ziel: {state['objective']}
Bisherige Aktionen: {state['actions']}
Letzte Beobachtung: {state.get('observation', 'Keine')}
Verfügbare Tools: {list(state['tools'].keys())}

Denke Schritt für Schritt und entscheide:
1. Was ist der aktuelle Stand?
2. Welche Information fehlt noch?
3. Welche Aktion soll als nächstes ausgeführt werden?

Antworte im Format:
GEDANKE: [Deine Analyse]
AKTION: [Tool-Name oder 'FINAL_ANSWER']
AKTION_INPUT: [Parameter für das Tool oder Ergebnis]
"""
        response = self.client.chat.completions.create(
            model=self.model,
            messages=[{"role": "user", "content": prompt}],
            temperature=0.3,
            max_tokens=500
        )
        return response.choices[0].message.content

完整的ReAct Agent实现

Der folgende Code zeigt eine produktionsreife ReAct-Agent-Implementierung mit integrierten Tools für Websuche, Berechnungen und Datenanalyse. Mit HolySheep AI profitieren Sie von <50ms Latenz und Kosteneinsparungen von über 85% im Vergleich zu Alternativen.


import json
import re
from typing import Dict, List, Any, Callable
from dataclasses import dataclass, field
from openai import OpenAI
import time

@dataclass
class Tool:
    name: str
    description: str
    func: Callable
    parameters: Dict[str, Any]

@dataclass
class AgentState:
    objective: str
    actions: List[str] = field(default_factory=list)
    observations: List[str] = field(default_factory=list)
    thoughts: List[str] = field(default_factory=list)
    tools: Dict[str, Tool] = field(default_factory=dict)
    max_iterations: int = 10
    result: Any = None

class HolySheepReActAgent:
    """Produktionsreife ReAct Agent Implementierung mit HolySheep AI"""
    
    def __init__(self, api_key: str, model: str = "gpt-4.1"):
        self.client = OpenAI(
            api_key=api_key,
            base_url="https://api.holysheep.ai/v1"
        )
        self.model = model
        self.state: AgentState = None
        self.cost_tracker = {"total_tokens": 0, "cost_usd": 0}
        
    def register_tool(self, name: str, description: str, 
                      func: Callable, parameters: Dict) -> None:
        """Registriert ein neues Tool für den Agenten"""
        self.state.tools[name] = Tool(
            name=name, 
            description=description, 
            func=func,
            parameters=parameters
        )
    
    def execute(self, objective: str, max_iterations: int = 10) -> Any:
        """Führt den ReAct-Agenten mit dem gegebenen Ziel aus"""
        self.state = AgentState(
            objective=objective,
            max_iterations=max_iterations
        )
        
        for iteration in range(max_iterations):
            # Phase 1: Reasoning (Gedanke)
            thought = self._think()
            self.state.thoughts.append(thought)
            
            # Phase 2: Action extrahieren
            action, action_input = self._parse_action(thought)
            
            # Phase 3: Finale Antwort
            if action == "FINAL_ANSWER":
                self.state.result = action_input
                return self.state.result
            
            # Phase 4: Action ausführen
            observation = self._act(action, action_input)
            self.state.observations.append(observation)
            self.state.actions.append(f"{action}({action_input})")
            
            # Phase 5: Beobachung speichern
            self._update_context(observation)
        
        return self.state.result or "Maximale Iterationen erreicht"
    
    def _think(self) -> str:
        """Generiert Reasoning-Ausgabe mit HolySheep AI"""
        tools_desc = "\n".join([
            f"- {name}: {tool.description}" 
            for name, tool in self.state.tools.items()
        ])
        
        prompt = f"""Du bist ein ReAct-Agent (Reasoning + Acting).

AKTUELLER KONTEXT:
Ziel: {self.state.objective}

VERFÜGBARE TOOLS:
{tools_desc}

VERLAUF:
{self._format_history()}

ANWEISUNG:
Analysiere den aktuellen Stand und entscheide die nächste Aktion.

Format:
GEDANKE: [Schritt-für-Schritt-Analyse]
AKTION: [Tool-Name oder FINAL_ANSWER]
AKTION_INPUT: [Tool-Parameter oder Endergebnis]"""

        response = self.client.chat.completions.create(
            model=self.model,
            messages=[{"role": "user", "content": prompt}],
            temperature=0.3,
            max_tokens=800
        )
        
        content = response.choices[0].message.content
        self.cost_tracker["total_tokens"] += response.usage.total_tokens
        
        # Kostenberechnung (Stand 2026)
        price_per_mtok = {
            "gpt-4.1": 8.0,        # $8/MTok
            "claude-sonnet-4.5": 15.0,  # $15/MTok
            "deepseek-v3.2": 0.42,      # $0.42/MTok
        }
        price = price_per_mtok.get(self.model, 8.0)
        self.cost_tracker["cost_usd"] += (response.usage.total_tokens / 1_000_000) * price
        
        return content
    
    def _parse_action(self, thought: str) -> tuple:
        """Extrahiert Aktion und Parameter aus der Reasoning-Ausgabe"""
        action_match = re.search(r'AKTION:\s*(\w+)', thought)
        input_match = re.search(r'AKTION_INPUT:\s*(.+)', thought, re.DOTALL)
        
        action = action_match.group(1) if action_match else "FINAL_ANSWER"
        action_input = input_match.group(1).strip() if input_match else ""
        
        return action, action_input
    
    def _act(self, action: str, action_input: str) -> str:
        """Führt die gewählte Aktion aus"""
        if action == "FINAL_ANSWER":
            return action_input
        
        if action not in self.state.tools:
            return f"FEHLER: Tool '{action}' nicht gefunden."
        
        try:
            tool = self.state.tools[action]
            result = tool.func(action_input)
            return str(result)
        except Exception as e:
            return f"FEHLER bei Ausführung von {action}: {str(e)}"
    
    def _format_history(self) -> str:
        """Formatiert den bisherigen Verlauf für den Prompt"""
        history = []
        for i, (action, obs) in enumerate(zip(self.state.actions, self.state.observations)):
            history.append(f"{i+1}. Aktion: {action}\n   Ergebnis: {obs}")
        return "\n".join(history) if history else "Noch keine Aktionen ausgeführt."
    
    def _update_context(self, observation: str) -> None:
        """Aktualisiert den internen Kontext nach jeder Iteration"""
        # Kontext wird automatisch in _think() eingebunden
    
    def get_cost_report(self) -> Dict:
        """Gibt einen Kostentracking-Bericht zurück"""
        return self.cost_tracker


Beispiel-Tools
def calculator(expression: str) -> str:
    """Berechnet mathematische Ausdrücke"""
    try:
        # Sichere Berechnung (nur erlaubte Operationen)
        allowed = set("0123456789+-*/.() ")
        if all(c in allowed for c in expression):
            result = eval(expression)
            return f"Ergebnis: {result}"
        return "FEHLER: Unerlaubte Zeichen im Ausdruck"
    except Exception as e:
        return f"FEHLER: {str(e)}"

def search_data(query: str) -> str:
    """Sucht in einer Beispieldatenbank"""
    database = {
        "umsatz 2024": "€2.5M",
        "kunden": "1,234",
        "conversions": "3.8%"
    }
    return database.get(query.lower(), f"Keine Daten für '{query}' gefunden")

Verwendung
if __name__ == "__main__":
    agent = HolySheepReActAgent(
        api_key="YOUR_HOLYSHEEP_API_KEY",
        model="deepseek-v3.2"  # $0.42/MTok - kostengünstigste Option
    )
    
    # Tools registrieren
    agent.register_tool(
        name="calculator",
        description="Berechnet mathematische Ausdrücke. Input: mathematischer Ausdruck",
        func=calculator,
        parameters={"type": "string"}
    )
    agent.register_tool(
        name="search_data",
        description="Sucht Geschäftsdaten. Input: Suchbegriff",
        func=search_data,
        parameters={"type": "string"}
    )
    
    # Agent ausführen
    result = agent.execute(
        objective="Berechne den durchschnittlichen Umsatz pro Kunde für 2024. "
                  "Der Gesamtumsatz beträgt €2.5M und es gibt 1,234 Kunden.",
        max_iterations=5
    )
    
    print(f"Ergebnis: {result}")
    print(f"Kosten: ${agent.get_cost_report()['cost_usd']:.4f}")


Erweiterte Tools und Observability

In meiner Praxiserfahrung bei HolySheep AI habe ich festgestellt, dass produktionsreife ReAct-Agenten eine robuste Observability-Schicht benötigen. Der folgende Code integriert Logging, Retry-Mechanismen und Token-Limit-Handling:


import logging
from functools import wraps
from typing import Optional
import time

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
logger = logging.getLogger("ReActAgent")

class RobustReActAgent(HolySheepReActAgent):
    """Erweiterter ReAct Agent mit Retry, Timeout und Observability"""
    
    def __init__(self, api_key: str, model: str = "deepseek-v3.2",
                 max_retries: int = 3, timeout: int = 30):
        super().__init__(api_key, model)
        self.max_retries = max_retries
        self.timeout = timeout
        self.execution_log = []
        
    def _think_with_retry(self) -> str:
        """Führt den Think-Schritt mit automatischem Retry aus"""
        for attempt in range(self.max_retries):
            try:
                logger.info(f"API-Aufruf (Versuch {attempt + 1}/{self.max_retries})")
                
                start_time = time.time()
                result = self._think()
                elapsed = (time.time() - start_time) * 1000
                
                logger.info(f"Antwort erhalten in {elapsed:.0f}ms")
                
                self.execution_log.append({
                    "timestamp": time.time(),
                    "attempt": attempt + 1,
                    "latency_ms": elapsed,
                    "success": True
                })
                
                return result
                
            except Exception as e:
                error_type = type(e).__name__
                logger.error(f"Fehler bei API-Aufruf: {error_type} - {str(e)}")
                
                self.execution_log.append({
                    "timestamp": time.time(),
                    "attempt": attempt + 1,
                    "error": str(e),
                    "success": False
                })
                
                if attempt < self.max_retries - 1:
                    wait_time = 2 ** attempt  # Exponentielles Backoff
                    logger.info(f"Retry in {wait_time}s...")
                    time.sleep(wait_time)
                else:
                    logger.critical("Maximale Retry-Versuche erreicht")
                    raise RuntimeError(f"Agent-Ausführung fehlgeschlagen nach {self.max_retries} Versuchen")
    
    def execute_with_tracing(self, objective: str) -> dict:
        """Führt den Agenten mit vollständigem Tracing aus"""
        start_time = time.time()
        
        result = self.execute(objective, max_iterations=10)
        
        total_time = time.time() - start_time
        cost_report = self.get_cost_report()
        
        trace = {
            "objective": objective,
            "result": result,
            "iterations": len(self.state.thoughts) if self.state else 0,
            "total_time_ms": total_time * 1000,
            "total_tokens": cost_report["total_tokens"],
            "total_cost_usd": cost_report["cost_usd"],
            "execution_log": self.execution_log,
            "thought_chain": self.state.thoughts if self.state else []
        }
        
        # Ausführlichen Trace loggen
        logger.info("=" * 50)
        logger.info(f"ReAct Agent Ausführung abgeschlossen:")
        logger.info(f"  - Iterationen: {trace['iterations']}")
        logger.info(f"  - Latenz: {trace['total_time_ms']:.0f}ms")
        logger.info(f"  - Kosten: ${trace['total_cost_usd']:.4f}")
        logger.info(f"  - Ergebnis: {result}")
        logger.info("=" * 50)
        
        return trace

Beispiel: Trace-Ausgabe analysieren
if __name__ == "__main__":
    agent = RobustReActAgent(
        api_key="YOUR_HOLYSHEEP_API_KEY",
        model="deepseek-v3.2"  # Nur $0.42/MTok
    )
    
    # Tool registrieren
    agent.register_tool(
        name="calculator",
        description="Berechnet mathematische Ausdrücke",
        func=calculator,
        parameters={}
    )
    
    trace = agent.execute_with_tracing(
        "Berechne: (150 + 230) * 0.75"
    )
    
    # Trace für Monitoring exportieren
    import json
    print(json.dumps(trace, indent=2, default=str))

Integration mit LangChain

Für Teams, die bereits LangChain verwenden, bietet HolySheep AI volle Kompatibilität. Die folgende Konfiguration ermöglicht nahtlose Integration:


LangChain Integration mit HolySheep AI
from langchain.agents import AgentType, initialize_agent, Tool
from langchain.chat_models import ChatOpenAI
from langchain.tools import StructuredTool
from pydantic import BaseModel

HolySheep AI als ChatOpenAI konfigurieren
llm = ChatOpenAI(
    openai_api_key="YOUR_HOLYSHEEP_API_KEY",
    openai_api_base="https://api.holysheep.ai/v1",
    model_name="claude-sonnet-4.5",  # $15/MTok für Claude-Qualität
    temperature=0.3
)

Tool-Definition mit Pydantic
class CalculatorInput(BaseModel):
    expression: str

def calculate(expression: str) -> str:
    """Führt sichere Berechnungen durch"""
    allowed = set("0123456789+-*/.() ")
    if all(c in allowed for c in expression):
        return f"Ergebnis: {eval(expression)}"
    return "Unerlaubte Zeichen erkannt"

calculator_tool = StructuredTool.from_function(
    func=calculate,
    name="calculator",
    description="Berechnet mathematische Ausdrücke",
    args_schema=CalculatorInput
)

ReAct Agent initialisieren
tools = [calculator_tool]
agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent=AgentType.STRUCTURED_CHAT_ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True,
    max_iterations=10
)

Ausführung
result = agent.run(
    "Berechne die Quadratwurzel von 144 und multipliziere das Ergebnis mit 7"
)
print(result)


Häufige Fehler und Lösungen

1. ConnectionError: timeout after 30s

Ursache: Der Standard-Timeout von 30 Sekunden ist bei ReAct-Agenten mit mehreren Iterationen zu kurz. Jede Iteration erzeugt einen API-Call, und bei Netzwerkproblemen summiert sich die Zeit schnell auf.


FEHLERHAFT: Standard-Timeout zu kurz
response = self.client.chat.completions.create(
    model=self.model,
    messages=messages,
    timeout=30  # ❌ Zu kurz für mehrstufige Agents
)

LÖSUNG: Anpassbaren Timeout mit Retry-Mechanismus
from tenacity import retry, stop_after_attempt, wait_exponential

class TimeoutReActAgent(HolySheepReActAgent):
    def __init__(self, api_key: str, model: str = "deepseek-v3.2",
                 request_timeout: int = 120, max_retries: int = 5):
        super().__init__(api_key, model)
        self.request_timeout = request_timeout
        self.max_retries = max_retries
    
    def _make_api_call_with_timeout(self, messages: list) -> dict:
        """API-Call mit konfigurierbarem Timeout und Retry"""
        
        @retry(
            stop=stop_after_attempt(3),
            wait=wait_exponential(multiplier=1, min=2, max=10)
        )
        def call():
            return self.client.chat.completions.create(
                model=self.model,
                messages=messages,
                timeout=self.request_timeout,  # ✅ 120s Timeout
                max_tokens=1000
            )
        
        return call()
    
    def _think(self) -> str:
        # ... existierende Logik ...
        response = self._make_api_call_with_timeout(messages)
        return response.choices[0].message.content
```

2. 401 Unauthorized - Ungültige API-Anmeldedaten

Ursache: Falscher API-Key oder falscher Base-URL. Viele Entwickler verwenden versehentlich den OpenAI-Standardendpunkt anstelle des HolySheep-Endpoints.


FEHLERHAFT: Falscher Endpunkt oder fehlende Validierung
client = OpenAI(
    api_key="sk-...",
    base_url="https://api.openai.com/v1"  # ❌ Falsch!
)

LÖSUNG: Validierung und korrekter Endpunkt
import os

class ValidatedReActAgent(HolySheepReActAgent):
    def __init__(self, api_key: str, model: str = "deepseek-v3.2"):
        # API-Key Validierung
        if not api_key or len(api_key) < 10:
            raise ValueError("Ungültiger API-Key. Bitte überprüfen Sie Ihren Key.")
        
        # Korrekter HolySheep-Endpunkt
        self.client = OpenAI(
            api_key=api_key,
            base_url="https://api.holysheep.ai/v1"  # ✅ Korrekt!
        )
        
        # Model-Verfügbarkeitsprüfung
        available_models = ["gpt-4.1", "claude-sonnet-4.5", "deepseek-v3.2", "gemini-2.5-flash"]
        if model not in available_models:
            raise ValueError(f"Model '{model}' nicht verfügbar. Optionen: {available_models}")
        
        super().__init__(api_key, model)
    
    def test_connection(self) -> bool:
        """Testet
Verwandte Ressourcen
📚 KI API Tutorials
💰 Preise ansehen
📖 Entwickler-Dokumentation
🚀 Kostenlos registrieren
Verwandte Artikel
日本开发者 AI API 完整指南：日元结算与合规
AI Scientist: Automatisierte Wissenschaftliche Forschung im 
AI API 错误日志分析：ELK Stack 集成教程
什么是ReAct Agent模式？

ReAct Agent Basisarchitektur

完整的ReAct Agent实现

Beispiel-Tools

Verwendung

Erweiterte Tools und Observability

Beispiel: Trace-Ausgabe analysieren

Integration mit LangChain

LangChain Integration mit HolySheep AI

HolySheep AI als ChatOpenAI konfigurieren

Tool-Definition mit Pydantic

ReAct Agent initialisieren

Ausführung

Häufige Fehler und Lösungen

1. ConnectionError: timeout after 30s

FEHLERHAFT: Standard-Timeout zu kurz

response = self.client.chat.completions.create(

model=self.model,

messages=messages,

timeout=30 # ❌ Zu kurz für mehrstufige Agents

)

LÖSUNG: Anpassbaren Timeout mit Retry-Mechanismus

2. 401 Unauthorized - Ungültige API-Anmeldedaten

FEHLERHAFT: Falscher Endpunkt oder fehlende Validierung

client = OpenAI(

api_key="sk-...",

base_url="https://api.openai.com/v1" # ❌ Falsch!

)

LÖSUNG: Validierung und korrekter Endpunkt

Verwandte Ressourcen

Verwandte Artikel

🔥 HolySheep AI ausprobieren