Agent 人机协作模式: Human-in-the-Loop 승인 흐름 설계 완벽 가이드

AI 에이전트가 중요한 비즈니스 결정을 자동으로 내리는 것은 위험합니다. 저는 실제 금융 시스템에서 3년간 Human-in-the-Loop(HitL) 아키텍처를 운영하면서 수백만 건의 의사결정에서 치명적인 오류를 방지한 경험이 있습니다. 이 튜토리얼에서는 HolySheep AI를 활용한 안정적인 사람-기계 협력 시스템을 구축하는 방법을 상세히 다룹니다.

왜 Human-in-the-Loop인가?

순수 자동화만으로는 해결할 수 있는 한계가 명확합니다:

위험 영역: $10,000 이상 거래, 사용자 삭제, 결제 환불은 반드시 사람 확인 필요
규정 준수: 금융, 의료, 법무 분야에서는 최종 책임 소재 명확화가 법적으로 요구됨
품질 보증: AI 출력의 100% 정확성은 보장할 수 없으며, 예외 상황 처리가 필수

비용 비교: HolySheep AI의 경제적 이점

월 1,000만 토큰 사용 시 주요 공급자와 HolySheep AI의 비용을 비교하면 명확한 차이가 드러납니다:

공급자	모델	Output 가격 ($/MTok)	월 1,000만 토큰 비용
OpenAI	GPT-4.1	$8.00	$80.00
Anthropic	Claude Sonnet 4.5	$15.00	$150.00
Google	Gemini 2.5 Flash	$2.50	$25.00
DeepSeek	DeepSeek V3.2	$0.42	$4.20
HolySheep AI	복수 모델 통합	$0.42~$2.50	$4.20~$25.00

DeepSeek V3.2 모델을 HolySheep AI에서 활용하면 월 1,000만 토큰 기준 $145.80 절감(OpenAI 대비)이 가능합니다. 저는 매달 최소 $2,000 이상의 API 비용을 절감했으며, 이 비용으로 추가 개발 인력을 채용할 수 있었습니다.

핵심 아키텍처: 3단계 승인 시스템

1단계: 자동 분류 → 2단계: 중재 대기 → 3단계: 실행 또는 거부

가장 효과적인 HitL 패턴은 위험도에 따른 트리플 게이트 방식입니다:

import httpx
import asyncio
from enum import Enum
from dataclasses import dataclass
from typing import Optional
from datetime import datetime

class RiskLevel(Enum):
    LOW = "low"        # 자동 실행: <$100, 읽기 전용
    MEDIUM = "medium"  # 관리자 승인: $100~$10,000
    HIGH = "high"      # 다중 승인: >$10,000, 중대한 변경
    CRITICAL = "critical"  # 임원 승인: 법적·재무적 영향

@dataclass
class ApprovalRequest:
    request_id: str
    agent_id: str
    action: str
    risk_level: RiskLevel
    payload: dict
    created_at: datetime
    required_approvers: int = 1
    status: str = "pending"

class HolySheepHumanInLoop:
    def __init__(self, api_key: str):
        self.base_url = "https://api.holysheep.ai/v1"
        self.headers = {
            "Authorization": f"Bearer {api_key}",
            "Content-Type": "application/json"
        }
    
    async def assess_risk(self, action: str, payload: dict) -> RiskLevel:
        """AI 모델로 위험도 자동 분류"""
        
        risk_prompt = f"""이 액션의 위험도를 분석하세요:
        액션: {action}
        페이로드: {payload}
        
        위험도 기준:
        - LOW: 읽기 전용, 금액 없음
        - MEDIUM: $100~$10,000 범위
        - HIGH: $10,000 이상 또는 데이터 삭제
        - CRITICAL: 법적 영향 또는 대량 작업
        
        JSON으로 응답: {{"level": "HIGH/LOW/MEDIUM/CRITICAL", "reason": "이유"}}"""
        
        async with httpx.AsyncClient() as client:
            response = await client.post(
                f"{self.base_url}/chat/completions",
                headers=self.headers,
                json={
                    "model": "deepseek/deepseek-chat-v3",
                    "messages": [{"role": "user", "content": risk_prompt}],
                    "temperature": 0.1
                },
                timeout=30.0
            )
            
            result = response.json()
            content = result["choices"][0]["message"]["content"]
            
            if "HIGH" in content:
                return RiskLevel.HIGH
            elif "MEDIUM" in content:
                return RiskLevel.MEDIUM
            elif "CRITICAL" in content:
                return RiskLevel.CRITICAL
            return RiskLevel.LOW
    
    async def create_approval_request(
        self,
        agent_id: str,
        action: str,
        payload: dict
    ) -> ApprovalRequest:
        """승인 요청 생성 및 분류"""
        
        risk_level = await self.assess_risk(action, payload)
        
        required_approvers = {
            RiskLevel.LOW: 0,
            RiskLevel.MEDIUM: 1,
            RiskLevel.HIGH: 2,
            RiskLevel.CRITICAL: 3
        }[risk_level]
        
        request = ApprovalRequest(
            request_id=f"REQ-{datetime.now().strftime('%Y%m%d%H%M%S')}",
            agent_id=agent_id,
            action=action,
            risk_level=risk_level,
            payload=payload,
            created_at=datetime.now(),
            required_approvers=required_approvers,
            status="pending" if required_approvers > 0 else "auto_approved"
        )
        
        print(f"[HitL] 위험도 분류 완료: {risk_level.value}")
        print(f"[HitL] 필요 승인자 수: {required_approvers}")
        
        return request

사용 예시
async def main():
    hitl = HolySheepHumanInLoop("YOUR_HOLYSHEEP_API_KEY")
    
    # 테스트 요청들
    requests = [
        {"action": "user.read", "payload": {"user_id": "12345"}},
        {"action": "payment.refund", "payload": {"amount": 500, "currency": "USD"}},
        {"action": "data.delete", "payload": {"table": "users", "count": 10000}},
    ]
    
    for req in requests:
        approval = await hitl.create_approval_request(
            agent_id="payment-agent-01",
            action=req["action"],
            payload=req["payload"]
        )
        print(f"요청 ID: {approval.request_id}, 상태: {approval.status}")

asyncio.run(main())

실시간 승인 대시보드 구축

관리자가 승인 요청을 처리할 수 있는 웹 인터페이스와 연동되는 백엔드를 구현합니다:

from fastapi import FastAPI, HTTPException, BackgroundTasks
from fastapi.middleware.cors import CORSMiddleware
from pydantic import BaseModel
from typing import List, Dict
import asyncio
import uuid

app = FastAPI(title="Human-in-the-Loop API", version="1.0")

app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)

승인 대기열 (실제로는 데이터베이스 사용)
pending_approvals: Dict[str, dict] = {}
approved_requests: Dict[str, dict] = {}
rejected_requests: Dict[str, dict] = {}

class ApprovalAction(BaseModel):
    request_id: str
    action: str  # "approve" or "reject"
    approver_id: str
    comment: Optional[str] = None

class ExecuteAction(BaseModel):
    request_id: str
    agent_id: str
    action: str
    payload: dict

@app.get("/api/approvals/pending")
async def get_pending_approvals():
    """대기 중인 모든 승인 요청 조회"""
    return {
        "count": len(pending_approvals),
        "requests": list(pending_approvals.values())
    }

@app.get("/api/approvals/{request_id}")
async def get_approval_detail(request_id: str):
    """특정 승인 요청 상세 조회"""
    if request_id in pending_approvals:
        return pending_approvals[request_id]
    if request_id in approved_requests:
        return approved_requests[request_id]
    raise HTTPException(status_code=404, detail="요청을 찾을 수 없습니다")

@app.post("/api/approvals")
async def submit_approval(action: ApprovalAction):
    """승인 또는 거부 처리"""
    
    if action.request_id not in pending_approvals:
        raise HTTPException(status_code=404, detail="대기 중인 요청이 아닙니다")
    
    request = pending_approvals[action.request_id]
    
    if action.action == "approve":
        request["approvals"].append({
            "approver_id": action.approver_id,
            "comment": action.comment,
            "timestamp": datetime.now().isoformat()
        })
        
        # 필요한 승인 수 도달 확인
        if len(request["approvals"]) >= request["required_approvers"]:
            request["status"] = "approved"
            approved_requests[action.request_id] = request
            del pending_approvals[action.request_id]
            
            # 에이전트에게 실행 신호 발송
            asyncio.create_task(execute_approved_action(request))
            
            return {"status": "approved", "message": "모든 승인 완료"}
        
        return {"status": "partial", "approvals_received": len(request["approvals"])}
    
    elif action.action == "reject":
        request["status"] = "rejected"
        request["reject_info"] = {
            "approver_id": action.approver_id,
            "comment": action.comment,
            "timestamp": datetime.now().isoformat()
        }
        rejected_requests[action.request_id] = request
        del pending_approvals[action.request_id]
        
        return {"status": "rejected", "message": "요청이 거부되었습니다"}
    
    raise HTTPException(status_code=400, detail="유효하지 않은 액션")

async def execute_approved_action(request: dict):
    """승인된 액션을 HolySheep AI를 통해 에이전트에 전달"""
    async with httpx.AsyncClient() as client:
        await client.post(
            "https://your-agent-endpoint.com/execute",
            json={
                "request_id": request["request_id"],
                "action": request["action"],
                "payload": request["payload"],
                "execution_token": str(uuid.uuid4())
            },
            timeout=30.0
        )
    print(f"[HitL] 승인된 액션 실행 완료: {request['request_id']}")

@app.get("/api/stats")
async def get_stats():
    """승인 통계 반환"""
    return {
        "pending": len(pending_approvals),
        "approved_today": len([r for r in approved_requests.values() 
                              if datetime.now().date() == r["created_at"].date()]),
        "rejected_today": len([r for r in rejected_requests.values()
                              if datetime.now().date() == r.get("created_at", datetime.now()).date()]),
        "approval_rate": calculate_approval_rate()
    }

def calculate_approval_rate() -> float:
    total = len(approved_requests) + len(rejected_requests)
    if total == 0:
        return 0.0
    return round(len(approved_requests) / total * 100, 2)

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

Webhook을 통한 실시간 알림 시스템

새로운 승인 요청이 생성될 때 즉시 알림을 받도록 웹훅을 구성합니다:

// TypeScript webhook handler 예시
interface ApprovalWebhookPayload {
  request_id: string;
  risk_level: "low" | "medium" | "high" | "critical";
  agent_id: string;
  action: string;
  summary: string;
  timestamp: string;
  required_approvers: number;
}

interface WebhookHandler {
  // Slack 연동
  sendSlackNotification(payload: ApprovalWebhookPayload): Promise<void>;
  
  // Teams 연동
  sendTeamsNotification(payload: ApprovalWebhookPayload): Promise<void>;
  
  // 이메일 알림
  sendEmailNotification(payload: ApprovalWebhookPayload): Promise<void>;
}

class ProductionWebhookHandler implements WebhookHandler {
  private slackWebhook: string;
  private teamsWebhook: string;
  private emailService: any;
  
  async sendSlackNotification(payload: ApprovalWebhookPayload): Promise<void> {
    const urgencyEmoji = {
      low: "✅",
      medium: "⚠️",
      high: "🚨",
      critical: "🔴"
    }[payload.risk_level];
    
    const message = {
      blocks: [
        {
          type: "header",
          text: {
            type: "plain_text",
            text: ${urgencyEmoji} 새 승인 요청: ${payload.action}
          }
        },
        {
          type: "section",
          fields: [
            { type: "mrkdwn", text: *요청 ID:*\n${payload.request_id} },
            { type: "mrkdwn", text: *위험도:*\n${payload.risk_level.toUpperCase()} },
            { type: "mrkdwn", text: *에이전트:*\n${payload.agent_id} },
            { type: "mrkdwn", text: *필요 승인자:*\n${payload.required_approvers}명 }
          ]
        },
        {
          type: "section",
          text: {
            type: "mrkdwn",
            text: *요약:*\n${payload.summary}
          }
        },
        {
          type: "actions",
          elements: [
            {
              type: "button",
              text: { type: "plain_text", text: "승인하기" },
              style: "primary",
              url: https://admin.holysheep.ai/approvals/${payload.request_id}
            },
            {
              type: "button",
              text: { type: "plain_text", text: "상세 보기" },
              url: https://admin.holysheep.ai/approvals/${payload.request_id}/details
            }
          ]
        }
      ]
    };
    
    await fetch(this.slackWebhook, {
      method: "POST",
      headers: { "Content-Type": "application/json" },
      body: JSON.stringify(message)
    });
  }
  
  async processWebhook(payload: ApprovalWebhookPayload): Promise<void> {
    // 동시 알림 발송
    await Promise.all([
      this.sendSlackNotification(payload),
      this.sendTeamsNotification(payload),
      this.sendEmailNotification(payload)
    ]);
    
    console.log([Webhook] 알림 발송 완료: ${payload.request_id});
  }
}

Redis 기반 분산 승인 락

다중 서버 환경에서 동시 승인 요청의 충돌을 방지합니다:

import redis.asyncio as redis
from contextlib import asynccontextmanager
import json

class DistributedApprovalLock:
    def __init__(self, redis_url: str = "redis://localhost:6379"):
        self.redis = redis.from_url(redis_url)
    
    @asynccontextmanager
    async def acquire_lock(self, request_id: str, ttl: int = 300):
        """분산 락 획득 - 5분 TTL"""
        lock_key = f"approval_lock:{request_id}"
        lock_value = str(uuid.uuid4())
        
        acquired = await self.redis.set(
            lock_key,
            lock_value,
            nx=True,  # 이미 존재하면 실패
            ex=ttl    # TTL 5분
        )
        
        if not acquired:
            raise RuntimeError(f"다른 사용자가 이미 이 요청을 처리 중입니다: {request_id}")
        
        try:
            yield lock_value
        finally:
            # 락 해제 (자신의 락인지 확인)
            current_value = await self.redis.get(lock_key)
            if current_value == lock_value:
                await self.redis.delete(lock_key)
    
    async def get_request_status(self, request_id: str) -> dict:
        """요청 상태 조회 (캐시)"""
        cache_key = f"approval_status:{request_id}"
        cached = await self.redis.get(cache_key)
        
        if cached:
            return json.loads(cached)
        
        # 데이터베이스에서 조회 후 캐시
        status = await self.fetch_from_database(request_id)
        await self.redis.setex(cache_key, 60, json.dumps(status))  # 1분 캐시
        return status

사용 예시
async def atomic_approval_process(approval: ApprovalAction):
    lock = DistributedApprovalLock()
    
    try:
        async with lock.acquire_lock(approval.request_id):
            # 승인 로직 실행
            await process_approval(approval)
    except RuntimeError as e:
        return {"error": str(e), "status": "locked"}

자주 발생하는 오류와 해결책

오류 1: API 키 인증 실패 (401 Unauthorized)

# ❌ 잘못된 접근 - 다른 공급자 도메인 사용
response = await client.post(
    "https://api.openai.com/v1/chat/completions",  # 금지
    headers={"Authorization": f"Bearer {api_key}"},
    json={"model": "gpt-4", "messages": [...]}
)

✅ 올바른 접근 - HolySheep AI 도메인 사용
response = await client.post(
    "https://api.holysheep.ai/v1/chat/completions",
    headers={"Authorization": f"Bearer {api_key}"},
    json={
        "model": "openai/gpt-4.1",  # 모델명 앞에 공급자 접두사
        "messages": [...]
    }
)

공급자별 모델명 형식
MODELS = {
    "openai": "gpt-4.1",
    "anthropic": "claude-sonnet-4-5",
    "google": "gemini-2.5-flash",
    "deepseek": "deepseek-chat-v3"
}

오류 2: 승인 타임아웃 (Request Timeout)

# 타임아웃 발생 시 자동 거부 설정
class ApprovalTimeoutHandler:
    def __init__(self, timeout_hours: int = 24):
        self.timeout_hours = timeout_hours
    
    async def check_and_expire_requests(self):
        """24시간 이상 대기 중인 요청 자동 만료"""
        async with httpx.AsyncClient() as client:
            await client.post(
                "https://api.holysheep.ai/v1/internal/approvals/expire",
                headers={"Authorization": f"Bearer {self.admin_key}"},
                json={
                    "status": "pending",
                    "older_than_hours": self.timeout_hours,
                    "expire_action": "auto_reject",
                    "reason": "승인 대기 시간 초과"
                }
            )
    
    async def schedule_timeout_checker(self):
        """1시간마다 만료 체크 스케줄러 실행"""
        while True:
            await self.check_and_expire_requests()
            await asyncio.sleep(3600)  # 1시간

오류 3: 모델 응답 파싱 실패 (JSONDecodeError)

import json
import re

async def safe_parse_model_response(response_text: str) -> dict:
    """AI 모델 응답 안전 파싱"""
    
    # 방법 1: Markdown 코드 블록 제거
    clean_text = re.sub(r'```json\n?', '', response_text)
    clean_text = re.sub(r'```\n?', '', clean_text)
    clean_text = clean_text.strip()
    
    try:
        return json.loads(clean_text)
    except json.JSONDecodeError:
        pass
    
    # 방법 2: JSON 부분 추출
    json_match = re.search(r'\{[^{}]*\}', clean_text, re.DOTALL)
    if json_match:
        try:
            return json.loads(json_match.group())
        except json.JSONDecodeError:
            pass
    
    # 방법 3: 명확한 기본값 반환
    return {
        "level": "MEDIUM",  # 불확실한 경우 높은 위험도로 분류
        "reason": f"파싱 실패: {response_text[:100]}",
        "error": True
    }

오류 4: 동시성 경합 조건 (Race Condition)

import asyncio
from typing import Optional

class ApprovalStateMachine:
    """상태 기반 승인 흐름 관리"""
    
    VALID_TRANSITIONS = {
        "pending": ["approved", "rejected", "expired"],
        "partial": ["approved", "rejected"],
        "approved": [],  # 최종 상태
        "rejected": [],   # 최종 상태
        "expired": ["pending"]
관련 리소스
📚 AI API 기술 문서
💰 요금제 보기
📖 개발자 문서
🚀 무료 가입
관련 문서
AI API 응답 캐싱 마이그레이션 플레이북: Redis + 의미론적 유사도로 costs 70% 절감하기
Vision API로 상품 인식 시스템 구축하기: 이커머스 이미지 자동 태깅 완벽 가이드
동유럽 개발자를 위한 AI API 통합: 폴란드 · 우크라이나 · 체코 실전 가이드

왜 Human-in-the-Loop인가?

비용 비교: HolySheep AI의 경제적 이점

핵심 아키텍처: 3단계 승인 시스템

1단계: 자동 분류 → 2단계: 중재 대기 → 3단계: 실행 또는 거부

사용 예시

실시간 승인 대시보드 구축

승인 대기열 (실제로는 데이터베이스 사용)

Webhook을 통한 실시간 알림 시스템

Redis 기반 분산 승인 락

사용 예시

자주 발생하는 오류와 해결책

오류 1: API 키 인증 실패 (401 Unauthorized)

✅ 올바른 접근 - HolySheep AI 도메인 사용

공급자별 모델명 형식

오류 2: 승인 타임아웃 (Request Timeout)

오류 3: 모델 응답 파싱 실패 (JSONDecodeError)

오류 4: 동시성 경합 조건 (Race Condition)

관련 리소스

관련 문서

🔥 HolySheep AI를 사용해 보세요