Perplexity Online API: การค้นหาแบบเรียลไทม์เพื่อเพิ่มพลังให้ LLM

บทนำ: ปัญหาจริงที่ผมเจอ

ผมเคยเจอสถานการณ์ที่ทำให้หน้าผากเปียกชื้น — ระบบแชทบอทที่ผมพัฒนาให้ลูกค้าบริษัทล้มเหลวเพราะข้อมูลล้าสมัย ลูกค้าถามเรื่องราคา iPhone 16 ที่เพิ่งเปิดตัว แต่ AI ตอบราคา iPhone 15 ที่ผิดไป 15,000 บาท สุดท้ายลูกค้าตัดสินใจไม่ซื้อ และผมก็เสียโอกาสทางธุรกิจไป

ConnectionError: HTTPSConnectionPool(host='api.perplexity.ai', port=443): 
Max retries exceeded with url: /v1/chat/completions 
(Caused by NewConnectionError(': Failed to establish a new connection: [Errno -2] Name or 
service not known'))

ปัญหาคือ API ของ Perplexity ในบางภูมิภาคเข้าถึงได้ยาก และต้นทุนก็สูงมาก — ราคา $5/ล้านโทเค็น ทำให้โปรเจกต์เล็กๆ ไม่คุ้มค่า จนผมได้ลองใช้ HolySheep AI แทน ผลลัพธ์คือ Latency ต่ำกว่า 50ms และประหยัดค่าใช้จ่ายไปถึง 85% เมื่อเทียบกับ API เดิม

ทำไมต้องใช้ Real-time Search กับ LLM

LLM ทั่วไปมีข้อจำกัดเรื่อง Knowledge Cutoff คือข้อมูลจะหยุดอัปเดต ณ วันที่ฝึกสอน เช่น ถ้าโมเดลถูกฝึกเมื่อเดือนเมษายน 2024 มันจะไม่รู้เหตุการณ์หลังจากนั้น Real-time Search API ช่วยแก้ปัญหานี้โดยการดึงข้อมูลล่าสุดจากอินเทอร์เน็ตมาประกอบคำตอบ

การทำงานของ RAG (Retrieval Augmented Generation):
1. User ส่งคำถาม → "ราคาหุ้น NVIDIA วันนี้เท่าไหร่?"
2. เรียก Search API ดึงข้อมูลล่าสุดจากเว็บ
3. นำผลลัพธ์ + คำถาม ส่งให้ LLM สร้างคำตอบ
4. LLM ตอบได้ถูกต้องแม่นยำ + มีข้อมูลปัจจุบัน

การตั้งค่า Environment และการติดตั้ง Dependencies

# สร้าง Virtual Environment (แนะนำให้แยก project)
python -m venv perplexity_env
source perplexity_env/bin/activate  # Linux/Mac
perplexity_env\Scripts\activate   # Windows

ติดตั้ง OpenAI SDK (compatible กับ Perplexity-style API)
pip install openai httpx python-dotenv aiohttp

สร้างไฟล์ .env เพื่อเก็บ API Key อย่างปลอดภัย:

# ไฟล์ .env
⚠️ อย่า commit ไฟล์นี้ขึ้น GitHub!
PERPLEXITY_API_KEY=YOUR_HOLYSHEEP_API_KEY
BASE_URL=https://api.holysheep.ai/v1

ตั้งค่า timeout และ retry
REQUEST_TIMEOUT=30
MAX_RETRIES=3

โค้ดหลัก: การเชื่อมต่อและใช้งาน Real-time Search

import os
from openai import OpenAI
from dotenv import load_dotenv

โหลด environment variables
load_dotenv()

สร้าง client เชื่อมต่อ HolySheep API
client = OpenAI(
    api_key=os.getenv("PERPLEXITY_API_KEY"),
    base_url="https://api.holysheep.ai/v1",  # บังคับตามที่กำหนด
    timeout=30.0,
    max_retries=3
)

def search_with_perplexity(query: str) -> dict:
    """
    ค้นหาข้อมูลแบบเรียลไทม์ผ่าน Sonar Model
    ราคา: $0.003/1K tokens (ประหยัดมากเมื่อเทียบกับที่อื่น)
    """
    try:
        response = client.chat.completions.create(
            model="sonar",  # Model สำหรับ real-time search
            messages=[
                {
                    "role": "system", 
                    "content": "คุณเป็นผู้ช่วยค้นหาข้อมูล 
                    ให้ตอบเป็นภาษาไทย พร้อมอ้างอิงแหล่งที่มา"
                },
                {
                    "role": "user", 
                    "content": query
                }
            ],
            temperature=0.3,  # ค่าต่ำ = ตอบแม่นยำ ไม่สร้างสรรค์เกินไป
            max_tokens=1000
        )
        
        return {
            "answer": response.choices[0].message.content,
            "model": response.model,
            "usage": {
                "prompt_tokens": response.usage.prompt_tokens,
                "completion_tokens": response.usage.completion_tokens,
                "total_tokens": response.usage.total_tokens
            },
            "citations": getattr(response, 'citations', [])
        }
        
    except Exception as e:
        return {"error": str(e), "error_type": type(e).__name__}

ทดสอบการค้นหา
if __name__ == "__main__":
    result = search_with_perplexity(
        "ราคาทองคำวันนี้更新ล่าสุดเท่าไหร่?"
    )
    print(result)

Advanced: Streaming Response สำหรับ UX ที่ดี

import streamlit as st
from openai import OpenAI
import os
from dotenv import load_dotenv

load_dotenv()

client = OpenAI(
    api_key=os.getenv("PERPLEXITY_API_KEY"),
    base_url="https://api.holysheep.ai/v1"
)

def stream_search_response(query: str):
    """
    Streaming response ให้ผู้ใช้เห็นคำตอบทีละส่วน
    ลด perceived latency + เพิ่ม engagement
    """
    stream = client.chat.completions.create(
        model="sonar",
        messages=[
            {"role": "system", "content": "ตอบกลับเป็นภาษาไทย กระชับ เข้าใจง่าย"},
            {"role": "user", "content": query}
        ],
        stream=True,  # เปิด streaming mode
        temperature=0.2
    )
    
    for chunk in stream:
        if chunk.choices[0].delta.content:
            yield chunk.choices[0].delta.content

ตัวอย่างใช้กับ Streamlit
st.title("🔍 Real-time Search Chatbot")
user_input = st.text_input("ถามอะไรก็ได้:")

if user_input:
    st.write_stream(stream_search_response(user_input))

ราคาของ Sonar (Real-time Search) อยู่ที่ $0.003/1K tokens ซึ่งถูกกว่า GPT-4.1 ที่ $8/MTok ถึง 2,666 เท่า และถูกกว่า Claude Sonnet 4.5 ($15/MTok) ถึง 5,000 เท่า ทำให้เหมาะกับแอปพลิเคชันที่ต้องค้นหาบ่อยๆ

โค้ดเต็ม: RAG Pipeline สำหรับ Enterprise Chatbot

import os
import json
from datetime import datetime
from openai import OpenAI
from dotenv import load_dotenv

load_dotenv()

class PerplexityRAG:
    """
    RAG Pipeline สำหรับ Enterprise Chatbot
    รองรับ: Real-time search + Context preservation
    """
    
    def __init__(self):
        self.client = OpenAI(
            api_key=os.getenv("PERPLEXITY_API_KEY"),
            base_url="https://api.holysheep.ai/v1"
        )
        self.conversation_history = []
        self.MAX_HISTORY = 10  # เก็บประวัติ 10 รอบ
        
    def add_to_history(self, role: str, content: str):
        """เพิ่มข้อความลงในประวัติการสนทนา"""
        self.conversation_history.append({
            "role": role, 
            "content": content,
            "timestamp": datetime.now().isoformat()
        })
        # ลบข้อความเก่าออกถ้าเกิน MAX_HISTORY
        if len(self.conversation_history) > self.MAX_HISTORY:
            self.conversation_history.pop(0)
    
    def search_and_answer(self, query: str, use_web_search: bool = True):
        """
        ค้นหา + ตอบ ในขั้นตอนเดียว
        use_web_search=True → ใช้ Sonar (Real-time)
        use_web_search=False → ใช้โมเดล LLM ปกติ
        """
        # เพิ่มคำถามลงประวัติ
        self.add_to_history("user", query)
        
        # เตรียม system prompt
        system_prompt = """คุณเป็น AI ผู้ช่วยที่ทันสมัย
- ถ้าคำถามต้องการข้อมูลปัจจุบัน ให้ค้นหาจากเว็บก่อน
- ตอบเป็นภาษาไทย สุภาพ เข้าใจง่าย
- ถ้าไม่แน่ใจ ให้บอกว่าไม่รู้ อย่าแต่งขึ้นมา
- อ้างอิงแหล่งที่มาเมื่อเป็นข้อเท็จจริง"""
        
        # เตรียม messages รวมประวัติ
        messages = [{"role": "system", "content": system_prompt}]
        messages.extend(self.conversation_history[:-1])  # ยกเว้นคำถามล่าสุด
        
        # เลือกโมเดลตาม task
        model = "sonar" if use_web_search else "gpt-4.1"
        
        try:
            response = self.client.chat.completions.create(
                model=model,
                messages=messages,
                temperature=0.3 if use_web_search else 0.7,
                max_tokens=2000
            )
            
            answer = response.choices[0].message.content
            self.add_to_history("assistant", answer)
            
            return {
                "answer": answer,
                "model_used": model,
                "tokens_used": response.usage.total_tokens,
                "cost_estimate": self._estimate_cost(response.usage, model)
            }
            
        except Exception as e:
            return {"error": str(e), "success": False}
    
    def _estimate_cost(self, usage, model):
        """ประมาณค่าใช้จ่าย (USD)"""
        prices = {
            "sonar": 0.003 / 1000,      # $0.003/1K tokens
            "gpt-4.1": 8 / 1_000_000,  # $8/1M tokens
        }
        price = prices.get(model, 0)
        return round(usage.total_tokens * price, 6)
    
    def clear_history(self):
        """ล้างประวัติการสนทนา"""
        self.conversation_history = []

ใช้งาน
if __name__ == "__main__":
    rag = PerplexityRAG()
    
    # ถามคำถามที่ต้องการข้อมูล real-time
    result = rag.search_and_answer(
        "อัตราแลกเปลี่ยน USD ต่อ THB วันนี้เท่าไหร่?",
        use_web_search=True
    )
    
    print(f"คำตอบ: {result['answer']}")
    print(f"โมเดล: {result['model_used']}")
    print(f"Tokens ที่ใช้: {result['tokens_used']}")
    print(f"ค่าใช้จ่าย: ${result['cost_estimate']}")

การติดตั้งบน Production: Docker + Environment Variables

# Dockerfile
FROM python:3.11-slim

WORKDIR /app

ติดตั้ง dependencies
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

คัดลอกโค้ด
COPY . .

ตั้งค่า environment (ใส่ใน docker-compose จะดีกว่า)
ENV PYTHONUNBUFFERED=1
ENV BASE_URL=https://api.holysheep.ai/v1

EXPOSE 8501

รัน Streamlit
CMD ["streamlit", "run", "app.py", "--server.port", "8501", "--server.address", "0.0.0.0"]

# docker-compose.yml
version: '3.8'

services:
  rag-chatbot:
    build: .
    ports:
      - "8501:8501"
    environment:
      - PERPLEXITY_API_KEY=${PERPLEXITY_API_KEY}
      - BASE_URL=https://api.holysheep.ai/v1
      - REQUEST_TIMEOUT=30
      - MAX_RETRIES=3
    restart: unless-stopped
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8501"]
      interval: 30s
      timeout: 10s
      retries: 3

ข้อผิดพลาดที่พบบ่อยและวิธีแก้ไข

1. 401 Unauthorized — Invalid API Key

สาเหตุ: API Key ไม่ถูกต้องหรือหมดอายุ หรือใส่ base_url ผิด

# ❌ วิธีที่ผิด — จะได้ 401 ทันท
แหล่งข้อมูลที่เกี่ยวข้อง
📚 บทช่วยสอน AI API
💰 ดูราคา
📖 เอกสารสำหรับนักพัฒนา
🚀 สมัครฟรี
บทความที่เกี่ยวข้อง
ระบบตรวจสอบแบบเรียลไทม์พร้อมการผสานรวม AI API สำหรับการตรวจจ
ระบบจดจำและตอบสนองอารมณ์ NPC ในเกมด้วย AI ฉบับสมบูรณ์
ใช้ Claude API วิเคราะห์ภาพทางการแพทย์และสร้างคำแนะนำการวินิ

บทนำ: ปัญหาจริงที่ผมเจอ

ทำไมต้องใช้ Real-time Search กับ LLM

การตั้งค่า Environment และการติดตั้ง Dependencies

perplexity_env\Scripts\activate # Windows

ติดตั้ง OpenAI SDK (compatible กับ Perplexity-style API)

⚠️ อย่า commit ไฟล์นี้ขึ้น GitHub!

ตั้งค่า timeout และ retry

โค้ดหลัก: การเชื่อมต่อและใช้งาน Real-time Search

โหลด environment variables

สร้าง client เชื่อมต่อ HolySheep API

ทดสอบการค้นหา

Advanced: Streaming Response สำหรับ UX ที่ดี

ตัวอย่างใช้กับ Streamlit

โค้ดเต็ม: RAG Pipeline สำหรับ Enterprise Chatbot

ใช้งาน

การติดตั้งบน Production: Docker + Environment Variables

ติดตั้ง dependencies

คัดลอกโค้ด

ตั้งค่า environment (ใส่ใน docker-compose จะดีกว่า)

รัน Streamlit

ข้อผิดพลาดที่พบบ่อยและวิธีแก้ไข

1. 401 Unauthorized — Invalid API Key

แหล่งข้อมูลที่เกี่ยวข้อง

บทความที่เกี่ยวข้อง

🔥 ลอง HolySheep AI