ในยุคที่ข้อมูลมีปริมาณมหาศาล การค้นหาข้อมูลที่แม่นยำกลายเป็นความท้าทายสำคัญของระบบ RAG (Retrieval-Augmented Generation) หลายคนอาจพบว่า vector search แบบดั้งเดิมให้ผลลัพธ์ที่ไม่ตรงใจ คำตอบที่ได้อาจมีความเกี่ยวข้องบ้างแต่ไม่ใช่สิ่งที่ต้องการมากที่สุด ปัญหานี้แก้ได้ด้วยเทคนิค Reranking หรือการจัดลำดับใหม่ที่จะยกระดับความแม่นยำของการค้นหาไปอีกขั้น

Reranking คืออะไรและทำงานอย่างไร

Reranking คือกระบวนการนำผลลัพธ์จากการค้นหาแบบดั้งเดิม (เช่น BM25 หรือ vector similarity) มาจัดลำดับใหม่โดยใช้โมเดล Cross-Encoder แทนที่จะใช้แค่การเปรียบเทียบความคล้ายคลึงของเวกเตอร์ Reranking จะประเมินความสัมพันธ์ระหว่าง query และ document แต่ละชิ้นอย่างละเอียด ทำให้ได้ผลลัพธ์ที่ตรงใจมากขึ้นอย่างมีนัยสำคัญ

การทำงานของ Reranking แบ่งเป็น 2 ขั้นตอนหลัก ขั้นตอนแรกคือ Retrieval ซึ่งใช้ semantic search หรือ keyword search ดึงเอกสารที่เกี่ยวข้องมาประมาณ 20-100 รายการ จากนั้นขั้นตอนที่สองคือ Reranking โดยส่งทุกคู่ query-document ไปให้ Cross-Encoder ประเมินคะแนน relevance แล้วจัดลำดับใหม่ตามคะแนนที่ได้

ตารางเปรียบเทียบบริการ Reranking API

เกณฑ์เปรียบเทียบ HolySheep AI Cohere Rerank Jina Reranker
ราคา (per 1M tokens) $0.50 $1.00 $0.50
Latency เฉลี่ย <50ms 100-200ms 80-150ms
วิธีการชำระเงิน