Agentic RAG 教學：多代理檢索增強生成架構實戰

如果你已經用過傳統 RAG（像我之前寫的 Multimodal RAG 多模態檢索教學），應該會發現一個問題：面對複雜的多步驟問題時，單純的「搜尋→塞進 prompt→生成」流程就不太夠用了。這就是 Agentic RAG 要解決的事情。

傳統 RAG 的天花板在哪？

傳統 RAG 的流程是固定的：使用者提問 → 向量搜尋 → 取回相關文件 → 塞進 LLM prompt → 生成回答。這對簡單的事實性問答很好用，但遇到以下場景就會卡關：

多步驟推理：「比較 A 公司和 B 公司過去三季的營收趨勢」——需要分別搜尋兩家公司的資料再彙整
資料來源多元：答案可能分散在 PDF、資料庫、API 中
需要驗證：第一次搜尋的結果可能不完整，需要追問或換個角度搜尋
動態決策：某些問題根本不需要搜尋，有些需要搜三次才夠

什麼是 Agentic RAG？

一句話總結：Agentic RAG = 傳統 RAG + AI Agent 的自主決策能力。

它讓 AI 不再只是被動地執行固定流程，而是能夠：

反思（Reflection）：檢查自己的回答是否完整
規劃（Planning）：把複雜問題拆解成多個子問題
工具調用（Tool Use）：根據需求選擇不同的搜尋策略
動態調整：根據中間結果改變策略

三層架構詳解

推理層（Reasoning Layer）：Agent 的大腦

推理層負責分析使用者的問題，決定下一步行動。核心能力包括：判斷問題是否需要檢索、把複雜問題拆解成子問題、選擇最適合的搜尋策略、評估中間結果決定是否繼續搜尋。

工具層（Tool Layer）：多元檢索工具

工具層提供各種搜尋和資料存取能力：

向量搜尋工具：語意相似度搜尋，適合模糊匹配
關鍵字搜尋工具：精確匹配特定術語
SQL 查詢工具：結構化數據查詢
網路搜尋工具：即時資訊檢索
摘要工具：長文件摘要和重點提取

這和之前介紹的 AI Agent 多工具調度的概念是相通的，差別在於 Agentic RAG 更專注在「資訊檢索」場景。

聚合層（Aggregation Layer）：整合與優化

當多個工具都回傳了結果，聚合層負責去除重複資訊、排序篩選最相關的內容、整合成連貫的上下文、生成最終回答。

用 LangChain 實作 Agentic RAG

如果你之前看過 LangChain Deep Agents 教學，這裡的概念會很熟悉。以下是簡化的架構：

from langchain.agents import AgentExecutor, create_tool_calling_agent
from langchain_openai import ChatOpenAI
from langchain.tools import Tool

# 1. 定義多種檢索工具
def semantic_search(query: str) -> str:
    """語意搜尋：找到與問題最相關的文件段落"""
    docs = vectorstore.similarity_search(query, k=5)
    return "\n".join([d.page_content for d in docs])

def keyword_search(query: str) -> str:
    """關鍵字搜尋：精確匹配特定術語"""
    docs = vectorstore.similarity_search(query, k=3, search_type="mmr")
    return "\n".join([d.page_content for d in docs])

tools = [
    Tool(name="semantic_search", func=semantic_search,
         description="用語意搜尋找相關文件，適合概念性問題"),
    Tool(name="keyword_search", func=keyword_search,
         description="精確搜尋特定術語，適合找具體數據"),
]

# 2. 建立 Agent
llm = ChatOpenAI(model="gpt-4o", temperature=0)
agent = create_tool_calling_agent(llm, tools, prompt)
executor = AgentExecutor(agent=agent, tools=tools,
    verbose=True, max_iterations=5)

Agent 會自動決定要用哪個工具、搜幾次、什麼時候停止。這就是 Agentic 的精髓。

2026 最新研究：A-RAG 框架

2026 年 2 月發表的 A-RAG 論文提出了一個有趣的架構：把分層檢索介面直接暴露給 Agent，提供三種粒度的工具：

keyword search：快速定位包含特定關鍵字的文件
semantic search：語意層級的相似度搜尋
chunk read：讀取特定文件片段的完整內容

Agent 可以自由組合這三種工具，在不同粒度間自適應搜尋。實驗結果顯示，這個方法在多個問答基準測試中優於現有方法，而且使用的 token 更少——這對控制成本很重要。

什麼時候該用 Agentic RAG？

Agentic RAG 不是萬靈丹，它有代價：更高延遲、更多 token 消耗、更複雜的系統。我的建議是：

場景	建議方案
簡單事實問答	傳統 RAG 就夠了
多文件比較分析	Agentic RAG
需要跨資料源查詢	Agentic RAG
需要多步推理	Agentic RAG
對延遲極度敏感	傳統 RAG + 快取