打破大上下文視窗迷思：Chroma 推出 Context-1 模型，專攻高效能代理式檢索與多跳推理

Chroma 推出專為 RAG 系統設計的 20B 參數模型 Context-1。這款「偵察型」模型不盲目擴張上下文視窗，而是透過代理化搜尋與多跳推理，精準定位關鍵資訊，解決長文本檢索中的高成本與遺忘問題。

在 AI 發展的競賽中，「上下文視窗」（Context Window）的大小常被視為衡量模型強弱的指標。許多開發者認為，只要視窗夠大，能塞進幾十萬甚至上百萬個 Token，檢索增強生成（RAG）的難題就會迎刃而解。然而，現實情況是長文本往往帶來高昂的運算成本、顯著的延遲，以及模型容易「迷失在中間」（Lost in the Middle）的推理失效問題。知名向量資料庫公司 Chroma 這次另闢蹊徑，推出了名為 Context-1 的專用模型，試圖用更精確的方式解決資訊檢索的痛點。

Context-1 是一個擁有 200 億（20B）參數的代理式搜尋模型。它的定位並非取代 GPT-4 或 Claude 等通用型推理模型，而是扮演一位專業的「偵察兵」。它基於 gpt-oss-20B 架構，採用混合專家模型（MoE）並結合了監督式微調（SFT）與強化學習（RL）技術。當使用者提出複雜問題時，Context-1 不會直接胡亂撈取資料，而是會主動將大問題拆解成多個子查詢，並進行平均每輪 2.56 次的並行工具調用，反覆迭代直到找齊所有必要的證據。

這項發展對 AI 產業的影響在於「專業分工」的落實。過往我們過度依賴單一模型完成所有任務，但 Context-1 的出現證明了「代理型子代理」（Agentic Subagent）在 RAG 架構中的價值。透過專門優化檢索邏輯，開發者可以不必再為了精準度而無限制地擴增 Prompt 長度，從而大幅降低 API 的費用負擔，並提升系統的反應速度。對於正在開發企業級 AI 應用的團隊來說，這種模組化、專注於多跳推理（Multi-Hop Retrieval）的工具，能更有效地處理跨文件的複雜邏輯關聯。

值得關注的是，Chroma 的這一步展現了 AI 基礎設施公司如何向上轉型。它不再僅僅是儲存資料的「倉庫」，而是開始提供能理解資料關聯的「導航系統」。在計算資源依然昂貴的當下，Context-1 提供了一條通往高效能 RAG 的務實路徑：與其把整座圖書館塞進記憶體，不如聘請一位聰明的館員幫你找出那三本最重要的書。這種更聰明、更省錢的架構設計，很可能成為下一階段 AI 應用整合的主流趨勢。