隨著生成式 AI 邁入企業應用深水區,如何讓通用大模型具備垂直產業的「專業知識」,同時不喪失原有的「聰明才智」,成了開發者的頭號難題。AWS 近期針對其 Nova 系列模型推出的 Nova Forge SDK,正式進入第二階段的技術實踐分享,核心鎖定在「資料混合」(Data Mixing)這項關鍵技術。

背景說明:在傳統的微調(Fine-tuning)過程中,模型常會面臨「災難性遺忘」的困境,即模型在學習特定領域資料後,處理一般性問題的能力會大幅下降。AWS 的實驗數據顯示,若僅使用客戶資料微調開源模型,其通用能力幾乎會消失殆盡。然而,透過 Nova Forge SDK 進行資料混合,將企業自有資料與 Amazon 精選的資料集融合,不僅在「客戶心聲」分類任務中提升了 12 個百分點的 F1 分數,更讓代表通用能力的 MMLU 分數維持在接近基準線的水準。

影響分析:這項發展對產業的影響是實質且深遠的。過去企業在客製化模型時,常陷入「要專業還是要通用」的兩難。Nova Forge SDK 提供了一套可重複使用的腳本,涵蓋從環境設定、資料清洗、訓練組態到最後的成效評估。特別是在訓練過程中整合了 Amazon SageMaker HyperPod,這代表企業可以更穩定且高效地在大規模叢集上執行微調任務,而無需擔心底層基礎設施的複雜性,大幅降低了技術實作的門檻。

重要性:為什麼這項發展值得台灣科技圈關注?台灣許多企業如製造、金融與醫療,正積極嘗試將 AI 落地。這些領域對資料精準度要求極高,但同時也需要模型具備強大的邏輯推理能力。Nova Forge SDK 讓開發者不再需要自行摸索繁瑣的參數比例,就能達到理想的微調效果。當企業能以更低成本、更高成功率的方式打造「既懂產業又具備常識」的 AI 模型,生成式 AI 的商業價值才真正得以釋放。這不僅是技術工具的升級,更是企業 AI 策略轉向實戰化、精準化的重要指標。