Problem
現有模型在處理複雜科學任務(如化學、材料科學)時,常面臨參數規模不足、領域知識深度不夠,以及難以在通用智慧與專業化科學分析之間達成平衡的困境。
Method
研究團隊利用 XTuner 與 LMDeploy 基礎設施,實現在一兆參數規模下的高效強化學習(RL)訓練,並確保訓練與推論過程中的精確度一致性。該模型整合了強大的多模態感知能力與先進的智慧代理人(Agent)技術。
Results
Intern-S1-Pro 在逾百項專業科學任務中表現卓越,涵蓋化學、生命科學及地球科學等領域。其通用能力位居開源模型頂尖地位,在特定科學任務的專業深度上,更超越了主流的封閉原始碼商業模型。
Significance
本研究成功打造了「具備專業能力的通用型模型」(Specializable Generalist),為兆級規模的科學研究提供強大工具,並顯著提升了開源社群在處理高門檻基礎科學發現時的技術上限。