Problem

工業軟體開發(如晶片設計、GPU 優化、嵌入式系統)長期面臨專家推理資料稀缺的挑戰。現有的程式碼生成模型缺乏對硬體限制、時序語意及實際執行動態的深度理解,難以重現資深工程師在面對硬體約束時的除錯邏輯與複雜推理過程。

Method

提出 ECoT(錯誤驅動思維鏈)框架,結合多輪對話與環境錯誤回饋來模擬糾錯過程,並訓練 ICWM(工業程式碼世界模型)以學習 Verilog 模擬與 GPU 效能分析等領域的因果動態。該模型能在編譯前預測執行結果,並透過領域工具鏈驗證合成的推理軌跡,確保訓練資料符合工業任務的自然推理深度分布。

Results

在 14 項通用與 9 項工業基準測試中,InCoder-32B-Thinking 均取得開源模型中的領先成績。其中,LiveCodeBench v5 達到 81.3%,CAD-Coder 為 84.0%,而在難度極高的 KernelBench 則為 38.0%,展現出優異的跨領域推理與生成效能。

Significance

此研究成功將硬體動態行為納入模型的推理鏈中,為工業級程式碼生成提供了一套可自我驗證的自動化方案。這不僅克服了高品質領域資料獲取困難的痛點,對於加速半導體設計、優化底層運算效能以及強化複雜硬體系統的開發效率,具有重大的應用與學術價值。