Problem
現有的「文字轉動作」技術面臨重大挑戰,使用者難以僅透過文字精確描述複雜或細微的動作意圖,導致生成的 3D 動畫往往缺乏空間精準度,且輸入過程耗時費力,難以達到心中理想的構想。
Method
本研究提出名為 DrawMotion 的擴散模型框架,整合了文字指令與「手繪火柴人草圖」作為雙重生成條件。核心技術包含:1) 開發自動生成手繪風格草圖的演算法;2) 設計多條件模組 (MCM) 以低運算複雜度融合多元資訊;3) 採用免訓練引導機制,利用分類器梯度直接更新中間特徵,使生成動作在保持高保真度的同時更貼近使用者意圖。
Results
定量實驗與使用者研究證實,DrawMotion 能產出與使用者想像高度一致的動作。與傳統純文字輸入相比,手繪草圖的輔助能讓使用者達成目標動作的時間大幅縮短約 46.7%。此外,該模型在維持動作流暢度與物理合理性方面亦表現優異。
Significance
這項研究為人機互動與 3D 動畫創作提供了更直覺的途徑。透過結合語義與空間控制,DrawMotion 不僅降低了創作門檻,也為需要高精度動作編輯的影視製作、遊戲開發及虛擬實境應用,提供了一套兼具效率與靈活性的解決方案。