DrawMotion：結合手繪草圖與文字敘述，直覺且精準生成 3D 人體動作的擴散模型架構

本研究提出 DrawMotion 架構，透過文字與手繪草圖雙重條件，顯著提升 3D 人體動作生成的精確度與空間控制力，並將使用者的操作時間有效縮短約 46.7%。

Problem

現有的「文字轉動作」技術面臨重大挑戰，使用者難以僅透過文字精確描述複雜或細微的動作意圖，導致生成的 3D 動畫往往缺乏空間精準度，且輸入過程耗時費力，難以達到心中理想的構想。

Method

本研究提出名為 DrawMotion 的擴散模型框架，整合了文字指令與「手繪火柴人草圖」作為雙重生成條件。核心技術包含：1) 開發自動生成手繪風格草圖的演算法；2) 設計多條件模組 (MCM) 以低運算複雜度融合多元資訊；3) 採用免訓練引導機制，利用分類器梯度直接更新中間特徵，使生成動作在保持高保真度的同時更貼近使用者意圖。

Results

定量實驗與使用者研究證實，DrawMotion 能產出與使用者想像高度一致的動作。與傳統純文字輸入相比，手繪草圖的輔助能讓使用者達成目標動作的時間大幅縮短約 46.7%。此外，該模型在維持動作流暢度與物理合理性方面亦表現優異。

Significance

這項研究為人機互動與 3D 動畫創作提供了更直覺的途徑。透過結合語義與空間控制，DrawMotion 不僅降低了創作門檻，也為需要高精度動作編輯的影視製作、遊戲開發及虛擬實境應用，提供了一套兼具效率與靈活性的解決方案。