傳統的 AI 草圖生成系統往往只能一次性生成完整圖像,無法像人類藝術家那樣思考「應該先畫什麼、再畫什麼」。最新研究終於突破了這個限制:透過結合多模態語言模型與創新的多回合過程獎勵強化學習,AI 代理現在能夠逐步、一部分一部分地生成向量草圖。
研究核心:什麼是多回合過程獎勵強化學習?
傳統的強化學習通常只在任務完成後給予獎勵(結果獎勵),但草圖繪製是一個連續的決策過程。研究團隊開發的「過程獎勵」(Process Reward)機制,能夠在 AI 代理的每一步繪製動作後立即評估該動作的品質,類似於人類繪畫老師在每筆落下時就給予指導。
具體來說,系統會評估:
- 當前筆劃是否位於正確的空間位置
- 筆劃的形狀是否符合該零件的預期輪廓
- 筆劃的順序是否合理
- 與已繪製部分的銜接是否自然
ControlSketch-Part 數據集:突破性的自動註釋流程
這項研究的另一項重要貢獻是 ControlSketch-Part 數據集。研究團隊開發了一套通用的自動註釋管道,能夠將向量草圖自動分割成具有語義的零件層級區域。這解決了過去缺乏大規模、部分級別註釋草圖數據的問題。
自動註釋流程包含三個主要步驟:
- 輪廓檢測:使用視覺模型識別草圖中的主要線條
- 語義分割:基於形狀和上下文將線條歸類到不同零件
- 層級驗證:確保零件之間的層級關係正確
多模態語言模型:AI 代理的大腦
系統採用多模態語言模型作為核心代理,使其能夠同時理解視覺資訊(當前草圖狀態)和語言指令(任務描述)。這就像給 AI 安裝了一雙「眼睛」和一顆「會思考的大腦」。
在實際運作中,模型會接收以下輸入:
- 目前的草圖視覺狀態
- 目標對象的文字描述(如「一隻貓」)
- 歷史繪製動作的記錄
然後輸出:下一步應該繪製哪個零件、使用什麼形狀、以及在什麼位置。
實際應用場景與未來展望
這項技術的應用潛力廣泛。在設計領域,設計師可以給予 AI 高層次的創意指令(如「畫一隻正在奔跑的狗」),AI 會像人類一樣先勾勒整體輪廓,再逐步添加細節,最終完成作品。
在教育場景中,這種逐步繪製的能力可以用於:
- 互動式繪畫教學系統
- 動畫自動生成的前期草圖階段
- 遊戲中的即時角色創作
總結:從「一步到位」到「循序漸進」的AI
這項研究最重要的意義,在於讓 AI 學習了人類解決問題的核心思維方式:分解問題、按步驟執行、即時修正。透過監督式微調建立基礎能力,再以多回合過程獎勵強化學習優化決策品質,AI 代理首次展現出接近人類的「創作思維」。
未來,這種逐步生成的範式可能會擴展到更多領域,如 3D 模型建構、室內設計、工業產品設計等,讓 AI 真正成為人類創意的得力助手。