详细调试信息 - getPostsByCategory:
当前 cat_name: 科技
传入的 cat_slugs: %e7%a7%91%e6%8a%80
当前页码: 1
is_lifetime: false
时间条件: 其他欄目 Default - 2023年1月1日后
查询结果:
找到文章数: 1836
最大页数: 184
当前返回文章ID数: 10
文章IDs: 7526890, 7526287, 7526758, 7526019, 7524149, 7522977, 7522345, 7521282, 7519796, 7519690
第1页第一篇文章日期: 2026-06-06
第1页最后一篇文章日期: 2026-05-29

科技| AI機械人「會說話、懂表情」 自學像人類般對嘴發聲

[星島綜合報道] 電影《Westworld》中近乎真人的機械人,一大關鍵在於嘴唇與語音幾乎零延遲同步,令「不像機械」成為可能。現實世界中,這一步正逐步逼近。由美國Columbia University創意機器實驗室(Creative Machines Lab)研發的 EMO 機械人頭部,近日展示一項新能力——不單止能對嘴說話,更能透過觀察人類,自行學習如何「像你一樣」開口發聲。

EMO 並非完整人形機械人,而是一個覆蓋柔軟矽膠「皮膚」的機械頭部,面部下方藏有 26 個微型馬達。研究團隊透過不同組合啟動這些馬達,令面部肌肉產生細緻變化,從表情到嘴形都可高度還原人類說話時的動作。

研究第一步,科研人員將 EMO 放在鏡子前,讓它隨機做出成千上萬種面部動作,並即時「觀察自己」。透過這種自我觀察,系統逐漸建立起「哪一組馬達動作,會對應哪一種視覺表情」的關係模型,屬於一種稱為「視覺到動作」(Vision-to-Action,VLA)的學習方式。換言之,機械人並非被預先寫好表情對照表,而是靠自己試錯學會控制臉部。

完成自我學習後,EMO 再進入第二階段:長時間觀看 YouTube 上大量人類說話及唱歌影片,理解不同語音與嘴形之間的關聯。其人工智能系統其後把這些觀察結果,與自身的 VLA 模型結合,最終在播放合成聲音時,能即時生成相應的唇部動作,達至近似人類的對嘴效果。

研究由哥倫比亞大學博士生Yuhang Hu、教授Hod Lipson等人主導。團隊指出,現階段 EMO 對某些發音(如「B」、「W」)仍掌握不足,但隨着訓練時間增加,準確度有望持續提升,甚至發展出更自然的對話時面部反應。

研究人員亦提到,若未來把這種對嘴系統,與 ChatGPT、Gemini 等對話式人工智能結合,機械人與人類之間的互動將不再只限於「有聲音的回答」,而是加入能引發情感連結的微表情與口型變化,對陪伴型機械人或服務型機械人發展,具潛在影響。

相關研究論文已刊登於國際期刊《Science Robotics》,研究仍屬實驗階段,但已為「會說話、懂表情」的高度仿真人機互動,提供一個可行方向。

圖片:Creative Machines Lab

T10

---------------------------------------------

>>>星島網WhatsApp爆料熱線(416)6775679,爆料一經錄用,薄酬致意。

>>>立即瀏覽【生活百答】欄目:新移民抵埗攻略,老華僑也未必知道的事,移民、工作、居住、食玩買、交通、報稅、銀行、福利、生育、教育。
點擊以下6大平台 接收加拿大新聞及生活資訊

延伸閱讀

延伸閱讀

英前王子安德魯遭揭轉租物業圖利 住皇室豪宅僅付象徵性租金

阿爾巴尼亞爆示威︱特朗普女婿建度假村涉破壞生態 民眾怒吼總理下台

伊朗戰爭 | 特朗普自豪進展神速勝越戰 伊朗最終只能與美達協議

俄烏戰爭延伸黑海|烏無人艇誤闖羅馬尼亞港口自爆 疑遭俄軍干擾失控