详细调试信息 - getPostsByCategory:
当前 cat_name: 即時經濟
传入的 cat_slugs: %e5%8d%b3%e6%99%82%e7%b6%93%e6%bf%9f
当前页码: 1
is_lifetime: false
时间条件: 即時新聞 - 3個月以內
查询结果:
找到文章数: 2165
最大页数: 217
当前返回文章ID数: 10
文章IDs: 7527254, 7527259, 7527132, 7527103, 7526807, 7526741, 7526730, 7526714, 7526608, 7526626
第1页第一篇文章日期: 2026-06-06
第1页最后一篇文章日期: 2026-06-05

阿里推出及開源ThinkSound 可用AI自動為影片加音效

阿里巴巴(9988)近日正式推出及開源其首款支援鏈式推理(Chain-of-Thought,CoT)的音訊產生模型ThinkSound,該模型基於視訊、文字或音訊輸入,透過思維鏈技術,能夠分析視訊畫面的場景、動作與情感,實現高保真、強同步的空間音訊生成,標誌着AI音訊從「看圖配音」到「結構化理解畫面」的跨越,猶如專業AI音效師。

核心在於多模態AI架構

據內媒報道,ThinkSound的核心優勢在於其多模態AI架構,融合了電腦視覺、自然語言處理與音訊生成技術,其中電腦視覺演算法能夠逐格分析影片內容,理解物體互動、環境背景及人物行為,進而產生高度契合的音效與音景,例如在自然場景中,可產生流水或鳥鳴聲;在都市場景中,則能還原車輛鳴笛與人群喧鬧。

此外,ThinkSound的演算法亦確保音訊與視訊精準對齊,支援包括MP4、MOV、AVI和MKV在內的多種視訊格式,相容於從標清到4K分辨率,滿足不同創作需求。根據官方數據顯示,ThinkSound在視訊及音訊生成基準測試中位居業界前列,展現了其強大的技術實力。

大幅降低AI音效產生門檻

報道又提到,ThinkSound大幅降低了AI音效產生的技術門檻,使中小型創作者、獨立開發者及學術研究人員能夠輕鬆接觸專業級音效產生工具。 同時,該模型也提供互動式編輯功能,支援透過點擊或語言指令對特定音效進行精細調整,大大提升創作彈性。
 

---------------------------------------------

>>>星島網WhatsApp爆料熱線(416)6775679,爆料一經錄用,薄酬致意。

>>>立即瀏覽【生活百答】欄目:新移民抵埗攻略,老華僑也未必知道的事,移民、工作、居住、食玩買、交通、報稅、銀行、福利、生育、教育。
點擊以下6大平台 接收加拿大新聞及生活資訊

延伸閱讀

延伸閱讀

銀行界已落實最新監管要求 金管局:確保開戶流程合規有序

德林控股辦金融論壇 業界料AI代理3年內難完全取代人手

本港外匯儲備5月底增至4465億美元 4年新高

世茂旗下機場酒店傳遭債權銀行接管