阿里通义开模型，能仿照音效师为视频配音源音频生成

作者：分类：时尚发布于：2025-07-04 08:34:21

7月1日音讯（报导：李楠）今天，阿里阿里通义实验室开源了旗下首个音频生成模型ThinkSound ，通义该模型初次将CoT（Chain-of-Thought，开源思想链）应用到音频生成范畴，音频音让AI能够像专业音效师相同逐渐考虑，生成捕捉视觉细节，模型生成与画面同步的照音高保真音频。现在，效师ThinkSound的为视代码和模型已在Github、HuggingFace 、频配魔搭社区开源，阿里开发者可免费下载和体会。通义

开源

搜索关键字：
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

相关日志：

呼和浩特一航班起飞时突发机械故障紧迫刹停后乘客安全搬运

四维图新露脸2025火山引擎原动力大会

结业季迎微星笔记本 618 大促：神影、星影、雷影国补性价比超高引荐！

精准调水，都江堰灌区完结水稻栽秧泡田超578万亩

RingConn 智能戒指如何故一枚“小戒指”引领全球智能穿戴新风潮？

曙光数创推出三大相变直接液冷体系架构

« 半导体资料景气量攀升，光刻胶国产化“闯关”正酣，谁占主导？

日本Sycom推出水冷版RTX 5080/5070 Ti显卡，散热功能大幅提高»

评论

发表评论取消回复

回顶部

Copyright © 2013-2019 沐过版权所有