阿里通义开模型 ,能仿照音效师为视频配音源音频生成
7月1日音讯(报导 :李楠)今天,阿里阿里通义实验室开源了旗下首个音频生成模型ThinkSound ,通义该模型初次将CoT(Chain-of-Thought ,开源思想链)应用到音频生成范畴 ,音频音让AI能够像专业音效师相同逐渐考虑,生成捕捉视觉细节,模型生成与画面同步的照音高保真音频。现在,效师ThinkSound的为视代码和模型已在Github、HuggingFace 、频配魔搭社区开源,阿里开发者可免费下载和体会。通义
开源
7月1日音讯(报导 :李楠)今天,阿里阿里通义实验室开源了旗下首个音频生成模型ThinkSound ,通义该模型初次将CoT(Chain-of-Thought ,开源思想链)应用到音频生成范畴 ,音频音让AI能够像专业音效师相同逐渐考虑,生成捕捉视觉细节,模型生成与画面同步的照音高保真音频。现在,效师ThinkSound的为视代码和模型已在Github、HuggingFace 、频配魔搭社区开源,阿里开发者可免费下载和体会。通义
开源
评论
发表评论