中国金融网 加入收藏    设为首页
首页
国内资讯社会财经科技教育时尚娱乐房产家居汽车母婴健康商业区块链生活企业传媒区域经济旅游体育
您现在的位置:首页 > 国内资讯 > 正文
微软发布AI声音生成工具VALL-E,只需3秒音频即可模仿人说话
2023-01-10 12:56      来源:IT之家      编辑:叶知秋      阅读量:17278   

感谢本站的朋友OC_Formula的线索传递!

,微软最近发布了一款名为VALL—E的人工智能工具,它可以只用3秒钟的音频来模仿人类说话。

这个工具由6万小时的英语语音数据训练,使用特定语音的3秒片段生成内容与目前的许多人工智能工具不同,VALL—E可以复制说话者的情绪和语气,甚至说话者自己从未说过的话也可以模仿

本站了解到,康奈尔大学的一篇论文用VALL—E合成了几种声音,你可以在GitHub上听听AI合成的音频。

研究人员指出,在许多情况下,Vall—E的性能优于当前的文本到语音转换模型可是,该研究也写道,目前人工智能模型存在几个问题例如,文本提示中的一些单词可能发音不清楚,被完全省略或在输出中出现两次此外,这种模型目前很难模仿一些声音,尤其是带有口音的声音

像其他新的人工智能技术一样,VALL E也引起了安全和道德方面的担忧微软已经发布了一份关于VALL—E使用的道德声明,但是对于其未来的用途并没有明确的解释

目前微软Vall—E并没有开源微软在GitHub上创建了一个Vall—E资源库,但目前只包含一个描述文件

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

 
上一篇: 抓住ChatGPT爆红机遇,微软计划对其开发商投资100亿美元
下一篇:最后一页
 
     栏目排行
  1. 抓住ChatGPT爆红机遇,微软计划对其
  2. 兴亦垄断衰亦垄断
  3. 投行人才流动加快头部券商强者恒强
  4. 微星新款泰坦GT77HX首发4K144H
  5. 创新·开拓·坚韧·笃行:记华安保险创新业
  6. 三星预估2022Q4营业利润暴跌69%,
  7. 预估第一季DRAM均价跌幅收敛至13%-
  8. 莱克天狼星吸尘洗地机,功能全面更省心,引
  9. 树莓派推出新一代相机模块CameraMo
  10. Meta将停止初代Quest功能更新,取
     栏目推荐
二手房“带押过户”启动满月 成功尝鲜者寥寥无几二手房“带押过户”启动满月 成功尝鲜者寥寥无几
2022年营收78.61亿,汤臣倍健迎来VDS行业新2022年营收78.61亿,汤臣倍健迎来VDS行业新周期
大兴国际氢能示范区兼顾产业发展和配套服务打造员工理想大兴国际氢能示范区兼顾产业发展和配套服务打造员工理想生活蓝本
迪丽热巴穿军绿色也好美!和吴磊同框丝毫没有年龄迪丽热巴穿军绿色也好美!和吴磊同框丝毫没有年龄
绿色塞罕坝 不朽的奇迹绿色塞罕坝 不朽的奇迹