亚马逊开发出有史以来最大的文本转语音模型

2024-07-05 22:11:20 阅读(8632)

2 月 18 日消息,亚马逊人工智能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在 arXiv 预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。

近年来,像 ChatGPT 这样的“大型语言模型”凭借其智能回答问题和生成高级文本的能力而备受关注。然而,人工智能也在逐步融入其他主流应用领域。在这个新项目中,研究人员尝试通过增加参数数量和扩充训练数据集来提升文本转语音应用的能力。

据IT之家了解,这个名为“可扩展流式文本转语音模型”(BASE TTS)的新模型拥有 9.8 亿个参数,并使用 10 万小时的录音(来自公共网站)进行训练,其中大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“au contraire” 和 “adios, amigo”。

亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说的“涌现能力”。这种能力是指人工智能应用,无论是大型语言模型还是文本转语音模型,突然突破到更高智能水平的现象。他们发现,对于文本转语音应用而言,这种飞跃发生在参数量达到 1.5 亿的中型数据集上。

研究人员还指出,这种飞跃涉及一系列语言属性,例如使用复合名词、表达情感、使用外语词、应用语音学和标点符号以及正确强调句子中的关键词等能力。

研究团队表示,出于对潜在滥用风险的担忧,BASE TTS 将不会向公众开放,他们计划将其作为学习应用,并期望将学到的知识应用于改善文本转语音应用的整体音质。

标签:
拓展阅读

淘宝网店怎么运营?具体怎么操作?

淘宝网店的竞争日益激烈,如果想要做好网店运营的工作,那自然也需要学会具体的运营方法,而且还需要琢磨和研究打造爆款商品的技巧,这样才能爆单,具体应该怎么操作呢

老卖家实战分享拼多多从零到日销几千单的操作全流程

拼多多稳定出评,一号一拍,指定评语和晒图,出评率95%以上。

低成本抖音矩阵号怎么做?

高效运作批量账号的秘诀揭秘

抖音生活服务“探店宝”登录平台

2023-09-18 10:15:41 阅读(7531)

拼多多三连大促来袭

2023-09-17 10:15:24 阅读(10124)

快手AI玩评进入测试中

2023-09-16 15:46:50 阅读(10801)

超级店长,淘宝开店必备工具免费送!!!

关注有礼、定向促销、收藏加购、动态红包、预热打折、智能推荐、手机海报、评价管理....

抖音电商曝光2023节盟计划

2023-09-15 14:18:12 阅读(8077)

抖音生活服务推出官方直播间第一站

2023-09-14 11:56:32 阅读(7924)

抖音电商上线品牌力内容

2023-09-13 15:26:00 阅读(8447)

抖店无货源怎么运营提升销量和体验分?超快起店攻略

抖店作为抖音的电商平台,已经成为众多商家争相入驻的热门选择。然而,在竞争激烈的市场中,如何有效地运营抖店,提升抖音小店销量和体验分成为摆在商家面前的重要课题。

抖音测试“不喜欢”和“长视频”功能

2023-09-12 11:33:29 阅读(9970)

抖音上线生活服务饮品经营法则

2023-09-11 10:04:14 阅读(8656)

淘宝天猫召开双11食品生鲜行业大会

2023-09-10 15:40:06 阅读(5133)

京东“9.9超省日”主会场 今晚登录

2023-09-09 15:15:53 阅读(5879)