了解独特的文本转语音应用

聚焦 >

互联网

虚拟助手在用户发出命令后就会作出语音回复。而生成语音回复的技术被称为文本转语音（TTS）。

TTS 应用能够让辅助器具使用者访问更多内容，因此非常实用。最新的 TTS 技术可以从一段几分钟的音频数据中生成合成声音，非常适合仅留存了有限录音的失音者。

事实上，TTS 的应用正在因技术进步而不断增长：

(相关资料图)

在几毫秒内运行端到端 TTS 流程，以实现自然互动。

在推断时自定义 AI 模型和流程，以产生具有表现力的合成语音。

部署在所有云、数据中心、边缘或嵌入式设备上。

本文将说明语音合成系统如何运作，然后介绍 TTS 技术的常见用途和新用途。

语音合成系统如何工作

顾名思义，文本转语音或语音合成是将书面文本转换成自然、类似人类的语音音频的过程。在端到端 TTS 流程中用于实现这一转换的关键模型和模块包括：

文本规范化和预处理：将数字和缩略语变成文字。

文本编码：将文本转换为输入到声谱图生成器的编码向量。

声谱图生成器：从编码文本向量中生成声谱图。

语音编码器模型：输入声谱图并生成一个人们可以听到的合成语音。

一般来说，TTS 是虚拟助手、数字人和服务机器人等应用的最终阶段。

常见的 TTS 应用

2021 年 IDC 对话式 AI 采用情况调查共调研了 251 家公司，其中 74.5% 在语音对话式 AI 解决方案中使用 TTS，68.5% 在无障碍解决方案中使用 TTS（图 1）。

图 1. IDC 关于常见 TTS 用例的调查

语音合成的功能用途正得到许多行业的认可，人们可能已经看到过以下 TTS 技术用例。

虚拟网红

虚拟网红正在改变未来与企业或名人沟通的方式。虚拟网红也称为虚拟品牌大使或品牌代言人，它们可以协助公司推广产品和服务，名人也可以通过它们与粉丝保持全天候的联系。

在这些用例中 TTS 技术生成了自定义声音，然后被整合到动画虚拟网红或数字大使身上。

文本叙述

文本叙述能够大声朗读所有类型的文本。这项 TTS 功能可用于网站及阅读类应用，为喜欢音频类节目的人带来了福音。有视觉障碍的人也可以使用文字叙述听到他们喜欢的内容。

TTS 用于在这些应用程序上将文本转换成语音并朗读出来。但这项工作并不像表面上那么简单。为了提升收听体验，此类应用的声音必须抑扬顿挫、富有节奏和表现力。

常见的语音转文本准确性问题

对于生活在现代社会的人来说，最流行和具有吸引力的媒介莫过于音频和视频内容。TTS 技术可以帮助内容创作者为视频配音或创建播客。

为了获得更多的受众，创作者还可以使用 TTS 技术将博客、新闻文章等文本内容转换成音频。

TTS 的使用十分灵活，用户可以在变声器等应用中改变语音的音调、节奏和音量，使声音变得更具表现力。

独特的 TTS 应用

除了这些日常应用外，企业家们正在探索各种新颖的 TTS 应用。下文将介绍开发独特语音合成技术的公司。

用于智慧医院的语音通知亭：Artisight

Artisight是一个应用于医院的物联网传感器网络，可改善医院的运营、财务业绩和患者体验。该公司帮助美国许多顶尖医院提高运营效率，同时通过任务自动化给患者带来更好的体验，比如呼叫患者到挂号窗口和化验等。

医院可以使用 TTS 技术与患者和访客分享有关医院服务、设施位置和一般健康公告的信息。该技术也可以使用多种语言帮助可能不会说医院当地语言的人。

上面的视频演示了医院通知亭的文字转语音技术如何读出患者排队单上的号码。

挑战和解决方案

过去，医院接待人员需要手动登记患者信息并在轮到患者就诊时通知他们。这种耗时的登记流程降低了医院的效率和患者的满意度。

Artisight 开发的语音签到、通知亭等智慧医院解决方案可提升患者的体验。

Artisight 和 NVIDIA Riva赋能的通知亭实现了有效、快速的患者登记流程，将等待时间缩短了一半并避免了数据输入错误，最终提高了员工的工作效率和患者的满意度。

为数字虚拟形象提供类似人类声音：NVIDIA

TTS 技术使计算机能够将书面文字转换成语音，进而让数字人能够“开口说话”并以更加自然、有代入感的方式与用户交流。

为了取得用户的信任，数字人所说的话必须高度准确，尤其是当它们被用于教育、娱乐或其他互动用途时。使用 TTS 技术生成自然、类似人类的语音可以帮助数字人吸引用户的注意力和兴趣。

正如 NVIDIA Omniverse Avatar Cloud Engine（ACE）演示所示，AI 虚拟形象Toy Jensen能够理解黄仁勋的问题并作出自然的回答。Toy Jensen 的声音使用 NVIDIA Riva 创建。

视频 2. 用于构建实时、交互式 AI 助手的 NVIDIA Omniverse ACE 平台

挑战和解决方案

开发用于数字人的 TTS 可能有一定的难度，尤其是在创造自然、真实的语音方面，并且难度取决于地区和语言。这是因为使用传统和统计算法创建的 TTS 系统可能导致语音听起来像是机器人或机械发出的，而用户对此可能不会“买账”。

此外，由于 TTS 系统受数据集、所使用的模型和模块类型等诸多因素影响，因此要为数字人应用创建灵活的自适应语音具有一定的难度。这使开发者难以生成具有细微差别和富有表现力的语音。

最后，数字人需要在不牺牲质量的情况下实时生成大量语音，因此创建高效、可扩展的 TTS 系统至关重要。

NVIDIA 为数字人和虚拟形象生成了自定义语音，比如使用 Riva 生成的 Toy Jensen 和 Violet。Riva 可帮助开发只需短短几毫秒就能实时运行且精准的 TTS 流程，满足实现自然语音的必要条件，还可以灵活调整音调、持续时间和音量等，使生成的声音更具表现力。

开始使用语音合成

用户现在就可以开始将 TTS 功能集成到应用中，例如阅读内容或生成数字网红独特声音等。NVIDIA Riva 等 SDK 可以帮助用户开发出提供高准确度并进行高性能推理的应用。

标签：

THE END

广告、内容合作请点击这里寻求合作

免责声明：本文系转载，版权归原作者所有；旨在传递信息，不代表中国财投网的观点和立场。

资讯播报

委比委差什么意思？股票委比高好还是低一些好？

比特币跌破50000美元是什么情况？比特币跌破50000美元表明什么风险？

了解独特的文本转语音应用

为什么不建议买苹果笔记本苹果笔记本怎么装双系统-焦点速递

隔空互怼升级交大昂立实控人呼吁全体股东不放弃索赔权力并将为公司提供无偿流动性支持

什么是付融宝？理财产品付融宝收益高是什么原因？

4万纽币是多少人民币？货币兑换对旅游者有什么影响？

马云购买200亿比特币是真的吗？比特币卖出就有人买吗？

东北电气重组了吗？公司重组大概多久时间？一文知晓！

建行活期存款利息是多少？一万元活期一个月利息多少钱？

历史上的今天-大乐透7月1日开奖号码汇总世界即时

淮北师范大学：软件工程一级学科学位授权点接受周期性合格评估

英媒：拜登小布什等美国百政客是奴隶主后代只特朗普无嫌疑

今日5（0 1不完美越狱）

美硕科技在创业板上市：总市值约32亿元，美的集团为其大客户

上海成品油价29日零点起上调：92号汽油7.50元/升 95号汽油7.98元/升_天天即时看

青矩技术今日上市：开盘价为36.80元/股较发行价上涨5.90% 东方雨虹等参与战略配售

好消息！药店购药可享受医保报销，广西将定点零售药店纳入医保门诊统筹

@同学们，这份暑期安全攻略“拍了拍”你

【全球播资讯】广西开展防范非法集资宣传月系列活动

詹俊：枪手夏窗砸2亿镑签哈弗茨+赖斯+廷伯，能缩短与曼城差距么

7月1日起，三明泰宁动车直达上海天天热文

高考志愿怎么填四个方法要掌握

中超联赛战火即将重燃亚泰7月3日主场对河南队球票线上开售

恶劣天气威胁生产前景可可价格创46年来新高_全球要闻

“港澳车北上” 深圳停车场升级改造速看料

星夜出击！第74集团军某旅炮兵营开展跨昼夜实弹射击演练

C安凯微（688620）：该股换手率大于8%（06-29）

科创板两融余额1066.15亿元较上一日环比减少2.08亿元_环球播报

当前焦点!希腊媒体：字母哥受到大腿伤病困扰可能缺席男篮世界杯

F10看基本面

鹏华中证畜牧养殖ETF基金增加德邦证券为申购赎回代理券商每日速递

【世界报资讯】男子结识开超跑“富婆”，反被骗50余万

还没完！上海高温仍将持续！何时入伏？高温津贴怎么发？

美光与印度政府签署谅解备忘录将在印建设其首座半导体工厂

编造“上海地铁站无差别杀人”谣言的网民已被行拘

首钢园、奥林匹克塔等五大城市地标将上演AR秀|要闻

美国78人因涉嫌欺诈25亿美元的医疗保险遭起诉全球今日讯

三立期货6月29日早间内参——宏观|微速讯

【天天聚看点】中国香港青年代表讲述国安法给香港带来的积极变化

环球快报:03月16日铜陵前往许昌出行防疫政策查询-从铜陵出发到许昌的防疫政策

这趟列车全国独有！天天时快讯

拧紧“安全阀” 北京各区排查燃气隐患全球热闻

闵行：有近路！这条亲水步道正式贯通，连接两条主干道

长春海关发布优化营商环境十八条措施环球观天下

上海一女子吐槽：孩子感冒去了趟药店，竟配回14盒药花了824元！网友：药当饭吃？

当前观点：洋葱怎么做好吃_十种做法

为什么夏天一吹空调就浑身疼？

今日关注：贺州构建全国首个碳酸钙循环产业链大力推动全产业链发展

申请贷款买房时有哪些细节是不能忽视的

全球热讯:8888元一晚！“猪景房”火了

广西交投以“强枢纽”夯实实体经济发展根基全球观点

环球资讯：日语专业考研考什么科目怎么查（日语专业考研需要考什么科目）

搞“第二支柱”？美想拉多国加入“奥库斯”，专家：将破坏亚太安全天天快播

【速看料】山亭区科技局 | “强创新促改革”科技赋能企业高质量发展

环球热消息：米哈游称已起诉游戏私服外挂等侵权主体赔偿100万元

12代酷睿i5加持！机械革命无界M5小主机低至1999元天天日报

新闻早餐丨抢教授话筒学生高考600多分全球快看

全球新资讯：携手巴黎机场集团，峰飞将在巴黎奥运会试运营飞行

原标题：中国无人驾驶汽车行业数据分析：83.5%消费者希望无人驾驶汽车保留普通汽车功能作者：奕剑来源：艾媒网_热议

身体上一颗不起眼的痣，可能会成为致命“杀手”！

12家公司披露股票回购预案天合光能拟回购不超6亿

热门：《梦幻西游手游》涿月蜃境特殊事件攻略逐月蜃境寻宝特殊事件攻略

世界微头条丨光伏概念发力上扬！露笑科技涨停隆基绿能等拉升

今日快看!800亿AI大牛股开盘跌停美国又有“小动作”？

全球视点！综漫小说500万字_综漫小说400万字以上

热炸了！这些板块逆势拉升啤酒饮料空调机起来了

世界消息！国产碳化硅进击8英寸最佳“掘金”窗口期进倒计时

怎样刮痧才正确刮痧的手法有讲究_如何正确刮痧刮痧的正确方法有哪些

杂化类型的判断_杂化

天天视点！中国在外太空（创微视角：美媒：中国在太空不再居次要位置）

上海自由贸易港板块6月28日涨0.01%，畅联股份领涨，主力资金净流出1.98亿元-每日热议

尼康p330和富士xq2哪个好（富士f605exr 尼康P300 哪一个好点呀谢谢）

高考作文优美的开头（精选25个高考满分作文开头）_环球快播报

广州坐飞机到北京要多少钱_从广州坐飞机到北京来回多少钱

天津市慈善协会公告

戴维斯双击是什么意思呀_戴维斯双击是什么意思-环球热点评

北京的夏天都在我的碗里|天天快资讯

【环球热闻】证券市场禁入制度相关内容简介介绍怎么填

全年一次性奖金个税税率表_奔驰汽车轮胎多久换一次？|全球关注

主要负责人安全职责主要内容_主要负责人安全职责

鸭脖的事刚完，蜜雪冰城就窜上了食品安全榜的第一？|焦点快报

万事利(301066):公司创业板向特定对象发行股票预案（修订稿）的提示性公告_精彩看点

多条鳄鱼逃入柳江河流域？柳州市柳北区发布通报环球观焦点

申万宏源：当前中国金融市场和实体经济、制造业最突出的矛盾在于两者投资逻辑的背离

完善防洪减灾体系浙江钱塘江流域水生态修复工程杭州段开工_每日视点

世界热文：自营快递+全球布局，菜鸟展露新野心

世界头条：香港金融服务提供者名单年度更新：瑞信受到密切关注

环球快看点丨瑞银：AI趋势并非泡沫但投资者应保持选择性

广州揽粤港澳青年才俊岗位年薪最高达60万元_视讯

帝王日常模拟器什么时候出公测上线时间预告

消费金融相关的概念股一览（2023/6/28）_即时看

新希望称行业底部“扛周期”能力提升猪价2024年上半年可能还有一跌

气、油、财、政齐下跌，俄罗斯靠什么逆势增长？

王大雷微博（王大雷微博门）

交易商协会：5月债务融资工具发行规模为5122亿元每日关注

了解独特的文本转语音应用

语音合成系统如何工作

常见的 TTS 应用

常见的语音转文本准确性问题

为数字虚拟形象提供类似人类声音：NVIDIA

相关热点

资讯播报

最新文章

相关推荐

了解独特的文本转语音应用

4万纽币是多少人民币？货币兑换对旅游者有什么影响？

马云购买200亿比特币是真的吗？比特币卖出就有人买吗？

东北电气重组了吗？公司重组大概多久时间？一文知晓！

淮北师范大学：软件工程一级学科学位授权点接受周期性合格评估

精彩推送

交易商协会：5月债务融资工具发行规模为5122亿元 每日关注

每日速讯：广西专精特新企业中博会上觅商机

扎紧“钱袋子”管好“账本子” 广西审计机关移送违纪违法问题线索268件-全球观点

倒计时30天！成都大运会，准备好了

多地点亮夜经济 上市公司尝试“新玩法”-当前短讯

快资讯：2023中国企业家太阳岛年会定于8月9日举办

AI来了，“智能”抢了“人工”的饭碗？

保障灵活就业者“清凉权”需要“新解法”|全球今日报

镇雄最新人事任免！

江阴银行: 第八届董事会第一次会议决议公告 世界快消息

我国业务化应用星地激光高速通信试验取得成功

天天观点：提前还款率涨至近五年新高，长期将向平均水平回归

饥荒后期能力最强悍的人物都是谁？图书管理员的力量最强大！

“原油交易之神”遭遇滑铁卢 旗下基金年内巨亏51%-世界微头条

全尺寸104键！小米无线键鼠套装2仅需85元-天天微头条

大唐发电(601991.SH)拟向福建新能源公司增资1.3亿元

世界微资讯！韩综用中国国歌做BGM 基本情况讲解

Vishay推出的新款红外传感器模块，可在阳光直射下稳定工作，不需要衰减装置

三未信安：收购资产完成，江南科友成为公司的控股子公司 热头条

天天动态:“水火”两重天！湘北大雨，湘南高温晴热

外媒评选欧美十大人工智能初创公司 除了OpenAI以外还有谁？

消息称中骏集团正洽谈新贷款 用于7月到期银团贷款剩余款项再融资 环球滚动

财政部：5月全国发行地方政府专项债券4154亿元

中辉期货原油日报20230628：原油上行乏力，防范下探风险 世界热议

夏日雨水丰沛 桂林市龙胜各族自治县层层梯田如镜|全球即时

南宁街头的这种果熟了，像“加大版”四季豆，能吃吗？

天天热门:感动！儿子患重病 桂林66岁母亲割肾救子

注意！柳州公积金有重大调整 7月1日起执行

“龙舟水”撤场了！广西的“桑拿天”回归 体感或达40℃

环球最新：解谜：楔形文字，一场惊天文化大骗局

每日精选：瞭望｜济宁这座千年古城奏响发展“三重奏”

IN视频｜诗意深圳：云气徘徊，山川秀美-全球即时看

世界快看：了不起的傻大脑这次真把我蠢哭了

李梦韩旭几乎打满全场合砍59分 双核闪耀率队三连胜_每日看点

老公43岁患肺癌，为他熬鸡汤、鱼汤补身子，婆婆却说我在害他

频吃罚单，营收罕见下滑，平安银行的金融故事还好讲吗？-全球播报

付费陷阱多 江苏省消保委发布智能电视消费调查报告_天天新视野

金风科技(02208)将于8月18日派发末期股息每股0.13154港元|当前速递

焦点日报：国家发改委：6月28日24时起国内成品油价格按机制上调

全球热头条丨乘联会：6月前四周新能源车零售达50万辆 同比增长13%

集邦咨询：多晶硅、硅片成交价暂时企稳 电池片、组件价格普遍下滑 世界头条

横跨6个设区市！广西这条高速公路6月30日全线通车

29日起，油价迎年内第五涨！加满一箱油多花2.5元

【世界新要闻】金证股份: 金证股份关于转让参股公司部分股权及放弃增资优先认购权暨关联交易的公告

世界播报:新型减肥药：减重效果好、价格低、作用持久

外交部回应“日本疑贿赂国际原子能机构秘书处”

最近你的微信群里是不是也出现了“张华银”？他是谁？ 环球观焦点

世纪佳缘推出“组局”功能 满足年轻人找“搭子”需求

天天快消息！信濠光电：向控股子公司增资

报告显示美国超2000亿美元新冠救济金被浪费 热点

【全球时快讯】15个幽默笑话段子高情商，精辟犀利，专治你的不开心

港股日报 | 恒生指数涨0.12%，南向资金净买入73.09亿港元，食物饮品板块领涨

环球短讯！外交部：中方对于乌克兰危机的立场是一贯的、明确的

上饶高铁站和火车站在一起吗_上饶高铁站 世界百事通

国家金融监督管理总局：前5个月保险业原保费收入同比增长10.68%

欧洲央行副行长：7月加息已定 9月加息与否看数据

每日看点!中国科学家4项新突破

世界速递！利差收窄削弱了纽元的关键顺风，未来面临下行风险！

NYMEX原油价格下看66.84美元-全球播报

2023年中国·东盟（凭祥）进出口商品交易会开幕 天天简讯

滴滴出行3天收浙江21张罚单 服务车辆未取得营运证等_全球百事通

（高质量发展调研行）让企业争相“落地”，临高金牌港开发区有何“秘诀”？

货币通胀意味着什么？2023年人民币将大幅贬值？

信泰千万传承(2023)终身寿险收益怎么样？多久能回本？

视点！寻访百店网是干什么用的 寻访百店

交易商协会：5月债务融资工具发行规模为5122亿元每日关注

多地点亮夜经济上市公司尝试“新玩法”-当前短讯

江阴银行: 第八届董事会第一次会议决议公告世界快消息

“原油交易之神”遭遇滑铁卢旗下基金年内巨亏51%-世界微头条

三未信安：收购资产完成，江南科友成为公司的控股子公司热头条

外媒评选欧美十大人工智能初创公司除了OpenAI以外还有谁？

消息称中骏集团正洽谈新贷款用于7月到期银团贷款剩余款项再融资环球滚动

中辉期货原油日报20230628：原油上行乏力，防范下探风险世界热议

夏日雨水丰沛桂林市龙胜各族自治县层层梯田如镜|全球即时

天天热门:感动！儿子患重病桂林66岁母亲割肾救子

“龙舟水”撤场了！广西的“桑拿天”回归体感或达40℃

李梦韩旭几乎打满全场合砍59分双核闪耀率队三连胜_每日看点

付费陷阱多江苏省消保委发布智能电视消费调查报告_天天新视野

全球热头条丨乘联会：6月前四周新能源车零售达50万辆同比增长13%

集邦咨询：多晶硅、硅片成交价暂时企稳电池片、组件价格普遍下滑世界头条

最近你的微信群里是不是也出现了“张华银”？他是谁？环球观焦点

世纪佳缘推出“组局”功能满足年轻人找“搭子”需求

报告显示美国超2000亿美元新冠救济金被浪费热点

上饶高铁站和火车站在一起吗_上饶高铁站世界百事通

2023年中国·东盟（凭祥）进出口商品交易会开幕天天简讯

滴滴出行3天收浙江21张罚单服务车辆未取得营运证等_全球百事通

视点！寻访百店网是干什么用的寻访百店

因报名参赛选手未达预期人数，陵水“南湾猴岛杯”歌手大赛取消世界播资讯

世界观天下！对财务数据进行追溯重述并调减归母净利润金额盈方微收深交所《监管函》

中国信托业协会：一季度投向房地产的资金信托规模1.13万亿元同比下降28.21%

生意社：预计汽油市场需求稳中向好柴油市场行情或小幅走低

“艺起迎亚运逐梦新时代”航头镇文化走亲文艺演出活动世界实时

成武县九女集镇：“美德信用”同参与打造儿童友好型社区

2022～2023长沙一中高二第三次月考三角函数第一问零点问题转天天速看

彩虹屁是什么意思_什么是彩虹屁环球最资讯

快递江湖风云再起菜鸟集团推出自营快递“菜鸟速递”

香港政府财政接连赤字陈茂波：当前不必开征新税或调整薪俸税

AI不全是炒作！Wedbush高呼：第四次工业革命正在上演视点

反向投资者纷纷加仓美国能源股即将卷土重来？|当前焦点