而现在经过几个月变异进化后,向坤莫名地觉得,自己花费那多时间和成本去做出来“AI助手”,不应该“只是这样”而已。
所以他直只是在做“AI助手”门面工作——合成声。
在中秋那晚,向坤就向唐宝娜提出为他提供语音样本请求,后者也答应,而样本采集很早就已经完成,他也已经对已有个开源语音合成模型进行针对性修改,然后经过训练,它成功模仿唐宝娜声音。
虽然这段时间都是断断续续地在做,但经过个多月时间,基本上已经算是完成。
不过向坤对于这个完成结果还是有些不太满意,虽然整体对文本朗读流畅度、对语境理解程度、词法分析、句法分析、语用分析,都比原版语音合成模型有非常大提升。
不过脑子里飞快地计算下,向坤却是冒出个点子,觉得或许可以用用。等天亮后,跟游猛商量商量。
向坤又想起自己AI助手计划,他打开个输入界面,看起来就像个简单文本编辑器样,只是文本输入界面最下方有几个简单按键,整个界面基本没有什UI设计可言。
向坤文本框里输入行字:“大家好,是唐小娜。”
然后按下下面播放按钮。
接下来那句话,便以唐宝娜声音说出来,声音柔和、语气平淡,但听起来发音还是十分地自然顺滑,乍听之下,并不会有任何违和感,更不会想到不是真人说出。
看着电脑屏幕上那有关三光头联系讨论,向坤背靠电脑椅,脸生无可恋。
本以为他那装B做菜视频很快就会被网友遗忘,没想到冒出堆恶搞配音玩法。
本以为这种恶搞配音玩法用不多久网友就会玩腻,去寻找新素材,没想到居然又把他之前“背影图”和“见义勇为视频”给关联起来。
他不用去看那些评论、搜那些相关内容,就知道会是什样讨论情况。
看来这热度,时半会又是降不下去。
但整体而言,并没有真正地超出当前最顶尖水平,不论是国外还是国内,单纯阅读文本语音合成AI,都已经做得很不错。而它们所面临些瓶
不过以向坤耳朵,还是听出很多问题。
他“AI助手”计划虽然很早前就已经做出整个框架,基本确定体系结构、数据结构、关键算法和模块功能。
但实际有开始去做,只有语音合成这部分功能,因为向坤其实对他所做这个“AI助手”计划,依然还是不满意。
其主要核心,依然都还是现有、成熟各种方案,他只是在做更好整合和修改。
先不说以后成品功能是否能满足他需要,单就这实现过程,就还需要大量时间和其他成本,不是他个人时半刻能做好。
也好在是他这几个月变化很大,又成光头,以前同学、熟人什般都认不出他来——连亲妈都认不出来,其他人要认出来难度可想而知。
能从这图片和视频分辨出他真实身份,就那寥寥数人。
否则话,怕是他真实身份,早就被人给直接扒出来。
现在怎整?
算,继续凉拌吧,反正他是不可能主动去冒头收这个热度。
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。