本站最新域名 m.boshishuwu.com
; 「差不多,不过我觉得CMU Sphinx不好用,尤其是识别准确率低丶训练效率低,还没有可视化的操作界面,所以我才想着自己开发。」
陈延森说话的同时,手上的动作并没有停下来。
说完他见宋允澄一脸疑惑,便补充道:「CMU Sphinx是一款开源语音识别工具,主要用来处理语音和文本数据。」
「你懂的知识可真多。」宋允澄眼中,闪过一抹崇拜的神色。
「姿势当然懂得越多越好。」陈延森微微一笑,快速把模型架构的设计工作收尾,随即合上电脑,抱着宋允澄往浴室走去。
第二天上午。
陈延森带着宋允澄去了一趟北山。
「原来你妈妈这麽漂亮,可陈叔叔……」宋允澄恭恭敬敬地上香,在看到梁慧珍的照片后,满心疑惑。
「老陈年轻的时候,有我几分帅气的样子,现在年纪大了,整天不修边幅,才一副潦草颓废的模样。」
陈延森笑着说道。
「难怪陈叔叔小时候总踹你,我估计,每一脚都事出有因。」宋允澄捂着嘴笑道。
陈延森翻了个白眼,没搭理她,冲着墓碑,在心里问道:「妈,你看这个怎麽样?要是满意,就给儿子托个梦。」
宋允澄在春申待到十点,又马不停蹄地赶回庐江。
接下来几天,陈延森宅在酒店,继续完善语音识别工具的声学丶卷积神经网络丶深度神经网络和循环神经网络模型。
他只负责构建框架体系,具体的细节工作,会交给来自华科大丶庐州工业和徽安工业大学的毕业生。
通常,一个人很难独立完成一款语音识别工具的开发工作,因为既要掌握语音信号的处理技术,又得精通程式语言和算法模型。
可陈延森早就积累了大量相关的技术储备,在别人眼中,属于复杂且综合性极强的研发任务,对他来说,只是初级难度罢了。
等到1月27号时,这款被命名为「语析」的语音识别工具开发,就已经完成了整体框架的构建。
但距离上线,还差了十万八千里。
一款语音识别工具最核心的功能是将语音信号转换为文字信息,但这离不开大量的数据支撑。
要想识别不同性别丶年龄丶方言丶语速的语音,以及在不同环境下录制的语音,都需要海量的语音数据,并经过准确的文本标注后,才能启动训练模型。
如今的「语析」不过是个空壳子罢了。
(本章完)阅读模式加载的章节内容不完整只有一半的内容,请退出阅读模式阅读
阅读模式无法加载图片章节,请推出阅读模式阅读完整内容
『加入书签,方便阅读』