看齐中文

手机浏览器扫描二维码访问

第十四章 突破新输入法神器(第1页)

杜克进入一种入魔一样的研究状态,他现在的时间非常宝贵,完全没有多少可以浪费的空间,所以在吃完后就迅速回到自己那个小小的家里。坐在24小时不间断下载的电脑面前,他疯狂搜索下载各种语音片段资料,交给克里进行语音语义分析及基础知识库的建设。

自从搬到出租屋后杜克已经疯狂在网上下载了数千各种环境和语境下的语音片段,从电视电台新闻片段到影视剧对白、动物世界或是国家地理频道的科教解说片段,以及各种偷拍、自拍、伪自拍生活现场片段,感谢酷溜土豆、youtube,还有bt和电驴,让杜克知道原来世界还有如此丰富多彩声音。

杜克收集的如此众多声音索材对于克里处理能力来说却仿佛是沧海一粟,往往刚刚输入进去,克里就运算解析出来该片段的语音语义特征,从而为语音识别的语音语义特征库增加一份新的标本元素,越是不同的语音片段越有价值。

这就像一个人生活过的地方越多,就越能听出不同地方口音是一个道理,每个声音都是有一些特殊特征和普遍特征构成的,现在的语音识别软件对于标准发音的识别率其实已经很不错了。

如ibm在很多年前就推出语音识别输入系统viavoice,在安静环境和标准发音情况下软件识别率可以达到实用级别。

可惜实际运用环境不会那么理想,而是就像杜克寝室中4个人一样千差万别,虽然大家说的都是中国话,但是四个来自不同地方的人的口音却大相径庭,刚刚住在一起的时候四个人沟通经常有些问题,但是大家很快就适应下来。

人脑强悍的学习能力绝对不是当今电脑所能够比拟的。而现有的语音识别软件却没有这么强悍的学习适应能力,也就是说它没有用来识别这种语音特征差异的知识库,当然就无法将一些未知类型的发音很好的识别出来。

不同口音的识别和环境噪音的排除是语音识别俩个难题,要解决这些问题需要大量的第一手语音资料片段来建立一个海量的语音特征知识库,或者是开发出像克里这般高度智能的超级电脑。

克里根据杜克下载的理论资料,结合各种语音片段分析,不断对语音识别基础算法进行了更新,并且生成不同的语音识别模拟器--这是主要考虑到地球现在主流电脑的运算水平比起克里来说实在太低级。

以模拟iphone4s的50%运算能力为最低基准,克里模拟出不同性能情况下该语音识别算法的准确率和反应时间,原始版本从最初基准性能下5秒内能够达到90%的识别准确率--当然这个成绩已经远超现在地球上所有语音识别软件水准。

要知道这个90%准确率是用数千段不同语境的不同口音中英文语音信息进行模拟识别检验,也就是说基本上考虑了各种口音及噪音的过滤处理。

这个成绩已经比现在只会听英文的苹果siri要强多了,毕竟siri现在能够识别的也是比较标准的英文发音。不信你拿印度口音和新加坡口音的英语录音片段试试看siri能够识别出多少来。

如果是在一台模拟性能接近双核2g以上主频电脑上,这个指标的识别水平将会提升到2秒以内达到97%以上准确率,反应时间同识别准确率其实有些冲突,因为要识别更加准确必须要原始版本的语音语料库基础资料来源更加丰富。

声音采样越广泛识别准确率越高,而语音样本库越庞大,用于搜索匹配的时间就会越久导致反应时间的延长,因此语音样本的抽样压缩和语音搜索匹配算法一直是克里优化的俩个重点。

克里一直在不停地模拟改进提取语音语义特征值的算法,通过不断压缩冗余值,在保持不失真的情况下持续不断缩小语音样本语料库大小,另外一方面也不断改进对语音语料库智能搜索匹配算法。

优化算法杜克帮不了什么忙,但是收集尽可能多的语音样本杜克却没有问题,所以杜克的每一天都过着一种非常充实的生活,日复一日地搜索下载不同类型的语音样本供克里分析提炼,同时不断去学习理解克里所创造的这些全新的处理算法,要敲开麻省理工的大门。

杜克必须要有一篇体现自己能力的世界领先水准的语音识别基础理论创新性论文,可是在克里的知识库中并没有现成的语音识别知识,这些对于克里来说太老旧了,老旧到比莱姆都没有为克里增加这些知识。

而克里现在做的就是在地球上现有语音识别理论和算法基础上,利用他强悍到无边的模拟能力,不断地模拟各种不同的语音处理算法。

通过模拟来找到一种更加有效的--这种方法虽然有些笨拙,但是有了克里超强的运算能力,毕竟每秒钟成千上万种可能算法都可以模拟,使得这种笨拙的方法也有相当的效果,找出了好几种可能的优化算法,将识别率和反应时间提升到了一个新的高度。

可是要将这些成果用地球人能够理解的语言和理论写出来,还要让人能够看懂,不管是对克里还是杜克来说都是一个新挑战,因为克里不是以01为核心的机械二进制思维模式,而是生物多态思维模式。

尽管克里现在已经能够瞬间同时模拟出地球上常见十多种不同性能pc机虚拟机--为了让克里能够准确了解地球上电脑的运算能力,杜克买了四台不同接口的主机和接近二十块市面主流pc机cpu提供给克里分析和测试性能基准,然后克里根据这些配置的性能来进行虚拟对应的模拟器。

陆少,宠妻无敌!  席卷晚明  倩影圣手  妖王乖乖让我养  婚令如山:早安,我的小逃妻  堂上春  天降老公:一宠钟情  太极真人  权少在下萌妻在上  重生幸福记事  踏墓  小贵女  意难平  巫途  私密关系  失忆萌妻:误惹洁癖总裁  男神心尖宠:卖萌求休战!  望余雪  帅爆全地球[星际]  只有他知道  

热门小说推荐
兰言之约

兰言之约

身为金融分析师的兰亭暄一直是同事眼中的模范社畜加班狂人,直到有一天,卫东言亲眼看见,她单手就把对她动粗的初恋男友反掼倒地。卫东言在兰亭暄眼里一直是高不可攀的金融新贵投资大佬,直到有一天,兰亭暄亲眼看见他扒在一辆半旧的皮卡车底,在泥泞中拖了半条街。这是逆向掉马了嘛?两人各自转头,当无事发生。谁都没想到,有一天,命...

穿成大反派的团宠闺女

穿成大反派的团宠闺女

穿书团宠腹黑小娇包别人穿书都是穿成公主皇后妃子,偏偏季裳初穿成了一个跟剧情毫不相干的人?毫不相干也就罢了,穿过去的第一天还经历了了屠村,父母双亡?季裳初郁闷。为了好好活下去,她自然是要抱个好大腿。战无不胜能文能武风姿绰约的晟王便成了她的亲爹首要人选。从此,晟王身后多了一个小娇包爹爹长,爹爹短,爹爹的养老初初管。太后哀家的孙女真可爱。皇帝朕的小侄女真可爱。闻太师本座的孙媳妇真可爱。楚尧???晟王爷千防万防,防得了近贼,却没防住远贼。医蛊少年宋玄卿,历尽天下冷暖,过眼风情万千,却独独败在了西楚小郡主的石榴裙下。数年之前,季裳初机缘巧合拾得一块血玉麒麟,数年之后,她被蛊神宋玄卿逼至墙角,那人如同皎皎天上仙般不染凡尘,邪魅一笑便足以勾魂。小郡主可知,您身上佩戴的血玉麒麟,乃是宋家儿郎的定亲之物,小郡主佩戴此物多年,那宋某,也就只能认下小郡主这未婚之妻了。季裳初!!!如果您喜欢穿成大反派的团宠闺女,别忘记分享给朋友...

追夫99步:国名男神,我爱你

追夫99步:国名男神,我爱你

一直暗恋着宁城的某女疯狂的追着他满世界跑,某日,宁城被追的忍无可忍,有她这样追人的吗?不表白,只知道跟,别追我。卓言兮充耳不闻,嘴角上扬,将他壁咚在墙上,不让我追你,难道要我睡你吗?不要脸。要脸干嘛,要你就好。过去卓言兮对宁城的爱不屑一顾,直到他离开,她终于后悔,本以为此生再也见不到他,没有想到命运眷顾,让她重新在他的身边努力的去爱你,是害怕余生都是回忆,希望余生都是你。如果您喜欢追夫99步国名男神,我爱你,别忘记分享给朋友...

相爱终有时

相爱终有时

前夫为她费尽心思不得秘密,甚至不惜让她入狱,收她的野种。而她的小叔同样为她秘密,将她收容,毫不吝啬的开口。要得到什么,先要得到她的心她展露才华,步步高升,接近他,只为那情深已久...

海洋亚龙的自然帝国

海洋亚龙的自然帝国

龙,世界上第一个智慧种族,横跨千年的漫长生命周期让他们成为世界的象征并体现了世界的历史,古老的龙拥有的知识和智慧让他们成为智者和先知,是智慧的源泉和即将到来事物的先知。他们是祥瑞,他们也是灾厄!阿提兰以海洋亚龙之身降临这个世界,金属龙和色彩龙之外的元素巨龙,亚龙,亚种真龙,元素龙神以地风水火塑造的全新真龙。无父无母的雏龙,在传奇大德鲁伊的教导下,开创属于他的种田与基建自然帝国!DND巨龙种田争霸德鲁伊如果您喜欢海洋亚龙的自然帝国,别忘记分享给朋友...

与心爱的人共同度过的19个星期

与心爱的人共同度过的19个星期

小娟暗恋的男生小伟突遇车祸,为救小伟,小娟卷入了一场奇异之旅如果您喜欢与心爱的人共同度过的19个星期,别忘记分享给朋友...

每日热搜小说推荐