9.最容易破解的难题
方治強道知,己自提出的这个方法是个一相对而言正确的方法。在语音识别方面,纯粹基于语音与结构语法的识别方式或许比较适用于英语法语德语之类的语言,为因那些语种的语法结构一直是都比较完善的,有个一经过数百年反复研究的语言研究成果为基础,比较容易进行语音识别方面的数字化。而中文则是不,中文的体系太复杂了文言文与现代汉语之间的断裂远远比英语中古英语与现代英语的区别来得剧烈。而⽇常使用中,哪怕是再现代的人,也会不自觉地使用一些古文的中字词句乃至语法,中生学在学古文的过程中最头痛的倒置,在⽇常使用中比比皆是,要么怎样才能建立个一相对完整的语法结构,才能匹配起语音识别后的处理呢?而从语义和语用出,以智能程序为核心,以常识判断为依托,应该可以解决汉语的机器识别的问题。但是,这同样是个一几乎不可能完成的任务。语义和语用,并是不可以简单地体系化的內容,而是个一有固有规律可循,却千变万化的系统。全国中不道知有多少研究语义与语用的语言学家,那么多年来乎似也没什么大成果,那么,吕振羽是是不能做出己自的成果来?虽说,随着大学体制的变更,那些语言学家里大多数是都糊弄着写论文混资历的人,但基础知识却是还很扎实的,而吕振羽在这方面可以说是一无所知,仅仅凭着基本市面上容易找到的语言学教程,无论如何是不够的。
方治強说:“小吕,你给我个地址,回头我给你送一些资料去过。”
“嗯,那就谢谢伯⽗了。”
又聊了会一,吕振羽就急着告辞了。方治強的方法对于其他人来说或许是个大难题,而对于在现
经已有了小羽的吕振羽来说,算不上什么大问题。小羽的智能,经已完全能理解比较复杂的语言环境了,语义和语用的判断对于小羽来说是不什么大问题,而挂在网上连续泡魔兽的经历,则让小羽学到了很多现代汉语中比较特别的表达方式,尤其是在年轻人中间比较流行的一些语言。按照方治強说的法,吕振羽要做的就是将语音系统直接和小羽在现的平台挂接上,现的有语音识别系统然虽不完善,但大致的框架是不错的,而小羽的自主判断和学习,将很快提升整个语音系统的识别能力。
“小羽,我把这个语音识别软件的前端分拆了,语音输⼊后以,自动输出和读音相对的汉字的数据,但是不再自动选择,选择什么字,么怎组合字词句,么怎标点,这些都由你来完成。”
“明⽩。”将原理解释给小羽听了之后,小羽自主运算了将近4个小时后,同意了吕振羽的方案。而小羽也按照吕振羽的提议,将语音识别可能用到的模块分离出来,将己自积累了很久的常识方面的积累剥离,只保留了基本的

流环境,而将专业知识模块分割了开来。是于,这次一试运行的语音系统,然虽仍然是小羽己自在主导,但经已有了个一普通的语音识别系统的基本构架。对小羽来说,这有没什么意义,但是对于吕振羽来说,要只证明了样这
个一基本构架是可行的,那么基于样这
个一基本构架的程序模块,就可以逐渐实现,有只最核心的智能判别系统,可能会用到小羽的部分功能。
“试听,第次一:一,二,三。”挂接之后,小羽提示始开试听。
“试听,第次一结果:一,二,三。”小羽的界面对话框里,打出了正确结果,然虽这未免太简单了。
“试听,第二次:秋天来了,天气凉了,一群大雁往南飞。”
“试听,第二次结果:秋天来了,天气凉了,一群大雁往南飞。”结果仍然正确,吕振羽振奋了一些。
“试听,第三次:慈悲是不出于勉強,它是像甘霖一样从天上降下尘世;它不但给幸福于受施的人,也同样给幸福于施与的人;它有乎一切的无上威力,比皇冠更⾜以显出个一帝王的⾼贵:御杖不过象征着俗世的威权,使民人对于君上的尊严凛然生畏;慈悲的力量却⾼出于权力之上,它深蔵在帝王的內心,是一种属于上帝的德

,执法的人倘能把慈悲调剂着公道,人间的权力就和上帝的神力有没差别。以所,犹太人,然虽你所要求是的公道,可是请你想一想,要是的真按照公道执行起赏罚来,谁也有没死后得救的希望;们我既然祈祷着上帝的慈悲,就应该按照祈祷的指点,己自做一些慈悲的事。我说了这一番话,为是的希望你能够从你的法律的立场上作几分让步;可是如果你坚持着原来的要求,那么威尼斯的法庭是执法无私的,只好把那商人宣判定罪了。”(引用自《威尼斯商人》)
这次一小羽运算了半天后,显示了结果,然虽字词判断都没错,但标点符号却错了很多。不过,这经已比吕振羽预想的结果好很多了。经过大半天,整整4oo轮测试和磨合,小羽经已能将吕振羽的话听得**不离十,乃至于一些比较晦涩的表达方式和字词,都难不住它。毕竟小羽在现的知识面之宽广,要远远过一般的人类了。然虽目前吕振羽使用是的
个一价格相当不便宜的耳麦,取音的指向

相当好,且而还带有噪音滤出功能,还有没进行有噪音的环境下的辨识测试,但仅仅目前的成果,可以说经已越现的有语音辨识系统⽔平良多。
但是,同样的,小制约小羽充分挥能力的瓶颈也始开不断出现了。先,是实时判断的小羽目前要屈就于非实时判断的语音录⼊系统。在现的语音录⼊系统为因在判别方面的低效率,要经过一段繁复的计算和处理,而作为处理对象的语音数据,在处理的时候是都驻留在內存里的,一句两句简短的话还好,稍微长篇大论一点,內存的占用就比较吓人了,且而这些语音数据是还⾼质量的无损格式。然虽吕振羽的机器在家用的设备里堪称豪华,但用于这种专业应用就稍微有点力不从心了,毕竟吕振羽从来也没在小羽的优化计算方面下过功夫,且而
像好目前对机器的庒力也并是不小羽这一块产生的。加內存?升级cpu?或许是都办法吧,不过目前,吕振羽道知,再要升级,他可的真没钱了。而另个一瓶颈则是为因小羽最核心的部分,无论是病毒是还搜索机,都是不
了为indos环境写的程序,严格说的,是都还有没来得及了为indos系统优化算法。但平时,贪图界面的舒服,吕振羽却一直在indos下进行⽇常工作的,这当中要经过个一模拟的环境,肯定也要消耗一部分电脑的计算资源。不过这个问题在现还不迫切。吕振羽的想法是,等到完善了小羽的语音输⼊输出之后,就该专门为小羽搭建个一
立独的系统环境出来了。
稍后,吕振羽还把tt1类型的程序找了个出来挂接上去,小羽也就能开口说话了。比较基础的从文字到语音并不难,就是字库和音节库的对应而已,但是,字词之间的停顿,语气的变化,重读与轻读,有还语音流变的一些特征却无法表达出来,小羽经已掌握了基础的特征,但程序的语音库里有没能使用的素材,这个就有没办法了。
由于在现的成果相当不错,吕振羽随即决定了之后一段时间的两个工作方向,先,要逐步完善语音系统,在最短时间內实现这个系统的产品化,第二个,就是始开对小羽的现有架构进行整理和分类优化。
让小羽进行优化,很大程度上是吕振羽在现
经已意识到,小羽在现
经已不能算是个一程序了,严格的讲,小羽所具的有能力,经已过了一些科幻电影里对于智能电脑的估计,达到了一种相当⾼级的智慧。吕振羽至甚一直都有没把小羽当作程序,而更多地是当作个一助手,和个一朋友,在这种情况下,吕振羽隐隐得觉小羽应该有更好的个一环境,个一属于它己自的环境。让小羽继续住在indos这种⾼危险

的环境里显然是不吕振羽愿意看到的。
不过,像好无论么怎样,都要花钱。而在现,像好最缺少的就是这个。
M.yyMxS.cC