左叶小说网

手机浏览器扫描二维码访问

第十八章 语义识别的难点(第2页)

“智能小语1.0七天后正式上线!”

朱成很快就看到了顶端的信息。

“暂时推出的软件分个人版和企业版。

个人版免费使用,企业版有为期七天的试用期。”

在软件的下方还分别有个简介。

个人版对于生活方面的识别会更加精准,而企业版更注重于会议,可支持多人同时录入,抗噪音能力也更强,并且还可以选择去口语化,使会议内容更接近书面格式。

网页里面的信息不多,很快朱成就看完了。

对于七天后软件的发布十分期待,语音录入可是懒人必备的神器啊,以后估计都不用打字了。

“智能小语,也可以叫语音输入法吧?”

如果不用打字了,是不是意味着键盘也没用了?那笔记本岂不是可以做的更薄?不对,没了键盘不就成了平板么?朱成想到了这一点,感觉自家的电脑城可以多进一些平板电脑了。

在外界因为语音识别而震惊的时候,罗辑所在的机房却只能听到敲键盘的声音。

尽管语音识别已经做了出来,但对于写代码而言意义不大。

真正能将罗辑从这些繁重的任务中解救出来的只有语义识别!

开发语义识别,就如同罗辑预料的那样,并不是一块好啃的骨头。

更何况是中文体系上的语义识别,这比其它语言要难上几个级别。

光是分词这一项,就能让人死掉不少脑细胞。

中文不同于单词组成的拉丁文,拉丁文单词间的空格可以大幅度减少电脑的识别难度,而中文却不行。

在中文里面,一句话就有很多意思。

别说电脑了,有时候就连人也不好分辨。

比如那句著名的“下雨天留客天天留我不留”

,在没有标点符号的情况下,它至少有七种意思。

对于电脑而言,别说这种地狱级的分词,哪怕是一些人们看来再简单不过的句子也很难分辨。

比如“华科大学生前来应聘”

,电脑可能会理解为“华科大学,生前,来应聘”

中文语义识别的第一个难点,也可以说是最大的难点便在这里。

怎样的分词算法才是最完美的?

罗辑在科技树中找到了方案,一种基于统计学模型的算法,构建一个三维矩阵,选取概率最高的一个。

xy轴是任意两个词语的组合,而z轴则是场景状态,根据语气和语态选取的最佳方案。

“不过这需要联网。”

罗辑琢磨了一下,这似乎是目前最好的方案,虽然他的本意是打造一个可用于线下服务的智能,但是以现在的设备存储能力想要存下大量的语料库,根本就是天方夜谭。

电脑肯定是不行的,光脑还差不多。

热门小说推荐
洪荒之玄龟逍遥录

洪荒之玄龟逍遥录

一个拥有异能的超级懒虫伪宅男睡觉睡到了天地未开的混沌中,醒来成了只超级大乌龟,并获得了至宝混沌珠。于是开始了洪荒的逍遥生活,本无意改变天地,可天地因他大变...

阴阳门之崛起

阴阳门之崛起

二十年前一块石磬引发阴阳门师兄弟五人被杀,二十年后一位青年带领师兄弟七人,为二十年前死去的师兄弟五人复仇,阴谋,算计,一个热血沸腾的复仇之路由此拉开帷幕,他们能否带领阴阳门走回曾经的巅峰?...

我真不是学神

我真不是学神

苏恒重生平行世界,却发现这是大明650年,崇祯大帝是人类第一位灾变境强者,只身渡星宇,单手灭星球,无数高中大学,教导的是人体修炼进化学说,精英大学生飞天遁...

天谕世界

天谕世界

网易天谕游戏就要公测了,作为一名资深游戏迷,让我带你畅游在我想象中天谕的世界,没有枯燥的练级,没有一蹴而就的奇迹,跟随主角的脚步,带你去看真实的天谕。...

无敌坦克

无敌坦克

陈墨觉得最近的小日子过得舒服极了,为毛?因为他也穿了!进进出出的同时,还能搞点不同位面的私货,高科技啦,新材料啦,文娱作品啦等等等等所以现实中的陈墨日子过的不要太舒服噢!可是,陈墨心中总是有一个伟大的愿望,那就是在空间里打造一批属于自己的真正的无敌坦克,啥子标准呢?考虑了许久,陈墨定了这么一个标准E100的车身,IS7的头,62A的上弹速度,WT100的炮,M48A1的视野,502的速度!嗯,最后加上老鼠的重量吧,那玩意沉,撞谁谁死,谁撞谁死!好吧,暂时就先这样了,不扯了,赶紧穿进去照着这个标准造坦克去喽!本书已经成功签约,所以读者大人们敬请放心收藏推荐,本书保证不会太监!您们的支持就是小墨写书的动力!各位书友要是觉得无敌坦克还不错的话请不要忘记向您QQ群和微博里的朋友推荐哦!...

重生之我为书狂

重生之我为书狂

重生回到与地球相似的平行世界。他以小说坏蛋是怎样练成的,开创了小白文热潮。他写的射雕三部曲,直接将旧派武侠推向了新派武侠高峰。他写的白蛇传,梁山伯与祝...

每日热搜小说推荐