科技大国崛起最新章节_第十八章语义识别的难点第2页_科技大国崛起快眼看书

左叶小说网>科技大国崛起手机访问加入书架小说详情

手机浏览器扫描二维码访问

第十八章语义识别的难点（第2页）

“智能小语1.0七天后正式上线！”

朱成很快就看到了顶端的信息。

“暂时推出的软件分个人版和企业版。

个人版免费使用，企业版有为期七天的试用期。”

在软件的下方还分别有个简介。

个人版对于生活方面的识别会更加精准，而企业版更注重于会议，可支持多人同时录入，抗噪音能力也更强，并且还可以选择去口语化，使会议内容更接近书面格式。

网页里面的信息不多，很快朱成就看完了。

对于七天后软件的发布十分期待，语音录入可是懒人必备的神器啊，以后估计都不用打字了。

“智能小语，也可以叫语音输入法吧？”

如果不用打字了，是不是意味着键盘也没用了？那笔记本岂不是可以做的更薄？不对，没了键盘不就成了平板么？朱成想到了这一点，感觉自家的电脑城可以多进一些平板电脑了。

在外界因为语音识别而震惊的时候，罗辑所在的机房却只能听到敲键盘的声音。

尽管语音识别已经做了出来，但对于写代码而言意义不大。

真正能将罗辑从这些繁重的任务中解救出来的只有语义识别！

开发语义识别，就如同罗辑预料的那样，并不是一块好啃的骨头。

更何况是中文体系上的语义识别，这比其它语言要难上几个级别。

光是分词这一项，就能让人死掉不少脑细胞。

中文不同于单词组成的拉丁文，拉丁文单词间的空格可以大幅度减少电脑的识别难度，而中文却不行。

在中文里面，一句话就有很多意思。

别说电脑了，有时候就连人也不好分辨。

比如那句著名的“下雨天留客天天留我不留”

，在没有标点符号的情况下，它至少有七种意思。

对于电脑而言，别说这种地狱级的分词，哪怕是一些人们看来再简单不过的句子也很难分辨。

比如“华科大学生前来应聘”

，电脑可能会理解为“华科大学，生前，来应聘”

。

中文语义识别的第一个难点，也可以说是最大的难点便在这里。

怎样的分词算法才是最完美的？

罗辑在科技树中找到了方案，一种基于统计学模型的算法，构建一个三维矩阵，选取概率最高的一个。

xy轴是任意两个词语的组合，而z轴则是场景状态，根据语气和语态选取的最佳方案。

“不过这需要联网。”

罗辑琢磨了一下，这似乎是目前最好的方案，虽然他的本意是打造一个可用于线下服务的智能，但是以现在的设备存储能力想要存下大量的语料库，根本就是天方夜谭。

电脑肯定是不行的，光脑还差不多。

本月排行榜

本周收藏榜

最新更新

新书入库