小硕一枚,浅谈几点。文本方式进行处理,目前应用的广泛程度应该是舆论监测吧。导师和师兄刚完成一个项目就是舆情监测方面的市里的项目。就目前的水平而言只能是构造数据库存储,然后检索关键字匹配的方式。如何能让机器像人一样的思考。这个涉及到人思考问题的本质。我认为人类思考问题是有两个方面-1:从已有脑海知识库中检索 2-自己根据已有情况推测。 不存在人类完全不知道的东西进行思考。 所以文本处理也是类似。都是根据已有的词典数据库检索。大多的文本处理都是基于表面的处理,而非隐含意。 人工智能的未来当然是机器像人一样思考。那么有这样一个逻辑锁:具有人工智能的机器人和人类谁更高级? 我认为是等价的。 人工智能可以代替人类完成重复性工作而非创新性工作--这句话对吗? 我认为是不对的。人类的创新不是凭空得来的,也是通过已有事件的概率变异得到的。 所谓科学家,就是在有两条路A,B的情况下,千分之999.99的人会走A,而科学家走了B。当然这个走B这条路也是基于很多理由的。那么我们需要找出这种理由。那么我们在初始设置人工智能的参数的时候就依概率设置,这种依概率设置在遗传算法和细菌觅食优化算法里有很好的体现。那么相同的这种概率设置也能在人工智能的核心进行体现,如何让机器思考? 人类的思考是基于之前遇到的事情和基因显性表达得出的。生物学上基因显性是前提条件,由于这种显性基因的表达在你一出生的时候遇到的天气+环境+人+空气+光照+等等等等 决定了你的一生。造出人工智能的一刻我们也就变成了拉普拉斯妖? 当然这不现实,现实是我们无法模拟环境特征,因为维数过高导致的维数灾难发生。当然目前我们也无法在生物学上完全的解析出基因的显性表达。 人也是一种机器,人的思考模式和思考内容是基因和高维环境变量的共同表达。 扯得远了。。。。
文本处理的方式很多,简单的翻译软件也是文本处理,是基于模式匹配的暴力方式和抽取特征字表达的。文本处理也是一个高维的事件。机器和人交流最主要的不是理解某一句话,而是理解上下文。而上下文是一个高维事件。他决定了交谈双方的态度以及交谈的引申意。 比如{ 1:臭不要脸。} 这句话该怎么回答? 这句话当然有很多解释。 情侣之间聊天是爱意,街上被别人踩了但是不说sorry 等等情况。 首先基于上下文给定聊天双方的主属性[恋人,陌生人,等等],当然这个主属性会随着概率变动,这个概率是得益于我们聊天的每一句话产生。这都是一种模糊的界限。 对于这句话你是回答[sorry,什么意思?,我要脸,不臭,等等],我认为都是根据概率来回答的。没一种回答都对应于一个概率值,当概率值偏向a的时候回答sorry 当偏向b时回答 我要脸。 因为情感界限是在[0-1]内的分布。0代表仇人 1代表爱人 其中还有很多种状态,0.1 0.2 0.22- 当然只是一个简单举例。 这个情感分布的每个概率值都对应于下句话的回答表[A,B,V,CADS,VB]中,每个概率值对应一个。
所谓个性化和理性感性,也不过是概率取值而已。
想说的话还有很多,好像很没有条理的样子。 总的来说我就是认为文字处理是一种概率。文字的显性特征是高维的可数集[交谈双方的关系,天气,等等一切涉及到的东西],当然这个维度太高,我们可以根据降维处理找到几个最关键的维度来表达文字处理。但是这种降维方式有两种,一种是人类的降维,一种是机器的降维。都是通过概率来降维的。简单来说也就是关联度。图灵测试就是互相交谈五分钟,通过检索数据库的蛮力方式还是通过概率估计来交流,我想人类的文本处理思维能力是通过概率的。可能将来我会在这方面做出点什么。。。但是现在我还刚接触机器学习和数据挖掘。 小硕加油吧。
人工智能不会超越人类,但人工智能的未来是具有人类一样的思考能力而且具有无上限的运行速度。 那么问题来了:那科技的发展就没有尽头了,因为概率总会发生,一直制造机器人就好了,对吗?
当然目前我们不会遇到这个问题,因为我们人工智能才刚起步。