第237章 深度学习的开始(2 / 2)

加入书签

想要做做科研,最重要的,当然就是发表论文了啊。

发啥子呢,就是莫浩波的本职工作,人工智能啦。

最近这一阵子,深度学习可是越发火热了啊,可以说是炙手可热也不为过。

自从2012年Hinton团队构建的CNN网络AlexNet一举夺得ImageNet图像识别比赛冠军(15%错误率),且碾压第二名(SVM方法,26%错误率)的分类性能。

从那时候起,由CNN引发的深度学习、人工智能狂潮,飞速火爆整个世界,激荡着这个时代,以及这个时代的我们!

图像识别、语音识别、计算机视觉和自然语言处理等人工智能细分领域迅猛发展,成果和进步如雨后春笋般涌出,深刻影响着每一个人。

当然,现在只是12年过去不久,才13年中,深度学习尤其是图片识别和CNN火爆整个人工智能学术圈,但至于火爆整个社会,那还远远说不上。

不过刺激刺激互联网企业,却是实实在在的,记得也是这一年,重量级互联网巨头,百度才开始赞助人工智能顶级会议的。

无论承认与否,我始终觉得,百度是最有技术基因的中国互联网企业,13年的时候他在干嘛?移动互联网的上半场转型失败了的百度,正布局移动应用分发,收购91;布局O2O,做平台卖外卖;布局互联网金融,做支付工具呢。

什么都做,什么都不突出,是百度那时候新项目的真实写照。至于人工智能,那可就是2016的事了。

要说对人工智能的理解,重生归来的莫浩波,肯定是比所有人都要强的,可是现在弄不出什么牛逼的东西出来。

无他,硬件不够,莫浩波大哭。8G内存,1个GPU,够干啥,CNN和图片识别、计算机视觉是不用想了,这条件,也构建不出啥深度模型。

语音识别比较简单,莫浩波也不熟,就不去凑热闹了。那就只有自然语言处理了!文本也比较适合他现在的情况,虽然即便是18年,自然语言处理技术也不咋地,和牛逼哄哄的图片识别相比,那是一个天上一个地下的水平啊。

不过,必须要说,聪明的研究人员,也做出了很多了不起的成绩。

莫浩波要抄的,就是13年10月投稿的词向量word2vec改进——负采样技术。

Word2vec,那在自然语言领域可是无人不知无人不晓啊。可以说,它是深度学习领域自然语言处理的核心基本构建了。

将文本信息,比如说一句话“明天天气怎么样?”,转化为计算机能够识别的信息,那就是要转化为数学啊。

用one—hot(唯一标识)方法(就是说用不重复的数学表示所有文字),虽然简单但是效果并不太好,因为这样做的话,就丢失了很多语句中隐藏的信息。

而word2vec是一种能够保留局部上下文信息的方法…………

↑返回顶部↑

书页/目录