机器学习里的基础学习方式有两种:监督学习和无监督学习。从名字就可以看出来,监督学习是有指导的学习,就象小孩在学校里听课,在老师的指导进行学习。相对的,无监督学习是没有指导的学习,类似小孩即使没有听老师讲课,也能通过自己学习和观察获得大量知识。 图1:监督学习与非监督学习[3] 一般来说,监督学习多用
人类的情感是很玄妙的东西。早在两千年前,亚里士多德就意识到情感在社会交流中的作用。比如,他认为一个在合适场合能有点儿脾气的人值得敬重,没脾气的反而是傻瓜。换句话说,情感本身就是一种智能。Rosalind Picard的《Affective Computing》一书是情感计算的起点。Picard认为,
诗词是中华民族的文化瑰宝。不论是“长风破浪会有时,直挂云帆济沧海”的豪迈,还是“月上柳梢头,人约黄昏后”的婉约,不论是“衣带渐宽终不悔,为伊消得人憔悴”的刻骨深情,还是“肝胆洞,毛发耸,立谈中,死生同,一诺千金重”的男儿义气,诗词伴随着中华文明走过了五千年的风雨历程。 诗词为什么有如此强大的精神感染
随着深度学习的发展,机器已经可以生成具有大师风格的绘画作品。图1是德国图宾根大学的Gatys等人利用卷积神经网络合成的具有独特风格的图片,其中左上角是原图片(图宾根小城),余下三幅为将原图转换成不同风格后的生成结果。在每幅作品中,左下角的小图为提供风格的三幅名画,作者分别为约瑟夫·特纳、文森特·梵高
贝叶斯公式在机器学习中占有重要地位,是基于概率的推理方法的基础。例如:如果某个地方发生地震的可能性表示为一个概率P(地震) ,而发生地震时井水发混的可能性表示为概率P(井水发混|地震) 。那么,如果有一天发现井水变混了,有多大的可能性会发生地震呢?贝叶斯公式就是用来计算这个可能性的,记为概率P(地震
机器能理解人类的语言吗?很难。 人工智能的创始人图灵在设计图灵测试时给出的智能标准即是对语言的理解和运用。他认为,如果一个人和计算机进行语言交流,如果无法判断出对方是人还是机器,那就说明机器拥有了足够的智能。可见语言在代表人类智能方面处于非常重要的地位。 1. 语言理解为什么如此困难 为什么
卷积神经网络是深度学习系统的重要组成部分,在图象识别、人脸识别、汉字识别,以及自然语言处理中,有很广泛的应用。那么,什么是卷积神经网络呢? 我们先来看看什么是卷积。 图1. 卷积示意图 上图是一个卷积示意图。输入是一个5*5的矩阵,中间是一个3*3的卷积核,输出是一个3*3的矩阵。首先设置一个与卷积
对于计算机而言,汉字的输入远不象英文那么方便。为了让计算机“接受”汉字,人们设计了各种输入法,其中拼音输入法最自然,应用也最广泛。 早期的拼音输入法是逐字输入的,即用户输入拼音,计算机提示该拼音对应的汉字,用户再从中进行选择。由于汉语中一个拼音可能对应大量汉字,人们不得不在一个长长的列表中进行选择,
给一幅现在的照片,如果能生成童年时的模样,将唤起很多美好的回忆。现在,人工智能可以帮助你实现这个梦想。 图1是Tennessee大学2017年的一篇论文中给出的方案[1]。在这一方案中,输入照片通过一个神经网络编码器E映射到隐空间中的点z,这个z代表了年龄以外的人脸信息。在z上附加一个表示年龄的信息
先看看下面一组照片。最上面四张是祖父母、外祖父母的照片,第二行是父母照片,最下一行是孩子照片。 你可能没想到的是,父母和孩子的照片都是用深度神经网络生成的。这是腾讯AI lab和天津大学去年的一个工作[1]。是不是看着还挺像的? 图1:由祖父母自动生成的父母和子女照片[1]
二十年前开车还是靠一张地图走天下,现在如果没有导航几乎是寸步难行了。早期导航还存在一些缺陷,现在的导航还是非常靠谱的,绝大多数情况下不会出错。 导航的核心任务是在地图上找到一条从起点到终点的路径,称为路径规划。最简单的路径规划是找到一条从起点到终点的“最短路径”。Dijkstra算法是一个经典的最短
开车走在路上,听着导航里志玲姐姐给你带路,是件非常愉快的事。这么甜美的导航声音是如何产生的呢?今天我们就聊一聊背后的语音合成(Speech Synthesis)技术。 让机器像人一样开口说话是人们很早就有的梦想,但真正的研究还是在Leonhard Euler在1750年左右建立了声音的物理学原理之后