【AI100问(120)】什么是序列到序列模型?

生活中很多事情可以抽象成序列到序列的转换。例如,语言翻译是两种语言单词序列的转换,语音合成是单词序列到发音序列的转换,玩游戏是游戏画面到游戏杆操作命令的转换。 序列到序列转换相当困难,因为不仅要考虑两个序列间的对应关系,还要考虑目标序列的上下文相关性。以翻译任务为例,要翻译“How are you”

王东 王东 Published on 2025-02-28

【AI100问(119)】什么是词向量?

如何表示一个单词的意义?对人来说,一般用解释法,用一段话来解释词的含义。如“太阳”在新华字典中的释义是“太阳系的中心天体。银河系的一颗普通恒星。” 然而,这样的解释计算机是听不懂的,必须用更简洁的方式来对词义进行表示。 传统上,计算机用一种称为“独热向量“的方式来表示单词。假设词表里一共有100个词

王东 王东 Published on 2025-02-28

【AI100问(118)】什么是残差网络?

深度神经网络很难训练,一个重要的原因是网络包含很多参数,这些参数互相影响,很难协调一致地往最优化方向调整。为此,研究者提出了很多方法,如预训练,激发值正规化等。基于这些方法,训练个十几层的网络是没有问题的。然而,一个很重要的问题是,神经网络是不是越深越好呢? 人们发现并不是。如图所示,训练两个网络,

王东 王东 Published on 2025-02-28

【AI100问(117)】 什么是自编码器?

自编码器是一种特别的神经网络,两头宽,中间窄,像个哑铃的样子。 图1. 自编码器 (AutoEncoder) 模型 这个神经网络的学习目标是努力在输出层还原输入数据。如图1所示,输入一幅猫的图片,这个自编码器会努力在输出层还原这只猫。关键是,因为网络的中间层比较窄,必然会过滤掉一些信息,因此也称为信

王东 王东 Published on 2025-02-28

【AI100问(116)】 机器人攻击人类离我们还有多远?

我们先看一小段视频。 目前,这条视频的播放量已经超过8千万次。是不是挺吓人的?机器人受不了人的骚扰,奋起反抗了。幸运的是,这只是通过各种AI特效技术生成的假视频。虽然这些特效的逼真程度也很让人不安,但机器攻击人类的那一天总算还没有到来。 然而,联合国安理会利比亚专家组发布的一则报告却让人很难松一口气

王东 王东 Published on 2025-02-28

【AI100问(115)】什么是强化学习?

机器需要一些指导信息才能越学越聪明。例如,拿一些袋鼠的照片给机器看,告诉它这是袋鼠,以后再见到袋鼠就认识了。这种学习方式通常称为监督学习。然而,很多时候这种手把手地指导很困难。比如,在教机器人走路时,告诉机器人如何抬腿迈步,如何保持平衡几乎是不可能的。怎么办呢? 可以想想我们小时候是怎么学会走路的。

王东 王东 Published on 2025-02-28

【AI100问(114)】人工智能能“理解”人类语言吗?

目前市面上出现的很多人工智能产品表现出语音识别和语言对话的能力,比如Siri、智能音箱等,它们可以识别人类语言,并和人类进行语言上的交流。有些哲学家认为,只要人工智能通过图灵测试,它们就能理解人类语言;另一些哲学家则认为,通过图灵测试的人工智能也无法真正理解人类语言。这两种观点在哲学界针锋相对。前者

王东 王东 Published on 2025-02-28

【AI100问(113)】人工智能如何预测新冠病毒传染性?

2019年12月以来,新型冠状肺炎疫情蔓延全球,给世界各国人民健康带来巨大威胁,并严重阻碍了经济发展。新冠疫情之所以如此复杂,一个重要原因在于病毒会变异,变异后的变种病毒特性难以捉摸。到目前为止,我们熟知的变种已经有阿尔法(Alpha)、贝塔(Beta)、 德尔塔(Delta)、奥米克戎(Omicr

王东 王东 Published on 2025-02-28

【AI100问(112)】深度学习如何识别人体姿态?

人体姿态识别通过提取人体姿态骨架来估计图片或视频中人的动作,在现实生活中有广泛应用。如识别异常动作,判断是否有人摔倒;识别肢体语言,实现手语翻译;进行步态分析,用于评估运动员的运动状况或识别人的身份。 姿态识别的关键在于提取出一组人体关键点坐标,从而得到姿态骨架。国际主流人体姿态骨架图中定义了18个

王东 王东 Published on 2025-02-28

【AI100问(111)】人工智能如何预测人口数量?

人口普查对一个国家宏观政策的制定有重要意义。一般来说,人口普查需要调动大量社会资源,耗时耗力。因此,正常情况下,普查的频度不会很高,一般每隔十年一次。以我国为例,自新中国建国以来,共进行了七次人口普查,近40年来基本是逢十的年头普查一次。最近一次普查是在2020年。 然而,每十年一次的频度实在是太低

王东 王东 Published on 2025-02-28

【AI100问(110)】什么是爬山算法?

很多人工智能算法可以归结为一个优化任务。例如,我们想识别红绿灯,可以设计一个识别器,让它在看到红灯时输出更大的分数,看到绿灯时输出更小的分数。基于这样的设计,这样我们就可以根据识别器输出的分数来判断红灯还是绿灯了。 设想这个识别器的参数是w,定义下面的一个目标函数: F(w) = 识别器看到红灯的输

王东 王东 Published on 2025-02-28

【AI100问(109)】语音识别需要什么样的数据?

数据是“养成”一个语音识别系统的粮食。因此,一个识别系统要想健康成长,必须给他优质的数据作为食粮,保证营养供应。那么,什么才是优质数据呢? 早期,科学家们认为优质的数据是发音清晰的,且受噪音干扰少的数据。典型的如TIMIT数据库,中文863数据库,清华THCHS30数据库都是依这样的原则设计的。这些

王东 王东 Published on 2025-02-28
Previous Next