【AI100问(132)】大模型为啥会胡说八道?

大模型的火爆始于OpenAI推出的ChatGPT,自此之后,众多公司相继推出了自己的大模型。所谓大模型,就是那些通过海量数据训练出来的巨型语言模型。这些模型得益于深度神经网络强大的数据处理和建模能力,能够处理上百个TB的文本数据——相当于家用电脑硬盘容量的上百倍,基本上把人类的主要知识领域都学了个遍

王东 王东 Published on 2025-03-02

【AI100问(131)】人工智能如何预报天气?

身处现代社会,天气预报的重要性显而易见。出门上班前查看天气,判断是否需要带伞;旅行前了解目的地的天气,来决定带什么衣物。传统上,人们大多是依据一些直观经验来预测天气。比如,“日晕三更雨,月晕午时风”,是说日晕预示着夜晚会下雨,月晕则预示着午后会刮风;“雨后东风大,来日雨还下”,表示东风在雨后增强预示

王东 王东 Published on 2025-03-02

【AI100问(130)】人工智能是一项基础技能吗?

首先,人工智能是一门应用科学,是用来解决某一方面事情的。具体来说,它旨在让机器拥有人的某些能力,从而帮助我们做事,比如查资料、做翻译,甚至化身机器人参与火场救人、地震救灾等等。从这个角度看,人工智能似乎只是少数人工智能专家的事:他们去研究这些技术,我们等着用就好了。

王东 王东 Published on 2025-03-02

【AI100问(129)】如何评价语音安防产品?

随着人工智能技术的不断进步,“语音安防”逐渐走进了公众视野。所谓语音安防,是指利用人的声音进行智能预警的技术。举例来说,独居在家的老人在摔倒时往往面临极大的风险。如果机器能够通过识别老人的声音来触发呼救,这将挽救老人的生命。此外,中小学霸凌现象会给孩子的成长带来心理和身体上的巨大伤害,如果在霸凌现场

王东 王东 Published on 2025-03-02

【AI100问(128)】什么是扩散模型?

最近,AI生成技术引起热议。例如,我们向人工智能系统(例如,DALL-E)描述希望看到的景象,比如“在土星上穿着太空服的海豚”,系统可以生成出极具科幻感的图片。 图1. DALL-E 生成的“在土星上穿着太空服的海豚” 这些神奇图片的背后是一种称为扩散模型(diffusion model)<

王东 王东 Published on 2025-03-02

【AI100问(127)】什么是梯度下降算法?

很多人工智能算法可以被归结为一个优化任务。以识别红绿灯为例,我们可以设计一个识别器,在看到红灯时输出较小的分数,而在看到绿灯时输出较大的分数。基于这样的设计,我们可以根据识别器输出的分数来判断是红灯还是绿灯了。

王东 王东 Published on 2025-03-02

【AI100问(126)】YOLO是如何实现目标检测的?

在机器视觉领域,有一类称为“目标检测”的任务,其目的是从一张图片中检测出行人、汽车、建筑物等目标,并把它们框出来,打上相应的类别标签。 在实际应用场景中,一张照片中可能出现多个目标,每个目标的类型、位置和大小都有所差异。那么,如何把这些目标全部有效地检测并标识出来呢? 一种方式是在图片上使用不同大小

王东 王东 Published on 2025-03-02

【AI100问(125)】什么是变分自编码器?

在第117期中,我们了解到自编码器是一种两头宽中间窄,形状如哑铃的神经网络。这一网络的学习目标是在输出端还原输入数据,如图1所示。由于网络中间的瓶颈层比较窄,使得仅有那些最重要的信息才会在编码z中保留下来。因此,自编码器常用于提取数据中的关键信息。 图1. 自编码器 事实上,瓶颈层的编码z由于维度较

王东 王东 Published on 2025-03-02

【AI100问(124)】火出圈的ChatGPT是怎么练成的?

最近,一款称为ChatGPT的人工智能系统火出了天际!它不仅上知天文下知地理,还可以写小说、制标书、做算数、编代码、调bug... 难怪有人惊呼,人工智能修炼成精了! 那么,如此强大的ChatGPT是怎么炼成的呢? 其实,它背后的原理并不神秘。故事还得从语言模型说起。语言模型是一项古老的技术,比如我

王东 王东 Published on 2025-02-28

【AI100问(123)】什么是对抗生成网络?

如何让机器学会生成一幅逼真的图片呢?2014年,Goodfellow给出了一种称为对抗生成网络 (GAN) 的方法[1],瞬间燃爆网络。 图1. 机器学会画画 我们还是先举个例子来铺垫一下。假设有那么一对师生,老师和学生水平都一般,但是学生有一个很强烈的梦想:要成为达芬奇那样的大画家。于是,这个勤奋

王东 王东 Published on 2025-02-28

【AI100问(122)】什么是自监督学习?

机器学习里常见的方法是监督学习:对数据进行人为标注,再把这些数据喂给机器,机器就会像人一样对未知数据进行分类和预测。 监督学习的问题在于标注的成本高,而且极为耗时。因此,人们想到无监督学习方法,这种方法不需要标注,通过观察数据样本来获知某些规律,再利用这些信息来帮助监督学习。一个例子是当我们看到很多

王东 王东 Published on 2025-02-28

【AI100问(121)】什么是注意力机制?

深度学习发展起来以后,序列到序列建模成为很多任务的基本方案,如机器翻译、语音识别、语音合成、问答和对话等。序列到序列建模将输入序列用编码器压缩成一个固定维度的向量,再由一个解码器生成目标序列。如下图所示。 序列到序列模型虽然简洁,但有一个很大的问题,就是当输入序列很长时,往往很难生成合理的目标序列。

王东 王东 Published on 2025-02-28
Previous Next