也谈人工智能是什么:万物皆为函数

也谈人工智能是什么:万物皆为函数
TANG JIAMEI这些年,人工智能已经深刻融入了我们的生活里。
每天都用的手机支付;随处可见的人脸识别;又或者我们看书、听歌,app好像知道我们的喜好,总把我们喜欢的东西推到眼前。
作为计算机通识课的老师,我总在想,能不能把这层技术的壳剥掉,用一个简单的方法,让我的学生能看到里面最根本的道理是什么。
许多复杂的事情,道理往往是相通的。我们不妨借一个上学时都学过的、简单的函数范式:y = f(x)
,把它当作一根线,来串起我们对人工智能这件事的零散思绪。
人自己的聪明,也是一个 f(x)
要明白人工的聪明,不如先看看我们人自己天然的聪明是怎么回事。
好比我们学开车。眼睛瞧着前方的红绿灯、路上的行人、镜子里的车影,这许多零零碎碎的景象,就是那个 x
。
它们一股脑儿地进了我们的脑子。我们的大脑,可以说是一个精密的 f
。它把驾校师傅教的规矩、自己开过的路、甚至一瞬间的感觉,都掺和在一起,进行了一番极快的计算。
计算的结果,就是那个 y
——我们的脚,不轻不重,稳稳地踩住了刹车。
这么看来,我们人所谓的聪明,大抵就是这么一个过程:接收外部的信息(x
),经过我们头脑里那个掺杂了学识、经验和思辨的 f
来处置,最终做出一个应对(y
)。
无论是街上遇见熟人,能叫出名字;还是听懂一句言外之意,心里明白;或是读一首好诗,心生感动。细究起来,都离不开这个 f
的影子。
我们脑子里的这个 f
,是祖祖辈辈传下来的,是我们自己一点一滴学来的。
那么,所谓人工智能,归根结底要做的,不过是一件事:
我们能否用机器,去模拟、构建,甚至创造出一个同样强大,乃至超越人类的函数
f
呢?
这便是人工智能这门学科要走的路了。
那些我们人能说清的 f(x)
在机器能模仿复杂的念头之前,我们人早就在两件事上,证明了自己的本事:
- 一个是发现自然的规律,
- 一个是创造自己的章法。
在这两件事上,我们遇到的 f(x)
,都是清清楚楚、明明白白的。
先说发现自然的规律。
比如物理学里说,力等于质量乘以加速度,写出来就是:
F = ma
这便是一个极干净的 f
。你告诉我一个东西多重(m
),跑得多快(a
),这两样是 x
,我便能用这个 f
,准准确算出它受了多大的力(y
)。
这个 f
,是牛顿那些先贤,通过看、通过算,辛辛苦苦从自然那里发现的。
再说创造自己的章法。
如果我们说物理规矩是人给外部世界画的像,那么在我们人自己造的内部世界里,这种明白的 f(x)
就更多了。
譬如我们去图书馆借书,就有一套规矩。这个规矩,便是那个 f
。它写着:
借书不能超过五本,期限是三十天,过期要罚款。
你把借书证和想借的书(这是 x
)递过去,馆员或电脑就按这套章程办事,最后告诉你能不能借,何时该还(那是 y
)。
这套章程,并非天地间的道理,而是人自己商量着定下的。明天开会,兴许就改了。这当中的每一步,都由人预先想好,安排得妥妥帖帖。
在这两种情形下,不论是“发现”的还是“创造”的 f(x)
,我们都知道它的来龙去脉,心里有数。
这是从前的科学和计算机最擅长的事,造出了一个井然有序、一切皆可预料的世界。这也是人工智能这门学科的起点。
那些我们只可意会的 f(x)
可是,人的本事也是有限的。当我们从条理分明的书本,回到五光十色的现实世界,就遇到了一个大难题:有许多 f(x)
,它明明存在,我们却说不清、道不明。
就拿一件极平常的事来说——从一张照片里认出一只猫。
这里的 x
,是相片背后千千万万个颜色小像素点排成的阵列;y
呢,只是一个简单的回答:“是猫”或“不是猫”。
可这中间的 f
,究竟是什么呢?我们试着去说:“有毛,有胡须,耳朵尖尖的。”
但这个规则不稳健,稍稍一碰就破了。没毛的猫怎么办?打着哈欠、变了形的猫怎么办?躲在阴影里,只露半个身子的猫又怎么办?
我们很快就发现,想把所有规矩都写下来,就像想把沙滩上的沙子都数清一样,是不可能的事。
这个 f
,其实就在我们每个人的眼睛和脑子里。它是一种天生的,或是从小练就的智力。
这是一种默会知识:我们知道怎么做,却说不清是什么。
这个只可意会,不可言传的 f
,成了早期计算机过不去的一道坎,也给后来的人工智能,出了个真正的题目。
第一种解法:用我们的规矩去凑
面对这个说不清的 f
,人们的第一个尝试,是想用人世间最引以为傲的条理和逻辑,把它一点点凑出来。这就是所谓的专家系统。
这好比是自上而下的方法。做研究的人想,只要把足够多内行专家的知识,都变成一条条“如果……就……”的规矩,那不就能在机器里头,装进一个专家的头脑了吗?
在这个想法下,f(x)
就成了一本厚厚的、写满了规矩的大账本。
比如早先用来诊断疾病的机器,x
是病人的症状、岁数、化验单子,f
是一本录入了无数医书知识的规则大全,最后的 y
,就是它算出来的最可能的病名。
这种法子,在下棋、化学分析这些规矩分明的封闭小天地里,确实取得了不小的成功。
但是,它的短处也很快显露出来:
- 知识难求:想把一个专家脑子里的活知识,不偏不倚、完完整整地变成一条条死规矩,实在太难,也太费钱。
- 不知变通:机器很死板,只会照着规矩办。遇到规矩之外的、含含糊糊的真人真事,它就束手无策了。
说到底,想用有限的规矩,去框住无限的现实,这条路,终究是走到了头。
换一条路:让机器自己从经验里学
既然从上往下定规矩这么难,能不能换个思路,掉过头来想呢?于是,一个从下往上、从经验里摸索的方法就应运而生了。这就是我们今天说的机器学习。
它的核心理念变了:
我们人不再费心去定义那个
f
了,而是造一个足够灵活的f
的模子,然后给它海量的经验(数据),让它自己去学,自己去悟,看看那个f
到底该是什么样子。
回到这个例子,要教一台机器认猫,这个新法子,大致像我们教一个小孩看图识字,分三步走。
第一步:给它一个能学东西的脑子(f
的模型)
我们先得有一个学生,一个空白的人工神经网络。可以把它想成一个孩子空白的大脑(f
)。
这个大脑里,有千千万万个可以拧动的小开关(参数)。一开始,这些小开关都是随手乱拨的,所以它看什么都一个样,像一张白纸。
它的好处在于,只要小开关足够多,它就有潜力学会任何事情,像个天资聪颖的孩子。
第二步:给它一本课本(经验数据 x
, y
)
然后,我们得有一本图文并茂的课本,也就是成千上万张看图认物的卡片(x
, y
)。这套卡片,每一张的正面(x
)是一张照片,背面(y
)是我们人提前写好的答案,比如“是猫”或“不是猫”。这就是我们给学生准备的功课。
第三步:一遍遍地指点(学习算法)
最后,也是最要紧的一步,就是教的过程。这个过程,很像一个有耐心的老师,在旁边手把手地指点。
整个教书的过程是这样的:
- 让他猜:老师拿出第一张卡片(图片
x
),让孩子(神经网络)猜。孩子第一回见,基本是瞎蒙,十有八九会猜错。- 告诉他对错:老师翻开卡片背面,核对答案
y
,然后告诉孩子:“错了。你看,正确答案是‘猫’,你的猜测和答案差了这么多。”(计算误差)- 点拨和微调:这是最精妙的一步。老师会很耐心地提点他:“你看,许是你太把那个尖耳朵当回事,却忽略了胡子和眼睛的样子。下回,你试着把看重的地方,稍微挪一挪,改一改。”
这个提点和微调的过程,在算法里,就是那个很有名的反向传播和梯度下降。它会依据错得有多离谱,极其精细地、自己动手去调整那个大脑里千千万万个小开关的位置。
这个“看卡片 → 猜 → 被纠正 → 微调脑子”的过程,要不厌其烦地重复上亿次。
到最后,看过了堆积如山的卡片,那个孩子大脑里的小开关,就被调到了一个恰到好处的组合。他不再需要死记硬背,而是真正悟出了猫的神韵。往后,即便见到一只从未见过的猫,他也能一眼认出。
同样,机器里最终形成的那个 f
,也不再是一堆生硬的规矩,而是一种内化在深奥算式里的、我们难以用言语描述,却又异常管用的机器的直觉。
结语
人工智能,从头看下来,好似两种心思的交替。
它起初想用人的理性和规矩去丈量世界,后来发现世界太大、太复杂,便换了条路,承认自己的无知,转而从经验和数据里去学谦卑的归纳法。
这不能不说是一个深刻的转变。
从 f(x)
这个简单的算式回头看,今天人工智能的成就,本质上,是我们人在寻找 f
这件事上,得到了一种前所未有的、能自动工作的强大本事。
文章写到这里,也该收笔了。只是心里还留下几个这次没有深入讨论的问题,记在这里,大家闲时,或许也可以一起想一想:
- 既然机器学到的那个
f(x)
,是一个我们人也看不懂其内部道理的黑匣子,那它给出的答案,我们该信到什么地步呢?- 倘若我们用来教机器的那些课本(数据
x
),本身就夹杂了我们人世间的种种偏见,那么,机器从中学到的那个f
,会不会也把这些偏见学去了,甚至放大呢?- 当机器能发现和掌握,远超我们一个人所能理解的复杂
f(x)
时,我们人的知识、智慧和创造力,又将在何处安放呢?
收录于
人工智能通识
个人观点,仅供参考
修改于2025年07月20日