在场的科学家们,哪一个不是数学高手?但他们过去,更多的是将数学当成一种“工具”,用来解决具体问题。他们很少,或者说从未像陈启明这样,将整个AI模型,视为一个完全由数学规律构筑、浑然天成的“数学生命体”。
“transforr架构,”陈启明的声音里带上了一丝赞叹,“它不是一行行代码的堆砌,它是一首用数学写成的诗。”
“多头注意力机制,是在用不同的一组基,去反复度量同一个向量空间,如同从不同角度去欣赏一座雕塑,从而获得更全面的认知。位置编码,巧妙地运用了三角函数的周期性,将序列的绝对位置和相对位置信息,编码进了模型的‘感知’之中。整个架构,就是一个巨大而精密的、将离散的文字符号映射到连续的语义空间的非线性函数。”
他转过身,目光重新变得平静,却带着一种不容置疑的力量。
“所以,严院士,回到您最初的问题:我是从哪里学到这些的?我是怎么掌握这些的?”
“答案很简单。我没有掌握任何秘密的知识,我只是比大多数人,更早地认识到,想要真正理解和创造AI,唯一的路径,就是回到它的本源。”
“数学。”
“代码只是我们用来将数学思想翻译给机器执行的工具。如果我们自己都不懂这门‘母语’,又怎么能指望翻译出伟大的作品呢?我们只会成为一个蹩脚的翻译官,不断地重复前人已经写好的文章,却永远写不出属于自己的篇章。”
“只有当线性代数的变换、微积分的流动、概率论的权衡,都成为我们思考模型时的本能,我们才能真正地驾驭它,而不是被它牵着鼻子走。我们才能在遇到瓶颈时,不是去网上搜索又一个花哨的tricks,而是回到最底层的数学原理中,去寻找真正坚实的答案。”
陈启明的话,在巨大的会议室里回荡。
这番话,不仅解释了他知识的来源,更重要的是,为眼前这群陷入迷茫的龙国顶尖科学家,指明了一条通往未来的、唯一的、也是最艰难的道路。
放弃对现成模型的修修补补,放弃对工程技巧的盲目崇拜。
回归基础,回归数学。
严树隆院士的身体微微颤抖着,他看着眼前的少年,眼神中最后的一丝疑惑也烟消云散,取而代之的是无与伦比的敬佩与……惭愧。
正好此时,陈启明的电话也响了起来。
是……陈景明院士的电话!