基于Scaling Law的AGI之路是否正在让我们变得更平均？

less than 1 minute read

Published: February 16, 2025

当前的大模型在工作中，让高端平庸化、让低端模糊化、让其他的懒惰化。

内容没有经过考证，只是一些随想，主要考虑当前大模型在工作中的应用，也不一定正确，大家看看就好，欢迎讨论。

一些小观察

体制内的大写手

最近，我看到了一些有趣的分享。一位体制内的资深写手分享了他使用DeepSeek的经历。平时，他需要撰写一些有深度、有高度的文件。最近他尝试用DeepSeek来生成这些内容。然而他发现，使用DeepSeek来写这些文件所花费的时间不比自己写少，甚至更加耗费精力。因为他不得不频繁地让DeepSeek进行调整，而有时调整后的内容反而会更糟。最后他得出了一个结论：对于新进文员来说，使用大模型有帮助；但对于他这样的资深写手而言，自己动手更高效，质量更有保障。

我自己的科研经历

作为研究深度学习推理加速研究的博士生，我经常需要写代码，我自己也时常借助大模型完成一些模式化的代码。然而，当我进行一些真正具有创新性的工作，尤其是在底层代码开发方面，我发现大模型根本无法满足我的需求。它生成的代码漏洞百出，尽管我反复纠正，它依然无法达到预期，尤其在像CUDA编程、创新方法这种专业或者全新的领域。因此，我只将它用于一些辅助性、简单的任务，比如绘图代码。而真正需要创新的工作，我仍然是完全自己操刀，我更有把握。

基础：当前的AGI之路

目前，AGI的路径主要是在深度学习的基础上进一步发展而来。研究人员发现了“scaling law”：只要有足够多的数据，模型的“智慧”就会自然而然地涌现。因此，这条道路有两个核心要素：深度学习技术和scaling law。

深度学习能够自动提取数据中的特征，并学习数据之间的内在关系。换句话说，深度学习提供了一种极其复杂的高维度拟合方法，使得模型能够捕捉数据的分布特征，从而生成与训练数据相似的输出。而scaling law的核心是，模型需要足够多且质量高的数据，才能顺利进行训练，或帮助大模型更好地模仿人类智慧。

但深度学习本质还是一种统计方法，它通过统计训练数据的分布，使得输出结果尽可能接近训练数据的特点。在这种情况下，模型的输出往往是“平均化”的，既不是最优解，也不是最差解，通过高质量的数据筛选，甚至能达到“中上等”的水平。

小总结：当前大模型技术的输出不是最优的

基于Scaling Law的路线需要大量数据，而最高质量的数据量并达不到Scaling Law的需求，训练数据本身质量良莠不齐。
深度学习技术是对训练数据的拟合，所以输出的结果是最好和最坏之间的“中间”情况，偶有妙手，但大规模统计意义上仍然是平均。

基于此，AI会倾向于生成最符合主流的内容，很难生成具有批判性思维的结果，而令人眼前一亮的往往是独特的视角和批判性的分析；历史上有价值的思维，在刚诞生之初往往在挑战主流、拓展人类的认知边界。

过渡：部分人们在工作中变得平均

再考虑到工作这类大多是需要按时交付的、被安排的任务中。

随着大模型带来的便利和效率提升，许多人开始习惯于通过模型生成看似合适的结果，而不再进行深入的思考。尤其是在领导认为AI能够提高效率，让你工作量增大的时候。虽然这些结果可能并不能达到专业人士深入思考后得出的结论，但它们足够方便，而且能满足交付（当前，未来交付要求会提升）。这就是我说的，大模型正在让高端平庸化。

对于那些专业水平较普通的人来说，大模型可以帮助他们生成超出自己能力范围的内容。虽然这有可能让他们学到一些新东西，但也有潜在的风险，尤其是在代码生成领域，模型可能会生成一些看似正确但实际上存在隐患的代码，但如果使用者缺乏足够的专业水平，往往难以发现这些潜在问题。这也就是我所说的 “低端模糊化”的原因。

对于大多数处于中等水平的人来说，他们通过大模型生成了和自己水平“差不多”的内容后，往往不再深思熟虑，直接使用结果。这种依赖于自动生成内容的习惯，可能会让思维变得迟钝、懒惰，进而影响进一步提升。这就是我说的 让其他的懒惰化。

人们能否通过让大模型学习更高质量的数据来提升效果？当然可以，但却达不到Scaling Law的规模。高质量的数据始终是少数，如何筛选出这些数据、需要多少专家，甚至如果能筛选出来，这么小规模的数据是否足够支撑智能的涌现，仍然是个巨大的问题。所以我认为吧，当前的AGI之路正在无意间引导我们走向“平均化”。

好消息是，这个平均也是比大模型出现之前所有人的平均要高很多了，这也是社会的进步，AI从各方面推动了社会发展是毫无疑问的。

另一方面也说明，各行各业最顶尖的专家仍然是极具竞争力的人才，无论哪个行业，越顶尖越不会被替代，所以还是要自身实力过硬。 AI为各领域带来变革，让人人看似 “能” 工作，却不等于 “会” 工作。比如在程序开发时，真正高价值的程序，不是简单借助AI工具就能产出的通用代码段，而是资深研发人员对业务逻辑的透彻理解、特定场景下对算法的精心优化。

未来：如何改进？

人类的欲望是无止境的，要求也会不断提高。当人们逐渐适应了大模型带来的“平均”输出，基准线也会随之上升，推动科技和社会的进步。因此，尽管大模型可能让社会变得更加“平均”，它也有可能推动更大的创新和进步。那么，我们该如何改进现状呢？我不清楚，猜猜看。短期内，高质量的数据是关键。未来可能会有专门的团队、组织或公司专门生产高质量的数据集。而在这一过程中，高质量的评判标准也至关重要，因此需要具备专业水平的专家来进行评估。

其次，现有的大模型仍然依赖于scaling law，但这不一定是唯一的道路，也不一定是正确的道路。十几年前，Alpha Go通过学习大量人类棋谱来击败李世石，尽管李世石仍然赢了一盘，而其后改进版则不再依赖人类棋谱，而是通过自我对弈不断进化，人类再难获胜。围棋是一个可以量化目标的活动，而许多现实中的任务并没有明确的量化目标，因此围棋上的方法难以直接应用到其他领域。但就像Alpha Go的进化过程一样，未来的模型改进或许不再需要大量的高质量数据，而只需少量的关键特征即可达到预期效果。类似人类的学习过程。毕竟，我们并不需要看遍成百上千、各式各样的飞机才能知道飞机长什么样。

Share on

X (formerly Twitter) Facebook LinkedIn Weibo

张钧洋 Junyang Zhang

基于Scaling Law的AGI之路是否正在让我们变得更平均？

一些小观察

体制内的大写手

我自己的科研经历

基础：当前的AGI之路

过渡：部分人们在工作中变得平均

未来：如何改进？

Share on

Leave a Comment

You May Also Enjoy

在美国费城的摄影日志

昇腾集群部署DeepSeek疯狂踩坑

对DeepSeek新模型的一些思考

论文阅读分享