经过
这个寒假忙了又忙,又是打工,又是建站,又是学兴趣爱好,发现自己都没怎么搞主业啊。所以这几天我又捡起了 AI,进行了几次头脑风暴。这段时间正好和亲戚聊了一下,我也稍微整理了一下自己的思绪,给自己确立了一个接下来大概的打算。
思考
要说这几天发生的事,首当其冲的就是 DeepSeek-R1 了。之前,我写了一篇 DeepSeek-R1 的论文,但也仅仅是提了一下技术细节和思想。在这里,我稍微叙述一下我由 DeepSeek 引发的一些思考,和一些其他的思考,就当做杂谈了。
这次 DeepSeek-R1 的创新点其实也很简单,主要还是强化学习。但为什么这样一个简单的创新带来这么大的反响,却是一个值得深思的问题,下面我将讲述我的观点,首先我铺垫几句。
从大概是 GPT-3.5 发布到现在,主流的 LLM 研究都研究些啥?
至少我个人来看,这段时间的研究热点都是如何“使用好”大语言模型,如 ReAct,提示工程等,或者头部大厂可能会自己训练一个大语言模型。出于对解决任务的性能的追求,这样的现状还是可以理解的。但是我们回过头来看,现在的研究已经比较同质化,没有很大的创新。在这个过程中,老美的头部大厂都非常默契,大模型一直都是 Transformer 的老样子,当然也有像 Mamba 这样的模型,不过目前没有占据主流。
在这个时候,DeepSeek-R1 引入了强化学习并开源,让模型在数学和编程上达到了一个能和头部公司 OpenAI 对标的水平。虽然之前也有强化学习得分网络进行微调的方法,但仅仅是作为一个辅助的作用。
话说回来,DeepSeek 为什么带来这么大的反响,懂的都懂🤓。
有了上面的基础,我就想到我自己不能过于依赖外界,必须要从头开始建立一套自己的理论。当然在外界看来,我可能是在整一些奇奇怪怪的实验,但这都是为了完善我自己的理论。于是,就有了今天的主题。
另辟蹊径的人工智能
What?
正如上面所说,接下来我会用一些看上去很莫名其妙的方法去完成一些任务,能写论文我就尝试写。一开始可能是对 CV 下手(毕竟玩不起大模型),然后慢慢扩展领域。在方法上创新之外,我可能也会扩展一些应用场景,不过大概不会是很大的场景。
Why?
上面说到,我是为了完善理论。对于这个过程,我把一些能说的分享一下。也得益于之前和我一个亲戚的聊天,我把思绪整理了一下,总结出了一个思路框架。
其中很重要的一点是批判思维的构建,批判思维是指对一件事物进行价值的判断的思维。
我举一个例子,我正在管理一个团队,那么我需要知道怎样的管理是好的,怎样的管理是坏的,从而才能做出正确的管理。而向别人请教管理经验、阅读管理书籍则是为了告诉你什么管理是好的,构建出判断一个管理是好是坏的能力。我称其为批判思维的构建。
在设计算法上亦然,想要设计出新颖的,更好的算法,特别是人工智能算法的特性,需要对大方向有一个认知,知道一个方法或方向是好是坏。于是为了形成这一思维,我开始学习神经科学等一些对人工智能有启发的学科。
完善自己的批判思维,和将已有的批判思维付诸实践,这就是我接下来工作的方向。不光这点,我在自己的学习上做了很多方法和理论上的突破,这里我就不赘述了。
How?
到了现在的阶段,我的批判思维基本上已经初具雏形(不敢说太大),能对一个模型说出哪里不足,理想中的模型应该是什么样。头脑风暴之后真的能跟着自己的思维提出自己的创新点。虽然想出来的东西有点奇奇怪怪,但是我相信只要去做,总会越来越好的。这也就是我接下来的工作的理由。
对于这个批判思维的理论,我们其实还聊到了一个角度的问题,也就是形成多个角度进行批判,感觉有点像机器学习的随机森林算法。这里我们就不赘述了。
小结
这篇文章就是整理一下这段时间的思考,一不留神写了这么多。总之接下来我也希望自己能够多头脑风暴,提出一些创新点并付诸实践吧。尽管在形式上比较怪异,但这也是成长的一步。😁
参与讨论
(Participate in the discussion)
参与讨论