最近花了两天时间,把张小珺对谢赛宁(DiT一作)的7小时马拉松访谈完整听了一遍,全程手动笔记,整理出以下几点让我印象最深刻的关键点。
1️⃣找到你的底层问题,不被热点带跑
谢赛宁在访谈中最触动我的一句话是:他把自己定义为“做representation learning的人”。在他眼里,具体技术热点会不断更替,甚至有些方向最终会被证明是阶段性的弯路,但表征学习是一个更恒久、更基础、尚未被真正解决的问题。
换句话说,与其追逐一个又一个风口,不如花时间想清楚:自己真正想解决的那个“底层问题”到底是什么?然后围绕它长期耕耘。这种“以不变应万变”的研究哲学,或许正是他能做出DiT这样开创性工作的关键。
2️⃣95%的沮丧是常态,不必因此怀疑自己
何恺明在一次讲座中坦言:“科研中95%的时间是令人沮丧的。”连这位ResNet之父、三获顶会最佳论文的AI大神都觉得科研煎熬,普通研究者又何必因为几周没有进展就自我怀疑?
这让我意识到:科研中的挫败感不是例外,而是常态。接纳它,才能走得更远。
3️⃣像黑客一样去做研究,动手比空想重要
谢赛宁反复强调一个观念:好的创意不是想出来的,而是“玩”出来的。他鼓励研究者像黑客一样去做研究,动手、尝试、推公式、读论文、找联系。与其坐在那里空想“这个idea够不够好”,不如赶紧写几行代码跑一跑。
研究是非线性的,往往是长期积累之后,突然在某一点上收敛,事后才能看出逻辑。所以,别怕试错,也别怕走弯路,动手本身就是通往正确答案最短的路。
4️⃣更多值得记住的点
最后,把谢赛宁访谈中我觉得最有价值的部分梳理出来:
1、成长路径:他不是标准优绩路线上来的。童年跟着母亲旅行,在父亲的书房里杂食阅读,很早就接触电脑和BBS。他说自己是越来越清楚自己想做什么,并越来越敢为此承担不确定性。
2、技术哲学:他被视觉吸引,不只是因为它热门,而是因为他相信视觉连接着智能本身。解决视觉不是只解决视觉,而是在触碰智能的本质。
3、创业思考:访谈后半段,他已经站在组织者和路线设计者的角度思考问题。研究的意义不止于发论文,更在于如何推动一个领域的整体进步。
-
以上是我整理的感悟,希望能给正在科研路上摸索的朋友一些启发。