劝学:研究想法何处寻?
对于从未做过研究的同学们而言,光是思考该从何处开始入手都会感到脊背发凉、头昏眼花。
你可能在一个高产的团队里,导师提供idea而你专注执行——然而你跳过了最关键的环节想idea,而这正是科研中最关键的技能。 长此以往,即便毕业,也很难有独当一面的底气。
你也可能在一个放养的团队中,扔给你一个大方向和一些论文,你负责产出想法和论文。大概率你随机游走,不知所措,偶尔瞎猫碰上死耗子,靠模仿他人发表论文,也可能在焦虑中消磨时光,甚至沦落到延毕的地步。
总而言之,尽早训练如何产生idea,对研究生涯成长是极为有利的。
基础
读大量论文:【学会欣赏,敢于批判】。无需读懂所有细节,了解它【为什么好】以及【为什么还不够好】。(方诺注:建立论文品味需要和大家交流,有对于好和不好观点的碰撞才能逐渐建立。)(尔茨注:有三类工作,第一类是你不知道的,第二类是你不知道你不知道的,第三类是你知道但是理解不对的)
开会和作者本人聊天:问问他们论文的想法如何产生,背后往往有非常有趣的故事值得玩味。慢慢地,就能悟出自己的路径了。
多问自己:别人是怎么做到的,我还能怎么做?别人会问我什么?训练自己的思维模式,不断产出高质量的种子想法(by 头脑风暴)。
参与审稿(Shadow PC):提前了解世界前沿(别人在做什么);知道论文为什么被拒(bar在哪里)。
中级
多参加组会和讲座,多提问题:世界上没有傻问题,问了就是赚了。做好功课,提前准备,适时出击!第一个问问题,让人记住你!哪怕文章发了,何必崇拜,是不是有隐藏的局限和硬伤,外行或糊涂的审稿人看不出来但被我看出来了(敢于批判);但是,是不是瑕不掩瑜,本身价值已经足够发表了(学会欣赏)。
博闻强记,触类旁通:每个社区/领域都在蓬勃发展而且越来越独立(不和别的社区玩),传播知识本身就是好事。交叉容易产生新火花,它山之石可以攻玉,甚至是降维打击。定期阅读跨领域论文,学习新技术/新工具/新结论。
写代码也不要与世隔绝(天才除外),多和别人分享和讨论,获取反馈,不断改进。想法可以来自一场随机的对话、一次不同观点的辩论、debug期间对他人的求助。
高级
论文工厂的套路:
- 完形填空:画矩阵+填空白,进而找出自己和先前工作的区别。为了找到更多空白,可以引入新的维度(metrics),画出你在线性空间中的位置(往往意味着你能写出不错的综述了)。
- 线性/迁移创新:一条路走到黑,不断将假设调整得更为现实,去除多余假设,打破昨天的自己,本身就是突破。或者拿着锤子/镰刀不断找新钉子/韭菜。例子:密歇根大学Peter Chen教授的团队构建了世界上第一个完整的虚拟机记录和重放功能。这对于调试、追溯入侵分析具有重要的应用。许多高质量的论文(OSDI/PLDI/ASPLOS)发表了关于确定性执行、性能等论文。
- 业界指引:抓住机会和业界建立联系,了解实际需求和产业痛点。业界往往有需求但碍于成本、优先级等考量不去解决【不着急但重要的问题】,你就有机会捡漏了。学界可以测量并告诉大家极限在哪里(包含可能不切实际的假设)。此外,学界没必要做出完美的产品,探索出一条可行的未知路径,就值得宣传了。如果一个问题很实际,但业界还没有好的现成解决方案,那就是low-hanging fruit。你甚至只是将某一个企业正在进行的还不错的解决方案拿出来写篇论文,都有极大概率能中。
- 做Benchmark:设计一些度量工具,到满世界收集证据,印证各种想法,本身就是种探索。裸数据可以远离【先画靶后射箭】的困扰(很多企业开源的数据都做了一定脱敏,象牙塔在此基础上得出的结论往往不真实)。拥有大规模人无我有的数据,是“灌水”的源头。这类论文甚至无法判断其数据集的质量,只要是开源就值得鼓励。有了足够多的数据汇聚成数据集例,就能制造榜单。竞赛满足人类的好胜心,由此可以产生一系列SOTA工作。例子:ImageNet是梦的开始。
进阶
故事套路:
- 横向错位(mismatch):人类往往喜欢复用现有的东西,聪明地偷懒。本来为A而生的东西被挪为B所用,开始时姑且管用,久了难堪大用。于是不得不做点特化(tailor 裁缝,量体裁衣)。讲故事就说【现有做法不适应XXX日益增长的美好需求,属于根本矛盾】,motivation自然就立起来了。例子:传统Linux宏内核不适合生态碎片化的端侧发展,演进太慢;依赖繁多,RT_PREEMPT补丁老是打不进去,不好裁剪,于是乎HongMeng微内核应运而。
- 纵向差距(gap):同类型产品(系统/工具)在不同环境/条件/场景/负载下存在差距,补齐这个差距就是贡献。例子:去中心分布式系统(如区块链)比数据中心分布式吞吐慢很多,弥补差距即是贡献。
- 范式转变(paradigm shift):多数人都是这么讲故事的——有一个问题,之前还不是主要矛盾,由于出现了3新,即新场景(来自上层应用)、新平台(来自底层硬件)、新需求(人类贪婪的本性),于是这个矛盾突出了(我乃第一个注意到新兴矛盾且还没被妥善解决)。技术手段上呢,之前是这么做的,现在换种做法、换个假设(bit flip某种观点或认知),换了之后效果真不错、落地可期,自然就成了。例子:从with PagedAttention (SOSP’23) 转变为without PagedAttention (ASPLOS’25)。
总结
一个好的想法可能来自不经意的灵感、不起眼的现象,有可能来自对现有结论的质疑。你可能觉得这个现象非常有趣(闻所未闻)。重复搜索(re-search)后,发现表面的现象背后竟然对应一个真相/事实,这个真相尚未被大众所熟知(新知识),这就是好的观察(observation)了。好的observation往往意味着好的opportunity。如果这个观察是真的无法用现有概念去解释(切忌不要重复发明新概念,新瓶装旧酒),那就有必要造个新概念/新术语,帮助大众快速记住新事物,并教育大家由此带来的好处(学会讲好的故事)。观察不太可能一蹴而就,需要不断的探索和纠偏——【到底什么样的观察最符合人类的直觉,能让绝大多数人认知它、传播它】,那它就是好的洞察(insight)。个人看法:insight就是intuitive sight,符合直觉根据逻辑看得见的东西,本质就是康德的【纯粹理性批判】。
Beyond papers:找到好想法的最终目的不是为了生产论文,而是为了改变世界。论文背后可以是有影响力、可持续性的系统/工具,影响力是多少研究者梦寐以求的东西。研究的东西改变了世界,自己和研究产物同时被人铭记。其挑战在于:构建系统/工具本身非常耗时,而且初期收益极低;需要有极强战略愿景的老板和非常强执行力的团队。能识别出多数人的需求同时发现尚未存在的好解法,本身就种能力(乃至商业能力);能找到独特的视角切入,在群雄环绕的企业和其他的高校/研究机构竞争情况下虎口夺食,能力更是上上乘。好的想法,是梦的开始,但也仅仅是开始。
致谢
感谢所有对本人提供帮助的学者!(部分观点和例子来自加州大学钱志云老师)
Motto:think big but start small。