科研
言论
- 软件工程师和项目主管每周都必须发布代码,否则就要走人。项目分析、开发文档、帮助队友……这些都是工作的基础部分,但不能替代编写代码。 – MUSK’S LATEST TWITTER DICTUM
- 要想做好投资,你需要一个关于投资机会的记分卡,上面只有二十个孔。 – 巴菲特
观点
A Summary of My Learnings On How To Find Startup Ideas
There are some tip about “how to get startup ideas”. Some of them are from Paul Graham’s blog.
- Build something you want i.e. solve your own problem
- The next best thing to an unmet need of your own is an unmet need of someone else.
- Live in the future, then build what’s missing.
- Turn off your “unsexy problems” filter.
- Turn off your “schlep” filter i.e. your filter for tasks that are tedious or unpleasant.
- Ask yourself whether in your previous job you ever found yourself saying “Why doesn’t someone make x? If someone made x we’d buy it in a second.”
- Go through every job you ever had:What are the unique skills you learned?What seemed broken?What did you develop in-house?
- Look for things that have changed in the world recently e.g. new technological changes, new regulations, new problems in the world.
- Brainstorm with friends.
- Unbundling larger platforms
- Senior managers tend to be a good source of knowing what their problems are and what’s holding back their performance
- Trawl through the last YC Startup Directory list and figure out what might fit your particular favourite domain, with some modification
- Audience: Brainstorm personas you identify with or wish to help, then I look at market research to find the obstacles they face.
谷歌离职回到学术圈的心得 – Oliver Müller
作者是一名科班出身的天文学家,在谷歌(Google)做了一年分析师后,今年夏天离职了,在twitter上发表了一系列感想,后来以The career insights I’m bringing back to academia after a year at Google为标题发表在2022年11月02日《自然》的职业版块上.以下是部分内容:
- 我回到学术界的一个主要原因是我想重拾私营企业所没有的独立性。说到底,企业招你是去做一份工作的,而且大多数情况下,你的上司或是更高层领导决定了你要做什么以及应该如何做,这可能会导致你对手头的工作完全没有激情。不过,我在谷歌的短暂时光也给了我非常宝贵的体验.
- 如果一个任务需要以你的心理健康和身体健康为代价才能完成,你就是在掩盖这个制度的缺陷。如果你总是在加班,做着本职工作之外的事,这些制度缺陷就永远不会暴露,也永远不会被纠正。而谷歌提倡让员工“别做英雄”的文化.
- 你要对你的事业负责!这一条同时适用于私营企业和学术界。我在谷歌的同事和领导提醒了我这一点,但在学术圈里很少有人会这么提醒你,如果你把他人的利益置于自己之上,你就无法主宰你的事业.
- 重新回到洛桑联邦理工学院后,我差点和一位高级教授道歉,说我回来了,准备好重新开始工作,而他根本没有意识到我已经离开一年了。我太担心学校的同事会怎么看我了,但其实一直有人离开,也有人回来.
- 过去的我总是以为,身为天文学家,离开了学校就很难找到工作。私营领域很少有面向天文学家的招聘广告。但我发现,这些年来我学习如何写代码分析数据,探讨宇宙中宏大的未知问题,将我的研究介绍给更广大的受众,撰写论文和经费申请书——这些都锻炼了我的能力,而且是学术圈外的世界非常看重的能力。我意识到这些技能让我有资格成为数据科学家或是软件工程师等,而且不分行业,无论是信息技术、银行业,或是生命科学。这些领域其实很缺人才,但敲门砖是你要学会“推销”你的技能.
- 在简历中写你发表过7篇经过同行评审的文章,可能会让招人机构一头雾水,而不是立即请你来面试。但是,如果你说你从前到后管理了一个完整的研究项目——与不同的利益相关方打交道(同行、审稿人、编辑)、安排会议、记录工作,并让项目顺利完成,就能证明你具备很多他们需要的品质.
胡金波: 在诺奖实验室读博,让他对科研“开窍”了
- 胡金波出生在浙江省东部的农村,从小学习勤奋,成绩不错。但他心里清楚,自己更擅长文科的学习,而在理科学习方面则相对弱一些。高考时,他填报的志愿是浙江大学国民经济专业,但因为没考好,调剂到杭州大学化学系(后并入浙江大学)。这样一个对化学兴趣不大的年轻人,却在几年后脱胎换骨:哪怕大晚上躺在宿室里,突然脑子里想到些什么,就立刻翻身起来,骑辆自行车来到实验室做实验。“这是我非常喜欢的一种状态,就是哪怕别人拦着我,我也想去做一件事的那种热情。”
- 胡金波加入George A. Olah教授和Surya Prakash教授联合研究小组之后(George A. Olah是1994年诺贝尔化学奖得主,Surya Prakash曾担任美国化学会氟化学分会主席),每周都要参加组会,一开始,他就“大受震撼”。每次组会都要由几位博士后或研究生做工作汇报,这次上台的是一名日本博士后。那时候不用PPT,都在白板上书写展示,他讲着讲着,就很自然地翻开实验记录本查看数据。这时候Olah教授发话了:“No lab notebook!”意思是不要看着实验记录本汇报工作。就在胡金波感到不解时,导师补充道:这是你刚做了不到一个礼拜的工作,如果你足够用心,怎么会记不住实验细节和数据呢?
- 在一堂高等无机化学课上,作为授课老师的另一位著名化学家,毫无预兆地给每人发了一张白纸,要求大家默写一遍元素周期表,同时强调这将是期末考试中一道重要的试题。为什么要这样做呢?老师解释:就像优秀的棋手脑子里都有一张棋盘,合格的化学研究者脑子里也要有一张元素周期表,有了这张“表”,你无论坐公交还是逛公园,随时随地都可以用这张周期表来思考科学问题。在南加州大学接受的这些训练,让胡金波受益匪浅。至今如果有人问他博士期间某个实验的核磁氟谱数据,他基本都能正确回答,哪怕已经过去20多年了。
- “我发现一个普遍现象,就是真正的大科学家,都擅于把学到的知识、做过的实验‘永久’保存在大脑里,而那些看过就忘,做过就忘的人,要取得很大的科学成就往往比较难。”胡金波说,“因为你下过苦功夫的学问,应该是一辈子忘不掉的。”
- 胡金波从自己导师那里学到的另一个重要科学品质,是从不迷信权威。他自己的一项重要科研成果就得益于这种思维训练:当看到的实验现象与预期相反时,他第一时间意识到当时流行的学术观点可能出了错,经过多次实验验证,后来提出了“负氟效应”的新概念,在此基础上还发展出很多被广泛应用的试剂。这个概念后来被他人写进了教科书,并被国内外许多同行采用。
- 成为一名自然科学领域的科研工作者后,胡金波并没有放弃自己的“文科头脑”。他最喜欢读的非科技类书籍是中国的“史学双璧”——《史记》和《资治通鉴》,时至今日还会不时翻翻。
- 他在自己的专业领域,也有意识用读史的方法去学习。他借来好多书,复印下来反复研读,把有机氟化学这个学科的发展脉络全部梳理了一遍。从开展科研工作之初,胡金波就给国际上所有氟化学领域著名科学家的研究小组都建立了专属文件夹,这些课题组发表的工作,他只要读到就放进相应文件夹里。“通过这样做,我就知道全球有多少人在做这个领域,分别在做什么方向,又有哪些最新进展。”胡金波说。长此以往,胡金波心里逐渐建立了这个领域的研究“版图”和260多个研究小组的“大事记”,合起来仿佛一部氟化学领域的“纪传体通史”。就像有些人喜欢收藏一样,收集这些文献也慢慢成了他的一项“癖好”,久久为功,对科研工作助力颇大。
- 胡金波说:“科研工作者的性格、爱好、禀赋、思想、见识等等,都会影响科研工作的风格和高度。就像每个人都有独特的‘指纹’,同样的题目拿给不同人做,会做出不同的味道和格局来。”
- 胡金波这样鼓励自己的学生:“你们的基础再差也不会比我差,要认识自己的特点,发挥自己的优势,去做有创新性、有挑战性的工作。当你通过自己努力,成功取得此前从未有人涉猎过的重要科学发现,或者解决此前一直悬而未决的科学难题时,一定会感受到那种无与伦比的快乐。”
数据智能的历史机遇与现实困境
数据智能,是新一轮工业革命的核心驱动力。这个共识包含了一个基本假设:数据是未来最重要的生产要素,没有之一。这个观点其实并不难接受,这就像说头脑+知识,是人类发展的第一驱动力,这是每个人都看得到的历史事实。
可是在过去十多年的持续探索中,人们也有了越来越大的困惑:
- 技术的进步这么大,为什么数据智能的项目的成功率一直很低。
- 需求这么普遍,为什么数据智能的企业,很少有标准产品,很难有利润。
- 很难在身边看到数据智能的实际落地,为什么媒体的宣传案例无处不在。
在数据智能行业,经历了10年的探索,只有电商、广告、金融等少数场景,跑通了规模化的商业应用。关于为什么要进入数据智能行业,孙正义的决策逻辑,是比多数人想得更清楚的,这确实是一个前所未有的历史机遇。
- 数据是人类历史上,增长最快的生产要素,没有之一。
- 算法和算力,可以把数据变成生产力和竞争力。
- 更大的竞争力带来更好的数据,形成良性循环,构成了压倒性的竞争优势。
随着对数据智能与实体经济的认识不断加深,真正的矛盾在于:数据智能的进步很快,而人类的认知能力的进步很慢,大多数的技术进步,在短期都是无法被消化的。真正的问题在于,人们很容易看到技术的进步性,但是很难看到自身的局限性,从而会做出一系列的错误判断,这就构成了一种基本矛盾。
人们已经很难想象,农业、工业、服务业之中的某个场景,是无法被数据智能改造的,比如,看病、炒菜、送货、绘画、导游,等等。每一个场景改造的背后,都是千亿乃至万亿的新市场,试问这不是行业颠覆是什么?这不是投资机会是什么?就差一个靠谱的团队了。令人困惑的是,有这么多的数据智能的真实案例、正面宣传、宏观政策和技术突破,这些应用案例要进行复制,为什么这么困难。人们常常会忽略,不管有怎样规模、怎样质量的数据,也必须要叠加与之互补的能力,数据才能够转化成为生产力。而这个能力就是由数据人才、数据文化、数据平台,所构成的利用数据的基础能力。相比具体的、看得见的数据和算法,与之互补的能力是隐蔽的、很难被看见的。其中有效的数据人才和数据文化,是极其难以复制、也极其稀缺的,也成为了数据平台建不起来、用不起来,数据应用设计失败、运营失败的底层原因。而越是成功的数据智能的应用,不仅有着更强的数据、算法、算力,而且也需要更加领先的人才、文化、流程、制度,才能够让数字化的要素被利用起来。
目的开发阶段,就是通过可控的成本,实现稳定的进展,进展叠加起来发挥作用,最终达到既定目标。这是一个常识,是一句废话,也是任何商业项目的底线,而这个底线,在数据智能项目中,其实是很难达到的。现实情况是,对于一个执行中的数据智能的项目,你关心的大部分的关于进展的问题,都得不到明确的答案。
- 为什么这个模型的性能不好?
- 为什么这个项目的进展很慢?
- 是不是需要引入更多的数据,更多的算力?
- 还要花多少钱、多少时间才能够跑通?
这些最基本的问题,其实是没有进度条的。更准确的说,是几乎没有。为什么这些问题都没有办法被回答?
- 一方面是因为数据智能内在的复杂性很高,大量相互嵌套的变量,通过“随机梯度下降”找到的概率模型给连接在一起。“随机”和“概率”这两个词已经说明了,这个模型训练的过程其实是在做实验、开盲盒。理论上来说,只要有足够多的、高质量的样本,也就是训练集,就可以找到足够好的模型,也就可以应对复杂性的问题。可同等规模的样本,能够带来的准确率的提升,是边际效益递减的。这意味着,模型性能的爬坡是越来越慢的,直到速度趋近于零。AI应用面对的,往往是开放性场景,不仅有着难以把握的长尾分布,随着时间的推移,环境是越来越复杂的,这个长尾分布本身也是不断变化的。在长尾分布之下,人们容易陷入一种错觉,就是认为“问题即将解决”、“答案就在眼前”。人们在数据智能项目的立项和开发过程中,因为人们总是用头部区域的统计规律,来外推长尾区域的统计规律,会反复陷入“过度自信”的陷阱之中。头部区域的样本质量更高,信息密度更大,预测的性能迅速爬坡,人们对于数据智能的应用充满了信心。长尾区域的样本噪声迅速放大,性能爬坡越来越慢的,不管怎么进行样本、计算、模型的改进,仍然没有办法达到预期的目标。
- 数据智能应用需要的不是一个完美的模型,而是持续的迭代模型的能力,并且把不同的场景的模型组合起来的能力。模型随着业务变化,模型赋能业务变化,这是理想情况,也是必须要达到的状态。数据智能的应用的工程实现,是看运气的、不稳定的、难以解释的,所以人们把这个过程称之为“炼丹”,这在现代企业经营中,就是成本失控的源头。为了防止这种失控,数据智能的应用必须努力做到:容易复现(reproducible)、容易迭代(agile)、可以组合(composible),否则数据智能项目会在快速的技术进步中,被迅速淘汰。成本上,没有办法摊薄数据智能落地的成本。能力上,没有办法跟上业务的变化,跟上底层技术的变化。可迭代、可叠加的能力,都是建立在可复现性的基础之上的。面对不断加速的变化,可复现性,是数据智能的项目管理的底线。如果认真审视会发现,可复现性这么基础的要求,大部分的数据智能团队都并没有实现的,所以大部分的数据智能的项目,成本也必然是失控的。(数据智能应用的可复现性的缺失,有两个结构性的原因。一方面是客观上的挑战,数据智能的基础设施是很复杂的、也是很昂贵的,需要较长的发展时间,也需要有一个数据基建的供应商生态。另外一方面是主观上,在行业发展的泡沫期,人们对于可复现性的热情很有限,增长速度才是第一位的。数据红利和计算红利太显著,带来了一大批容易摘到的果子。对于底层方法、工程效能的讨论,只会耽误抢占资源、抢占地盘的先机。由于可复现性的缺失,模型是没有基本的可靠性的,也就是“不靠谱的”,很多的业务增长都是空中楼阁,可迭代性与可组合性也是无从谈起的。这就导致了大部分的数据智能应用,不仅开发、迭代、维护的成本非常高,而且人们也无法理解,此前的开发成果到底意味着什么,以及接下来到底应该怎么办、应该做什么。)
长时间对于基础设施和工作流程的疏忽,导致大部分的数据智能企业,没有办法把项目经验,沉淀成为可以复用的技术组件,更加不可能转化成为可以销售的标准化产品,只能承揽更多的定制化项目,以维持现状,维系生存。
即便在数据智能的立项和开发,都做了正确的判断,有着高效率的执行,取得了良好的业务价值、商业价值,这是只有极少数的项目,可以走到的最后一个环节。然而这个阶段,还面对着更加难以处理、更加尖锐的矛盾,也就是不断升级、不断扩大的竞争,可能让之前的所有投入归零。数据智能的性能,依赖于高质量的、大规模的数据资源,自然就存在着赢家通吃的竞争格局。数据智能团队,有很强的动机,占领最高质量的数据和场景,大量宣传、高额补贴、挤出竞品、价格大战,这些杀敌一千、自损八百的方法,在数据智能行业是主流策略。
经过激烈竞争,即便少数厂商达到了领先的技术性能、资源体量的临界点之后,打败了所有友商,领先厂商还无法高枕无忧,还需要面对更高维度、也更难应对的竞争,也就是业务管理者与技术供应商之间的博弈。面对数据智能技术的介入,如果业务部门没有警觉,要么是因为业务的负责人还不理解数字化会有多大的冲击,要么是因为数据智能的应用表现平庸,实在不像是有威胁的样子。而一旦数据应用的性能达到了临界点,甲方自然而然的考虑是,算法能力这么重要,核心资源又是自己的业务数据,与其受制于人,不如把乙方的人才挖过来,建设自身的数据智能的团队与能力。在国内外的数字化转型的进程中,一个家常便饭的场景:乙方做得不好,不付尾款,乙方做得好,把人挖过来,然后把乙方请走。
即便数据智能团队,通过高超的情商、过硬的技能、柔软的身段,实现了与业务部门的共赢与共存,轻松的日子也不会持续很久。大多数情况下,数据智能技术是必须嵌入业务流程,才能够发挥价值。而一旦嵌入了业务,就需要响应业务的约束条件,技术迭代的速度很容易出现大幅的下降。数据智能的技术迭代的周期,是比大多数技术都要更快的,上一代的技术还没有站稳脚跟,新一代的技术已经在替换的路上了。随着新一代开发者对于场景的理解不断加深,他们会发现:原来市面上的主流业务场景,所采用的技术,竟然是这么落后的。“有新技术的加持,吾可取而代之。”,这就是年轻开发者的很自然的心声。图片图. 颠覆式创新的周期结构新的基础设施,会不断刺激更多、更快的创新的出现,催生更大规模的市场。在很多情况下,后发优势是大于先发优势的,增量机会是大于存量机会的。面对不断强化的竞争,没有壁垒的运营是没有意义的。对于数据智能应用来说,真正的壁垒到底是什么,答案仍然是非常模糊的。
人们很容易看到全新的机会和资源的红利,但是很难看到必要的条件和潜在的陷阱。增量的资源越多,消化资源所需要的能力是越强的。能力的欠缺,以及对于这种欠缺的忽视,就是一个巨大的陷阱。资源红利的释放,是具有时间上的密集性的,地下挖出来了石油、核心技术取得突破、数据资源的开放等等。但是能力的培养从来都是缓慢的,这就构成了一种根本性的矛盾。加迪斯的《论大战略》中的定义:战略是目标和能力的动态平衡。指数级进步的数据技术,本身构成了一种规模化的、普遍性的冲击,对于大多数人,尤其是数据智能的从业者来说,目标和能力的平衡都是极其困难的。数据智能的高速发展,使得“能做”的事情,是越来越多的。看到了技术的发展、市场的繁荣、政策的鼓励,人们“想做”的事情,也是越来越多。但是具体到成本、资源、能力,具体到某一个公司、某一个人,“可做”的事情,其实并没有变多。
曾少贤:一定要想办法早点有钱
- 一定一定一定要想尽办法,让自己早点有钱。因为你有钱了,才能有多余的心智资源,去思考更重要的事情;一个没钱的人,大脑只有晚上吃什么,明天住哪里,下个月应该去哪里打工。针对年轻人,有钱的定义是:手头上的存款,能够在自己失业的前提下,维持至少3年的开销。
- 几乎整个社会,都在怂恿你花钱,也就是说,这个社会消费主义盛行,消费主义怂恿你买一件东西,比如说一个名牌包包,它还许诺,当你买了之后,你就能过上“轻奢生活”。可是,一旦你开了这个口子,你就切切实实掉进了消费主义的大坑,因为一旦你买了一个名牌包包,是不是还得换件更好看的外套?外套换了,是不是还得换双更贵的鞋子?鞋子换了,发现别人不仅有红色的名牌包包,还有黄的,紫的,黑的,白的,绿的,每天都有不同的颜色,这时候,你换还是不换?所以,一旦被消费主义洗了脑,从此就有可能万劫不复。很多时候,我们之所以会被消费主义洗脑,买了不该买的东西,是虚荣心在作怪,而之所以会有虚荣心,是因为知道自己没钱,想要通过打肿脸充胖子的方式,来引起别人的注意。
有趣
荐书
杂谈
手机版“神探玺洛克”请扫码