type
status
date
slug
summary
tags
category
icon
亚伦·斯沃兹(Aaron Swartz)
亚伦·斯沃兹(Aaron Swartz),1986 年出生于美国芝加哥,作为传奇的互联网天才,他的生命却暂停在了 26 岁那年,尽管生命短暂,但他创造了诸多影响深远的成就。作为天才儿童,他 3 岁就学会了编程,并用 Basic 语言敲出了一个《星球大战》的问答游戏;12 岁创立维基式知识共享网站The Info;13 岁参与制定了 RSS 1.0 标准;15 岁,他参与了 CC 知识共享协议的创建工作;16 岁,他发明了 ATX 语法(Markdown 语言的基础),同年,和John Gruber 共同创造了 Markdown;17 岁进入斯坦福大学学习,但大一便辍学了,加入了 Paul Graham 的 Y Combinator;19 岁成立了 Reddit.com,同年,因为想开发 Infogami(一个用于创建网页或结构化数据的 Wiki 系统),但发现没有好用的 Python 开发框架,便顺手开发了网站应用框架web.py ;20 岁这年,亚伦卖掉了 Reddit 所有股份,离开了Reddit,并成为了百万富翁,同年,他提出了开放图书馆(Open Library)理念,希望将世界上所有曾经出版过的书籍信息都收集起来。
CC 的另一个重要特性是国际化,CC 最初的条款是基于美国法律编写的,此后已有超过 40 个国家基于本国法律完成了 CC 的本地化,而中国的这项工作是由人民大学完成的。
针对艰巨任务 ——
- 细分任务:将宏大的任务分解为具体可立即实施的小任务,构建任务链,每完成一个小任务后明确下一步任务并加入待办事项列表。
- 简化任务:从简单的部分入手,如将“写一本书”简化为先写一篇文章或一个段落概要,有进展很重要。
- 提高完善:从已有的成果逐步积累,如将写好的段落慢慢积累成文章再到书。
- 认真考虑:对不熟悉的领域从研究开始,借鉴他人经验,做小尝试以获得灵感来解决困难问题。
Jim Keller
对于想成为工程师,但父母或某人希望他成为一名经理的人来说,尤其如此。你会过着艰难的生活,因为你不是在追逐你的梦想,而是在追逐别人的梦想。你为别人的梦想感到兴奋的几率很低。因此,如果你不兴奋,你就不会投入精力,或者学习。这最终是一个艰难的循环。
我虽然目前在研究AI,但我从不跟ChatGPT聊天,就如同我设计游戏芯片,但从不玩游戏,我还是更喜欢看书。
最糟糕的团队是一个Leader带着几十号人跳槽到另一家公司,然后试着复制他们在上家公司做的事情,虽然可以复制之前的事情,但是这些人和之后的新人就会变成了两个团体,不断疏远。而信任是一个团队最重要的事情,比通过合同、谈判等来做事的团队效率更高。如果你看到团队有人在操纵环境为自己谋利,那么这样的人就必须开除,他会给团队的所有人造成很大的压力。
张益唐
这是张益唐真正想要做出的「大东西」,即使他自己也承认,没有太多人可以真正做下去,因为「毕竟是太难了」。但这也正是他最爱的数学的开阔幽深之处。朋友齐雅格说,「他就是对大问题感兴趣,所以是很冒险的事情。也许你一事无成,等于你到头为零。你要是做到二流、三流的水平,那总是有进展。」
如今回忆起张益唐最困顿的岁月,朋友们最深的感受都是他精神上的富足。每次朋友们聚在一起,大家聊的都是「奇点啊,霍金啊,爱因斯坦啊,哥本哈根学派啊,量子力学什么的,谈一些很宏大的问题」。每当张益唐去纽约的好友家,两人在门口点根烟,谈谈文学,谈谈历史,烟雾里缭绕的都是雨果、巴尔扎克、莫泊桑和陀思妥耶夫斯基。在好友看来,他们那代人是最后有共同文本的一代,很容易就聚在一块,因为「知识底色相当一致」。
两年后的一天,他在浏览Goldston、Pintz和Yildirim3人在2005年所做的工作时发现,距离得出最终结论——如一位数学家的比喻——似乎只有一根头发丝的距离了。这个问题他已断断续续想了多年。「我有一种直觉,我没法去论证这种直觉。」他后来对媒体说,「但直觉告诉我,我应该可以做出来。」他暂停了一直以来的其他研究,把两年多的时间投入到这最后一丁点的距离之中。
选课不分年级,没有强制要求,「我们也只能是创造条件,这些事情就跟谈恋爱一样,谈得成谈不成,有时候也看缘分。纯粹数学是人对知识的一种纯粹的追求,没有太多利益在里边。」北大数学与科学学院院长陈大岳打了个比方,「大家更像是要把一件事搞清楚,并不指望这个有直接的经济价值。(数学里边的)某些学科要是停顿10年或20年,本身对社会没有什么大的负面影响。」
Peter Thiel
每个垄断企业都有自己的特色,但是它们通常会综合以下几个特点:专利技术、网络效应、规模经济以及品牌优势。
你做什么并不重要?真是彻头彻尾的错误。你应该将全部注意力放在你擅长的事情上,而且在这之前要先仔细想一想未来这件事情是否会变得很有价值。
要找到公司内部不团结的原因,分清以下三个概念很有用: ·所有权:谁在法律上拥有公司的资产? ·经营权:谁实际上在管理着公司的日常事务? ·控制权:谁在形式上管理公司事务?
每个人都有产品需要销售——不论是员工、创始人还是投资者。即使你的公司仅仅由你和电脑组成,也是如此。环视四周,如果没有看到销售员,那么你就是。
Richard Hamming
理查德·汉明(Richard Hamming,1915--1998)是著名美国计算机学家,图灵奖得主,"汉明码" 的发明人。
敞开办公室大门(那些把门敞开的人,的确受了很多的打扰,但他也不时地获得线索,了解这世界什么更重要。我可以说,那些敞开了门干活的人和最终成就了大事的人之间,存在千丝万缕的联系。)
做可以成为他人基石的工作(科学的本质是积累,我再也不去做相互孤立的问题,除非它能代表某一类问题的共性。我决不再去解决单一的问题。你要么让人们在你的成果上有所建树,要么别人不得不把你干的活从头再来复制一遍。)
重视推销和表达自己(你得学会写好、写清楚以便人们愿意看;你必须学会发表相当正式的发言;你还必须学会作出非正式的谈话。)
远见超出你的能力时,才去做管理(如果有一天你的远见大大超过了你的能力时,你就应该去做管理工作。而且,远见越大,你就应做越大的管理。)
杨植麟
杨植麟:我认为每项技术基本都会历经原理探索期、技术创新期以及纯产品应用阶段三个阶段。第一阶段意味着公众对于技术的第一性原理还不清晰,一切刚刚开始萌芽;第二阶段则指的是第一性原理已经清晰,但是仍然存在技术创新的空间,领先的公司会有显著的技术优势;最后一个阶段,当技术已经足够成熟了,可获得性很高了,就是纯产品的机会,网络效应建立。
当时,我觉得就是大模型的第一性原理还没有清晰,或者说第一性原理还没有真正成为共识。因为现在的第一性原理就是,只要你有更好的压缩比,你就会有更好的智能,这个其实对应的就是大语言模型的目标函数。所以当时(提出Transformer-XL),我们其实是在原模型的基础上取得了一个比较大的提升,让它的智能程度提升了很多。但当时,对于这件事情是有用的,显然还没有出现一个共识。那其实,本质上,我们可以看到一般共识是要落后于非共识的思维的。正因为这样,非共识可以产生很大的价值。比如我们现在正在做的事情,虽然是非共识,但是我一点都不 care。我直接做工业化,把这个东西做出来效果之后,那么很多人就会来跟进和关注。OpenAI 通过工业化的方式,而不是一个纯研究的方式去证明了第一性原则是对的。我觉得这见证了时代的变迁,一共有三个阶段。第一阶段是 2018 年之前,所有人不知道大语言模型有什么用,到第二个阶段是 18 到 19 年,BERT 时代,大语言模型可以提升各种任务,到第三个阶段,20 年往后,只剩下一个任务就是语言模型。
腾讯新闻《潜望》:你怎么看杨立昆说,他不看好现有技术路线,认为自监督的语言模型没办法习得真正世界的知识,随着模型规模的扩大出现谬误,也就是机器幻觉的几率会越来越高。他提出了“世界模型”的观点。杨植麟:没有本质瓶颈。当 token space 足够大,变成一个新型计算机解决通用性问题就 OK 了,它就是一个通用世界模型。(他这么说)很重要一点在于,大家都能看到现在的局限性。但解决方式并不一定需要全新框架。AI 唯一work 就是 next token prediction + scaling law,只要 token 足够完整,都是可以做的。当然今天他指出的问题存在,但这些问题就是你把 token space 变得很通用,就可以了。
腾讯新闻《潜望》:朱啸虎(金沙江创投主管合伙人)就只投大模型的应用。他有一个观点:核心最难的是 AIGC 的 PMF——你十个人找不到 PMF,你投一百个人也找不到,和人数、和成本没关系,不要砸钱。他说“用 LLaMA 训练两三个月,至少能做到人类 top 30 的水平,立马可以取代人”。你怎么看他的观点?杨植麟:AI 不是我在接下来一两年找到什么 PMF,而是接下来十到二十年如何改变世界——这是两种不同思维。我们是坚定的长期主义者。当你实现 AGI 或更强智能,今天的一切会被改写。PMF 固然重要,但如果着急找PMF,你很可能又被降维打击。降维打击发生过太多次。以前很多人做客服、对话系统,做 slot filling(槽填充),有些规模不错的公司。但是,全是降维打击了,很难受。