大师们 | Eddie’s Blog

type

status

date

slug

summary

亚伦·斯沃兹（Aaron Swartz）

本文出自博主的 Newsletter《棱镜通讯》，每期一个话题，🐣 关注记录、挖掘科学创造、社会思想和个体生活。我相信每一个人物、思想、事物的背后都有一段精彩的故事，启发当下，看向未来。目前《棱镜通讯》已更新39 期，往期内容请访问太隐网...

https://wangyurui.com/posts/leng-jing-tong-xun-no-113-ya-lun-si-wo-zi-aaron-e760e0ca

亚伦·斯沃兹（Aaron Swartz），1986 年出生于美国芝加哥，作为传奇的互联网天才，他的生命却暂停在了 26 岁那年，尽管生命短暂，但他创造了诸多影响深远的成就。作为天才儿童，他 3 岁就学会了编程，并用 Basic 语言敲出了一个《星球大战》的问答游戏；12 岁创立维基式知识共享网站The Info；13 岁参与制定了 RSS 1.0 标准；15 岁，他参与了 CC 知识共享协议的创建工作；16 岁，他发明了 ATX 语法（Markdown 语言的基础），同年，和John Gruber 共同创造了 Markdown；17 岁进入斯坦福大学学习，但大一便辍学了，加入了 Paul Graham 的 Y Combinator；19 岁成立了 Reddit.com，同年，因为想开发 Infogami（一个用于创建网页或结构化数据的 Wiki 系统），但发现没有好用的 Python 开发框架，便顺手开发了网站应用框架web.py ；20 岁这年，亚伦卖掉了 Reddit 所有股份，离开了Reddit，并成为了百万富翁，同年，他提出了开放图书馆（Open Library）理念，希望将世界上所有曾经出版过的书籍信息都收集起来。

CC 的另一个重要特性是国际化，CC 最初的条款是基于美国法律编写的，此后已有超过 40 个国家基于本国法律完成了 CC 的本地化，而中国的这项工作是由人民大学完成的。

针对艰巨任务 ——
细分任务：将宏大的任务分解为具体可立即实施的小任务，构建任务链，每完成一个小任务后明确下一步任务并加入待办事项列表。
简化任务：从简单的部分入手，如将“写一本书”简化为先写一篇文章或一个段落概要，有进展很重要。
提高完善：从已有的成果逐步积累，如将写好的段落慢慢积累成文章再到书。
认真考虑：对不熟悉的领域从研究开始，借鉴他人经验，做小尝试以获得灵感来解决困难问题。

Jim Keller

棱镜通讯 NO. 112 Jim Keller

Jim Keller，半导体行业传奇人物，著名的微处理器工程师，以在AMD、Apple 和 Tesla 的工作而闻名，热衷于困境下的创新挑战，非常擅长简化和解决瓶颈，每当在一个公司取得巨大创新性成果后就会跳槽（可能 Intel 经历除外）。...

https://wangyurui.com/posts/leng-jing-tong-xun-no-112-jim-keller-9c34bc24

对于想成为工程师，但父母或某人希望他成为一名经理的人来说，尤其如此。你会过着艰难的生活，因为你不是在追逐你的梦想，而是在追逐别人的梦想。你为别人的梦想感到兴奋的几率很低。因此，如果你不兴奋，你就不会投入精力，或者学习。这最终是一个艰难的循环。

我虽然目前在研究AI，但我从不跟ChatGPT聊天，就如同我设计游戏芯片，但从不玩游戏，我还是更喜欢看书。

最糟糕的团队是一个Leader带着几十号人跳槽到另一家公司，然后试着复制他们在上家公司做的事情，虽然可以复制之前的事情，但是这些人和之后的新人就会变成了两个团体，不断疏远。而信任是一个团队最重要的事情，比通过合同、谈判等来做事的团队效率更高。如果你看到团队有人在操纵环境为自己谋利，那么这样的人就必须开除，他会给团队的所有人造成很大的压力。

张益唐

mp.weixin.qq.com

https://mp.weixin.qq.com/s/7cCpCAwqjIYUsARWSQZrlw

这是张益唐真正想要做出的「大东西」，即使他自己也承认，没有太多人可以真正做下去，因为「毕竟是太难了」。但这也正是他最爱的数学的开阔幽深之处。朋友齐雅格说，「他就是对大问题感兴趣，所以是很冒险的事情。也许你一事无成，等于你到头为零。你要是做到二流、三流的水平，那总是有进展。」

如今回忆起张益唐最困顿的岁月，朋友们最深的感受都是他精神上的富足。每次朋友们聚在一起，大家聊的都是「奇点啊，霍金啊，爱因斯坦啊，哥本哈根学派啊，量子力学什么的，谈一些很宏大的问题」。每当张益唐去纽约的好友家，两人在门口点根烟，谈谈文学，谈谈历史，烟雾里缭绕的都是雨果、巴尔扎克、莫泊桑和陀思妥耶夫斯基。在好友看来，他们那代人是最后有共同文本的一代，很容易就聚在一块，因为「知识底色相当一致」。

两年后的一天，他在浏览Goldston、Pintz和Yildirim3人在2005年所做的工作时发现，距离得出最终结论——如一位数学家的比喻——似乎只有一根头发丝的距离了。这个问题他已断断续续想了多年。「我有一种直觉，我没法去论证这种直觉。」他后来对媒体说，「但直觉告诉我，我应该可以做出来。」他暂停了一直以来的其他研究，把两年多的时间投入到这最后一丁点的距离之中。

选课不分年级，没有强制要求，「我们也只能是创造条件，这些事情就跟谈恋爱一样，谈得成谈不成，有时候也看缘分。纯粹数学是人对知识的一种纯粹的追求，没有太多利益在里边。」北大数学与科学学院院长陈大岳打了个比方，「大家更像是要把一件事搞清楚，并不指望这个有直接的经济价值。（数学里边的）某些学科要是停顿10年或20年，本身对社会没有什么大的负面影响。」

Peter Thiel

棱镜通讯 No.94 Peter Thiel

彼得·安德烈亚斯·蒂尔（Peter Andreas Thiel，1967年10月11日－），生于西德法兰克福，美国国籍，著名企业家与风险资本家，同时也是著名的对冲基金管理者与国际象棋手（12岁时全美国际象棋第七名）。PayPal、Palan...

https://wangyurui.com/posts/1-dc10765e

每个垄断企业都有自己的特色，但是它们通常会综合以下几个特点：专利技术、网络效应、规模经济以及品牌优势。

你做什么并不重要？真是彻头彻尾的错误。你应该将全部注意力放在你擅长的事情上，而且在这之前要先仔细想一想未来这件事情是否会变得很有价值。

要找到公司内部不团结的原因，分清以下三个概念很有用： ·所有权：谁在法律上拥有公司的资产？ ·经营权：谁实际上在管理着公司的日常事务？ ·控制权：谁在形式上管理公司事务？

每个人都有产品需要销售——不论是员工、创始人还是投资者。即使你的公司仅仅由你和电脑组成，也是如此。环视四周，如果没有看到销售员，那么你就是。

Richard Hamming

棱镜通讯 No.88 Richard Hamming

理查德·汉明（Richard Hamming，1915--1998）是著名美国计算机学家，图灵奖得主，"汉明码"的发明人。 1942年，博士学位毕业，博士论文为《一些线性微分方程边界值理论上的问题》 1945年，参加曼哈...

https://wangyurui.com/posts/leng-jing-tong-xun-no-88-richard-hamming-4d0fdcd0

理查德·汉明（Richard Hamming，1915--1998）是著名美国计算机学家，图灵奖得主，"汉明码" 的发明人。

敞开办公室大门（那些把门敞开的人，的确受了很多的打扰，但他也不时地获得线索，了解这世界什么更重要。我可以说，那些敞开了门干活的人和最终成就了大事的人之间，存在千丝万缕的联系。）

做可以成为他人基石的工作（科学的本质是积累，我再也不去做相互孤立的问题，除非它能代表某一类问题的共性。我决不再去解决单一的问题。你要么让人们在你的成果上有所建树，要么别人不得不把你干的活从头再来复制一遍。）

重视推销和表达自己（你得学会写好、写清楚以便人们愿意看；你必须学会发表相当正式的发言；你还必须学会作出非正式的谈话。）

远见超出你的能力时，才去做管理（如果有一天你的远见大大超过了你的能力时，你就应该去做管理工作。而且，远见越大，你就应做越大的管理。）

杨植麟

对话杨植麟：Moonshot AI即将完成超10亿元融资，公司最终目标并非超越OpenAI

“大模型公司最重要的是人才与组织”。

https://mp.weixin.qq.com/s/mvBzhNmM-skPmxrXIpxUlQ

杨植麟：我认为每项技术基本都会历经原理探索期、技术创新期以及纯产品应用阶段三个阶段。
第一阶段意味着公众对于技术的第一性原理还不清晰，一切刚刚开始萌芽；第二阶段则指的是第一性原理已经清晰，但是仍然存在技术创新的空间，领先的公司会有显著的技术优势；最后一个阶段，当技术已经足够成熟了，可获得性很高了，就是纯产品的机会，网络效应建立。

当时，我觉得就是大模型的第一性原理还没有清晰，或者说第一性原理还没有真正成为共识。因为现在的第一性原理就是，只要你有更好的压缩比，你就会有更好的智能，这个其实对应的就是大语言模型的目标函数。所以当时（提出Transformer-XL），我们其实是在原模型的基础上取得了一个比较大的提升，让它的智能程度提升了很多。但当时，对于这件事情是有用的，显然还没有出现一个共识。
那其实，本质上，我们可以看到一般共识是要落后于非共识的思维的。正因为这样，非共识可以产生很大的价值。比如我们现在正在做的事情，虽然是非共识，但是我一点都不 care。我直接做工业化，把这个东西做出来效果之后，那么很多人就会来跟进和关注。
OpenAI 通过工业化的方式，而不是一个纯研究的方式去证明了第一性原则是对的。我觉得这见证了时代的变迁，一共有三个阶段。第一阶段是 2018 年之前，所有人不知道大语言模型有什么用，到第二个阶段是 18 到 19 年，BERT 时代，大语言模型可以提升各种任务，到第三个阶段，20 年往后，只剩下一个任务就是语言模型。

月之暗面杨植麟复盘大模型创业这一年：向延绵而未知的雪山前进

杨植麟：是曲折的过程。ChatGPT扩散需要时间。有的人知道得早，有的人知道得晚，有的人一开始怀疑、后面变成震惊、再变成相信。找人找钱，跟timing结合得很紧。

https://mp.weixin.qq.com/s/kEKotLcnlFK0jf8gNajXIg

腾讯新闻《潜望》：你怎么看杨立昆说，他不看好现有技术路线，认为自监督的语言模型没办法习得真正世界的知识，随着模型规模的扩大出现谬误，也就是机器幻觉的几率会越来越高。他提出了“世界模型”的观点。
杨植麟：没有本质瓶颈。当 token space 足够大，变成一个新型计算机解决通用性问题就 OK 了，它就是一个通用世界模型。
（他这么说）很重要一点在于，大家都能看到现在的局限性。但解决方式并不一定需要全新框架。AI 唯一work 就是 next token prediction + scaling law，只要 token 足够完整，都是可以做的。当然今天他指出的问题存在，但这些问题就是你把 token space 变得很通用，就可以了。

腾讯新闻《潜望》：朱啸虎（金沙江创投主管合伙人）就只投大模型的应用。他有一个观点：核心最难的是 AIGC 的 PMF——你十个人找不到 PMF，你投一百个人也找不到，和人数、和成本没关系，不要砸钱。他说“用 LLaMA 训练两三个月，至少能做到人类 top 30 的水平，立马可以取代人”。你怎么看他的观点？
杨植麟：AI 不是我在接下来一两年找到什么 PMF，而是接下来十到二十年如何改变世界——这是两种不同思维。
我们是坚定的长期主义者。当你实现 AGI 或更强智能，今天的一切会被改写。PMF 固然重要，但如果着急找PMF，你很可能又被降维打击。降维打击发生过太多次。以前很多人做客服、对话系统，做 slot filling（槽填充），有些规模不错的公司。但是，全是降维打击了，很难受。