“one ring to rule them all”
这是电影《魔戒》中的一句经典台词,用以形容一枚占据*统治地位的*魔戒。
通用人工智能领域,也曾出现过这样一枚“*魔戒”。它的登场,同样有着一个在学术圈来看违背祖训、惊世骇俗的论文标题——“attention is all you need”。
站在aigc如火如荼、各种类gpt模型层出不穷的2023年回望,当时这篇论文的标题有多“狂妄”,这枚魔戒的影响力就有多大。且与电影中的*魔戒带来彻底的毁灭不同,这枚agi的“*魔戒”指向全新的创造。
那么,又是谁创造了这枚“*魔戒”?他们如今在何方,是否又在酝酿着新一轮的ai风暴?
现在我们都知道openai开启了gpt时代,但再往前追溯,它是站在巨人的肩膀上才能采摘下来的成果,这个巨人的肩膀就包括了2017年发表的这篇“attention is all you need”。
这篇论文提出了名声大噪的transformer架构,是著名算法bert中最重要的部分,更是chatgpt 末尾的“t”。
尔后,transformer 势如破竹,从自然语言处理机器翻译开始,席卷整个 nlp 领域。
如今6年过去,chatgpt几乎是transformer结下的最丰厚的果实,而耕种了transformer架构的8位作者—— ashish vaswani、noam shazeer、niki parmar、jakob uszkoreit、llion jones、aidan n. gomez、lukasz kaiser 和 illia polosukhin,大多数现在不在谷歌工作。事实上,其中有七人不再驻足留恋于谷歌这颗苍天大树之下。
我们统计,“”中,“转投小厂派”一人:lukasz kaiser则已在2021年加入 openai担任研究员。
llion jones是8人中目前*还在谷歌工作的,只是工作地点换到了日本。他曾打趣地表示,自己对论文作出了最有意义的贡献,是写下了attention is all you need这个“大逆不道”的标题。
其中,创业派6人选择了自立门户,且基本上从谷歌一出来就已经获得了 vc 的支持。
本文将着重梳理“attention is all you need”中创业派的最新动向。
01、“真实感”的保鲜期有多久?
原google brain研究员aidan gomez的创业公司恐怕是里面最受瞩目的。
aidan gomez
aidan gomez创办的公司叫做cohere,是一家成立于2019年的加拿大ai创企,专注于提供nlp模型,帮助企业改善人机交互,包括利用transformer架构快速部署对话式ai聊天机器人、生成式搜索引擎、文本摘要总结、增强向量搜索等。这家公司的另外两位创始人nick frosst和ivan zhang,也和aidan gomez一样具有学术背景,且三位创始人均是多伦多大学校友。
cohere之所以备受业内瞩目,除了创始团队的背景之外,也有一部分原因在于,它的投资者中还有图灵奖获得者geoffrey hinton、知名人工智能研究员李飞飞、uc伯克利大牛pieter abbeel的身影。这三位在当今人工智能领域都是执牛耳的人物。
这样的大牛背书之下,cohere的融资步伐也十分紧凑,分别于2021年9月获得4000万美元a轮融资,2022年2月获得1.59亿美元b轮融资。
随着生成式浪潮在今年达到一个小高潮,今年5月,据《纽约时报》报道,cohere更是拿到了2.5 亿美元的融资,估值达到20亿美元,本次投资者包括crm*salesforce、著名芯片制造商nvidia、inovia capital等。《纽约时报》写道,cohere也是为数不多在技术层面具备与openai进行竞争的ai企业之一。有报道称cohere现有员工已经达到近200人。
与aidan gomez选择的赛道类似,论文一作ashish vaswani在离开谷歌后,也参与创办了一家将nlp技术用于通用助手的公司adept,并任该公司首席科学家。在谷歌工作后,vaswani撰写了19篇论文,神经网络是他自2011年以来一直追求的共同主题。
transfomer八子中的niki parmar也加入了adept,任cto。值得一提的是,niki parmar 是这个论文 8 位作者里*的女性。
adept虽然成立较晚(2022年4月才正式成立),但也赶上了这一波aigc的浪潮:今年3月拿到了3.5亿美金的b轮融资,由general catalyst和spark capital联合领投,addition、greylock、atlassian ventures、microsoft、nvidia、workday ventures等机构跟投,还有众多的硅谷明星创业者作为个人投资人投资。
这轮融资将adept的总融资额增至4.15亿美金,公司估值超过10亿美金,晋升独角兽。
不过,adept最新这轮融资已经和ashish vaswani、niki parmar没什么关系了。因为他们两都在2022年底先后离开adept,成立了一家名为essentialal的公司,目标是为企业构建软件以便于他们使用大型语言模型。今年5月,essentialal宣布了由thrive capital 领投的800万美元融资。值得一提的是,thrive capital 也是openai 的投资者。该公司仍处于隐身模式,尚未推出任何产品。一位接近该公司的消息人士称,conviction 和天使投资人 elad gil 也参与了这轮融资。
值得一提的是,创业派除了上面几位年轻面孔,也不乏已经为谷歌效力20多年的老员工。
这位老员工就是noam shazeer。他在2018年开发了mesh-tensorflow,这是*个用于在超级计算机上训练大型transformer的实际系统。
2021年,noam shazeer 也离开了谷歌,与前谷歌工程师 daniel de freitas 共同创立了 character.ai,致力于开发生成式 ai 聊天机器人 web 应用程序。迄今为止,该公司已筹集了约 2 亿美元,估值接近独角兽,约有20名员工。
02、“创业派”中的冒险者
都说创业是一场冒险,那么,跨界创业更是冒险中的冒险。
transformer八子中,jakob uszkoreit是当之无愧的冒险担当,他的创业去向应该是*跨界色彩、也是最有难度的。
uszekoreit 被认为是发明 transformer 架构的幕后推手。googlebrain工作期间,他组建了google助手的语言理解团队,并参与了早期的google翻译工作。
在谷歌工作了 13 多年之后,jakob uszkoreit也于 2021 年离开了谷歌,他创立的 inceptive,是一家彻头彻尾的ai 生命科学公司,致力于使用神经网络 高通量实验来设计下一代 rna 分子。
到目前为止,该公司已筹集了 2000 万美元。
另一位跨界派illia polosukhin,几乎是踏出了ai圈,投入到区块链浪潮中。
这位硅谷著名的it天才,是google tensorflow人工智能开源项目的主要代码贡献者,还曾任google深度学习小组项目主管,带队负责核心搜索算法业务近10年。他在2017年2月就离开了谷歌,创办了区块链底层技术公司near protocol,吸引了包括a16z、 multicoin capital、metastable、coinbase ventures等区块链领域的著名投资机构。
这家公链技术公司可以托管去中心化应用程序和智能合约,被誉为“以太坊杀手”, 目前估值约为20亿美元。
03、新的硅谷“八叛徒”故事?
从transformer八子目前的故事走向来看,已有些许当年硅谷传奇——仙童“八叛徒”的风采。
这件往事里,“叛徒”是一个褒义词。在晶体管刚刚问世之际,8位肖克利半导体实验室核心人物纷纷出走,先后创办了仙童、英特尔和amd等著名的半导体公司。可以说, 1970 年前后的半导体浪潮中,大部分半导体公司都起于仙童。凭借“八叛徒”的智慧和创新精神不断开枝散叶,微处理器得以普及,计算机变得更加迅速和强大,硅谷更是一举成为了全球半导体产业的中心,引领着信息时代的浪潮。
如今这段佳话过去已近70年,硬件的突破已经出现边际效应,新一轮的信息革命蓄势待发,人类需要更加智能的技术来解决复杂的问题,创新的火种移交到ai领域,硅谷似乎迎来了新的八君子。
我们不难发现,和仙童“八叛徒”类似,“transformer八子”本身已经积累了丰富的经验和技术知识,他们在谷歌期间推动了人工智能领域的发展,离开谷歌进入到各行各业中,能让这些宝贵的资源和知识更广泛地应用于不同的领域和行业。
更重要的是,这一批离职的ai大牛,同样具备极高的创造力和冒险精神。
他们都曾表达过对现状的不满,追求更高的目标和更具冲击力的创造。
八子中的“创业派”代表niki parmar就曾表示,在谷歌,公司整体更注重改进现有产品,而不是创建全新的产品类别。
无论是离开谷歌创办自己的公司或加入其他创新型企业,他们能够更加自由地探索和实践新的想法和概念,从而推动技术的不断进步。
而且这些ai大牛们的离职,也有助于推动合作生态的形成。他们往往与其他优秀的科学家、工程师和创业者紧密合作,共同开展创新项目和研究。这种合作生态能够加速创新的过程,促进技术和思想的交流,为整个行业带来更多的机遇和突破。
正如八子中的另一位“创业派” aidan gomez所说:“在谷歌这样的大公司内部进行探索的自由度有限,你无法真正自由地进行产品创新。从根本上说,(这家公司的)结构不支持它。所以你必须自己去建造这个结构。”
这一批离开谷歌的小分队,正在以更加自由的方式探索和发展新的技术和方法,进一步推动通用人工智能的进步。
这样来看,transformer八子的出现与出走,既是起势,或许也是某种顺势,正如当年的仙童“八叛徒”一样。