一位ai从业者的十年 -k8体育

2015年,我刚参加工作,*个任务是识别图片里的物品。传统做法是,找到物品的特征,用机器学习设计特征工程,做成模版,拿着模版进行特征匹配。做了几个月,效果差强人意。突然一则新闻吸引了我的注意力,谷歌旗下的deepmind开发了一款围棋程序alphago,要与世界冠军李世石对弈。赛前大家并不看好ai,

2015年,我刚参加工作,*个任务是识别图片里的物品。传统做法是,找到物品的特征,用机器学习设计特征工程,做成模版,拿着模版进行特征匹配。做了几个月,效果差强人意。

突然一则新闻吸引了我的注意力,谷歌旗下的deepmind开发了一款围棋程序alphago,要与世界冠军李世石对弈。赛前大家并不看好ai,甚至人工智能专家李开复也觉得ai赢不了。事实让众人大跌眼镜,alphago以4:1大胜李世石。这个结果给了我极大震撼,因为中国人知道围棋的难度。19乘19的棋盘,状态空间复杂度高达10的171次方,远大于宇宙中原子的个数,单靠近似穷举不可能解出答案。

我疯了一般去寻找背后的故事。原来,alphago的核心是卷积神经网络。这是杨乐昆在1989年提出的一种图像识别算法。为什么这个技术在二十多年后才被人重视?因为数据和算力不足。

直到2012年,深度学习之父辛顿的两名学生在李飞飞主导的imagenet超大规模视觉识别挑战赛上一鸣惊人,人们才终于见识到威力。他俩基于吴恩达的工作,创造性的将英伟达的gpu用于训练一个600万参数的深度神经网络alexnet。alexnet在学习了1000万张李飞飞团队辛苦标注的图片后,将图像识别的准确率提高了10%以上,遥遥*于亚军。在alexnet的基础上,科学家们再接再厉,提出了一个又一个更深更大的网络,zfnet,vggnet,googlenet,每年都在进步。到了2015年,华人学者何恺明,曾经的广东高考状元,提出了152层的极深网络resnet,参数量过千万,至此,ai的图像识别准确率终于超过了人类。

了解到这些背景,我兴奋得浑身发抖。开发人员再也不需要手工设计图像特征,深度网络通过海量数据学到的特征,远胜资深专家的多年经验。为了深入学习,我开始使用亚马逊云服务aws,很快就被英伟达的cuda惊艳到了。cuda非常高效,吸引了众多研究员和工程师,英伟达的开发人员也热心解答各种bug问题。渐渐的,越来越多的算法首发在cuda上,更多的改进算法为了超越前者也只能用cuda,形成了网络效应,用的人越多越好用。当年还没有现在这么完善的深度学习框架,我入门靠的是华人学者贾扬清在写毕业论文之余开发的caffe。这位大神慷慨开源了他基于cuda的研究框架,又在博士毕业后成为谷歌的tensorflow和meta的pytorch两大当今*框架的主要贡献者。

有了这些武器,我总算可以把图像识别算法换成深度卷积网络,效果显著,准确率飞升。但我知道永远不能自满,这是个眨眼十年的领域。得益于科学家们的开源精神,网络的架构不断进化。2017年,谷歌提出了transformer自注意力架构。所谓自注意力,简单说就是只关心输入之间的关系,而不再关注输入和输出的关系,这是一个颠覆性的变化。这篇论文发布之前,虽然深度学习已经取得长足进展,但ai的各个分支,视觉,语音,语言理解等,还是相对割裂的,每个领域有自己的模型。之后,则是transformer一统天下,各领域专家的知识整合以及多模态融合变得愈加轻松。李飞飞的高徒安德烈,甚至惊叹,也许人类偶然窥见了和自然界类似的强大架构,造物主沿着这个路径复制,造就了今天的大千世界。

transformers让gpu并行运算的效率进一步大幅提升,2018年,openai和谷歌相继发布了参数量过亿的gpt和bert模型。2020年初,openai发表了著名的scaling laws规模法则,指出更大的模型,更多的数据,更长时间的训练是提升模型能力的可行路径。2022年底,chatgpt横空出世,参数量达到恐怖的1750亿,模型大到违背了许多科学家的直觉。通常来说,如果一个模型训练几个月烧掉百万美金,效果还没有很大提升,研究员就放弃了。但伊利亚不是一般人,作为当年alexnet的作者之一,他坚信规模法则,在烧了千万美金之后,终于捅破天花板,看到了推理智能的大幅涌现。

曾经,为了实现一个简单的小功能,我就需要训练一个ai模型。要完成一个复杂的商业系统,需要多个ai模型的协作,以及大量的底层逻辑代码。但现在,借助gpt大模型,实现功能只需要写一句简单的提示语,生产效率大大提高了。

全世界都看到了大模型的威力,根据斯坦福大学ai研究院的最新报告,2023年生成式ai的投资激增了8倍。训练模型也越来越昂贵,谷歌为了追赶chatgpt开发的gemini模型,成本接近2亿美金。大规模的金钱竞赛,成了巨头公司们的游戏。

在此背景下,依然坚持开源的英雄们,尤其值得尊敬。著名开源社区huggingface的创始人分享了一个美妙故事,关于三大洲(欧洲,美国,中国)的人们如何合作共建并公开分享了一个紧凑高效,行业*的ai模型。一个小团队在法国巴黎发布了他们的*个模型:mistral 7b。该模型令人印象深刻,体积小,但在基准测试中表现出色,优于之前所有同尺寸的模型。而且是开源的,人们可以在其基础上继续开发。瑞士伯尔尼的刘易斯和法国里昂的埃德都来自huggingface的模型微调团队,他俩在喝咖啡时聊到了这个模型:一个来自美国加州斯坦福大学的研究团队刚刚发布了一种新的方法,用这种方法微调mistral怎么样?嘿,这是个好主意,另一个人答道。他们刚刚开源了一个很棒的代码库,让我们用起来吧!第二天,他们开始深入研究huggingface上公开共享的数据集,偶然发现了两个有趣的大型高质量微调数据集,它们来自中国清华大学的团队openbmb,也开放了源码:ultrafeedback和ultrachat。几轮训练实验证实了这一直觉,由此产生的模型超级强大,是迄今为止他们在伯克利和斯坦福的基准测试(lmsys和 alpaca)中所见过的最强模型。开源模型排行榜的大咖克雷门汀也被吸引了,她对模型能力的深入研究证实了这一模型拥有令人印象深刻的性能。团队还邀请了康奈尔大学教授萨沙加入对话,他提议快速起草一份研究论文,整理并与社区分享所有细节。几天后,起名龙卷风zephyr的模型、论文和所有细节便席卷世人。很快,世界各地的许多公司都开始使用它,有公司声称用它取代chatgpt让其节省了一半的费用。众多研究人员在开源社区热烈讨论该模型和论文。所有这些都在短短几周内发生的,这得益于世界各地(欧洲,北美,中国)发布的知识,模型和数据集的开放访问,以及人们在ai领域相互借鉴工作,为现实世界带来价值的高效理念。开源社区的成就令人惊叹,理念更令人神往。当openai不再open,是这些胸怀技术开放理想的研究者,将大模型的秘密,展现给全世界。

进入2024年,大模型的进展依旧如火如荼:

1. sora模型通过简单描述生成栩栩如生的长视频,成为全球焦点。openai称之为世界模拟器,能深刻理解运动中的物理规律。华人学者谢赛宁揭示了背后原理,来自他发表的基于transformer架构的扩散模型dit。很快,潞晨和北京大学推出opensora,全面开源文生视频的模型参数和训练细节。快手公司也推出了可灵大模型,展示了图生视频和视频续写等功能,在*学术会议上引起积极反响。

2. 大模型的推理能力让许多互联网产品得到升级,arc search加perplexity的ai浏览器可以改善用户的搜索体验,自动整合全网资讯,给出要点,回答问题的精准度大幅提升。月之暗面的kimi对话搜索引擎,被许多投资人推荐,因为其强大的文本总结能力和200万汉字的超长上下文窗口,让阅读上市公司财报和资料的工作不再繁琐。

3. gpt4o展示了在文本,图像和语音上的多模态实时处理能力。上海人工智能实验室和商汤科技联合发布的书生大模型internlmm,开源了开放世界理解,跨模态生成和多模态交互的能力,在全球开发者社区备受欢迎

4.吴恩达力推智能体工作流,让ai学会使用工具,亚马逊的aws,微软的azure,阿里巴巴的百炼,百度的文心和字节的扣子等各大云计算平台都提供了便捷多样的插件,让ai如虎添翼。

5.端侧ai开始落地,苹果发布apple intelligence,在保护用户隐私的同时,将大模型直接部署到用户的手机里。因为某些客观因素,中国的算力受到限制,反而催生了一些另辟蹊径,以小博大的模型路线。面壁智能公司推出minicpm模型,只有24亿参数,性能却超越了比自己5倍大的巨人。6.mistral开源了混合专家模型架构,由多个专家子模型组成,回答特定领域的问题只需要调用相应的,整体推理消耗大大降低。美国的gpt和claude降价了50%以上,中国公司发扬卷的精神,阿里的通义千问,幻方的deepseek等*模型直接降价90%。各家大模型之间的竞争愈演愈烈,鹿死谁手,犹未可知。

展望未来,我是非常乐观的。虽然当今世界并不太平,各种冲突矛盾不断,但ai对生产力的促进是确定的。有人担心ai会让很多人失业,但李飞飞认为,ai取代的是任务,而不是工作。每项工作都由大量任务组成,让ai去完成繁重的任务,人类的创造力将进一步解放。20年前,随着生产力的提高,大部分国家开始实行一周五天工作制。在下一轮ai工业革命到来之际,一周休三天,也不是遥不可及的幻想。(作者:drchuck,在雪球设有同名个人专栏)

(0)
小多多的头像小多多创始人

相关推荐

  • 《纽约时报》记者曾问英国探险家乔治·马洛里:“登顶珠峰困难重重,要面对极寒、强风、陡岩,随时可能失去生命,为什么还要挑战?”他回答:“因为山在那里。”从数据来看,刷新登顶珠峰纪录的并不是探险家,而是散居在喜马拉雅山两侧的夏尔巴人。为保证各国的登山者顺利登顶,夏尔巴人不仅每年要重新搭建“登山之路”,铺

    2024年9月20日
  • 近期,惠州大亚湾区博雅培文实验学校举办了小学部第 二届辩论赛,旨在提高学生思辨能力,培养团队精神,提高语言表达能力,促进学生综合素质的全面提…” />

    2023年5月15日 创投
  • “她从精致的北欧风房间醒来,吃着brunch,在手机屏幕上轻点手指,约好等下和小姐妹去do脸。”在网络盛传的无数江浙沪文学中,“做脸”是白富美生活中不可缺少的一环,以一种直接可见的方式,构成了人们对中产精致生活触手可及的想象。如今,美剧《欲望都市》中萨曼莎那一句“比起婚姻我更相信保妥适(肉毒素),因

    2023年11月23日 创投
  • 1.紫金矿业:主力资金净流入6.3亿元,现价11.87元,今日涨幅4.12%。近期走势符合趋势理论,结合成交量的有效放大,突破箱体形态后,后市股价上涨不再存在抛盘压力。 紫金矿业k…

  • 2023年11月3日,昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务!用户在应用商店下载“天工app”或登陆“天工k8体育官网”(www.tiangong.cn)均可直接注册使用。「天工」是国内*对标chatgpt的双千亿级大语言模型,也是一个ai搜索引擎,一个对话式a

    创投 2023年11月4日
  • 700亿美元ipo背后,arm的三个不确定

    如果arm能按计划于9月中旬在纳斯达克顺利完成上市,近700亿美元的估值将成为近两年来*规模的ipo,更有望使其成为继阿里巴巴、facebook之后,有史以来的第三大科技公司ipo。从2022年开始,美国ipo市场一直萎靡不振。arm的到来,究竟能否成为一剂强心针,用不了多长的时间就可验证出来了。a

    2023年9月4日
  • 重庆啤酒拟收购「京a」,精酿需要「破圈」

    我国头部精酿啤酒厂牌“京a”,要被重庆啤酒拿下了。9月28日,重庆啤酒发布公告称,公司控股股东嘉士伯拟在其控股子公司嘉士伯香港取得首釀啤酒控制权的同时,将首釀啤酒及金贝香港(首釀啤酒全资子公司)持有的中国境内全部啤酒资产(即:北京首酿金麦贸易有限公司及金贝亚太(北京)餐饮有限公司的100%的股权)分

    创投 2023年9月30日
  • 炎炎夏日,女孩们的身材焦虑又达到了顶峰。前有锁骨放硬币,后有反手摸肚脐,今有“辣妹都在穿bm”。所谓bm,其实是意大利品牌brandy melville的首字母缩写,“bm风”则是由该品牌的单品特点衍生出来的穿搭模版,这种风格主打“短、紧、露”,且所有衣物只有一个xs尺码,有的上衣,甚至比童装还迷你

    2024年8月6日
  • 大众救小鹏,小鹏扶大众,当前新能源行业竞争加剧,各大新能源汽车厂商纷纷发力智能化以提高产品销量和附加值,进而提高整车毛利率,但相较于新势力车企而言,传统车企布局智能化本就先天不足。

    2023年7月31日 创投
  • 个人商用房贷款 ☆服务简介 个人商用房贷是指银行向借款人发放的购置新建自营性商业用房和自用办公用房的贷款。 ☆服务特色 助您低成本实现商用房的置业。 ☆申请条件 1、自然人须有城镇…

    2022年1月25日
  • 疯狂建高校,这一轮河南赢了。近年来,新建高校似乎成了不少地区热衷的事情,大湾区、西部、中部等地都在疯狂建大学。《中国统计年鉴2024》数据显示,2023年全国普通、职业高等学校数量达到2822所,较上年增加62所。在31个省份中,江苏、河南的高校数量达到168所,为全国高校数量最多的两个省份。广东、

    2024年11月25日
  • 中秋、国庆双节,被视为传统的白酒消费旺季,但今年似乎有些不同。最近,飞天茅台的价格持续下跌。今日酒价数据显示,9月24日,53度/500ml规格的2024年飞天茅台原箱批发参考价为2355元/瓶,散瓶为2250元/瓶;“龙茅”原箱批发价为2490元/瓶。值得注意的是,“龙茅”的官方指导价为2499元

    2024年9月24日
  • 本土快时尚品牌ur被传赴港上市。据彭博社报道,知情人士透露urban revivo(以下简称“ur”)考虑在香港ipo,筹资至少1亿美元。该人士还称,ipo计划仍在商讨中,公司也可能决定不上市。成立于2006年的ur,是本土快时尚品牌的代表,母公司快尚时装(广州)有限公司(以下简称“快尚时装”),也

    2024年6月27日
  • 国内云厂商,又“打”起来了。过去一个多月,国内云计算领域掀起了一轮降价潮。首先是2月29日,阿里云宣布中国区全线降价,100多款、500多种规格的产品直降20%,最高降幅55%;当晚,京东云跟进降价,称要比阿里云再便宜10%;4月8日,阿里云海外的核心云产品也开始促销。不但直接降价,阿里云、腾讯云还

    2024年4月12日
  • 曾几何时,以《丑陋的xx人》为名的书在中国风行一时。我手头就存有五种,分别是光明日报出版社1988年出版的《丑陋的美国人》、作家出版社于同年出版的《丑陋的日本人》、岳麓出版社1989年版《丑陋的中国人》、贵州人民出版社1987年版《丑陋的韩国人》、香港次文化堂出版社1990年版《丑陋的香港人》。此外

    2024年8月7日
网站地图