马斯克硬刚openai -k8体育

马斯克硬刚openai,一边是互联网用户和多年来积累大量ugc内容的平台,另一面是新兴的aigc企业,一场围绕数据抓取、隐私安全的战争已经打响。

只听说过社交媒体想方设法让用户多停留的,没听说过主动给人加个上限的。如今开眼了,埃隆·马斯克正在给所有用户加“未成年人保护”,而这一切,居然是被ai逼的?

如今推特用户每天最多能浏览多少推特,不取决于手速或者舍不舍得熬夜,而是有一个明确的数字:已验证(也就是付费的“蓝鸟”服务)账户10000条、未验证账户1000条,而新注册的未验证账户只有500条。

就这,还是马斯克面对愤怒的用户,两次提高后的标准。至于原因,是“为了解决极端水平的数据抓取和系统操纵问题”。

他指的正是ai公司们,为了训练模型,这些企业需要大量数据作为喂养的饲料。去年12月,马斯克切断了与openai的数据联系,今年4月又指责微软非法使用推特的数据。

在马斯克为阻止数据抓取采取激进措施的同时,openai正在面临一项集体诉讼。诉讼的原告有16名,都是个人,换句话说,都是普通的互联网冲浪人。他们指控openai秘密地“从互联网抓取了3000亿字词”,未经允许从互联网那个用户那里窃取“大量私人信息”,以培训chatgpt。

一边是互联网用户和多年来积累大量ugc内容的平台,另一面是新兴的企业,一场围绕数据抓取、隐私安全的战争已经打响。

01

周五周五,敲锣打鼓。好不容易要周末了,推特的用户却傻了,屏幕上显示报错信息,提醒其已经超过了“速率限制”,违反了推特的规则,查看了过多推文。

人们压根不知道这是什么意思,推特老板马斯克站了出来,表示的确是有速率限制,而且宣布:为了解决极端水平的数据抓取和系统操纵问题,已验证、未验证、新注册未验证账户每天的浏览上限是6000、600和300条推文。

马斯克硬刚openai

在此之前,马斯克刚宣布推特开始禁止未登录的用户浏览内容,用户尚且能接受。限制实锤,用户麻了,继而看着这验证与否的区别对待,眉毛挑起来了:你个老六该不会是想用这招推行“蓝鸟订阅”吧?在评论区,不止一位用户评论:“现在得用钱制胜了?”

不满的声音很大,推特的竞品hive、mastodon、tumblr等出现在热门话题里,一张推特墓碑的梗图被大量使用。争议声中,马斯克两次提高标准至验证用户10000条浏览、未验证用户1000条。

马斯克硬刚openai

一个马斯克的高仿号调侃道:“我设置限制,是因为你们这些推特成瘾者需要出去走走。我这是在为世界做好事啊”。这种上价值的思路好,马斯克反手就是一个转发,自己还单独发了条“去拜访下你的朋友和家人吧”。

马斯克硬刚openai

不过玩笑归玩笑,马斯克为自己的这次“测试”给出了明确的解释:应对数据爬取。用户的不满,也在于限流的做法是否有效,而不在数据爬取的问题上。

ai初创公司跑来推特“扒数据”的情况有多严重呢?马斯克在一条推文中说,流量激增,推特不得不启用备用服务器:“在紧急情况下启用大量在线服务器,仅仅是为了给某些ai初创公司高得离谱的估值帮忙,这太令人恼火了。”

在限流风波的前一天,epic games的ceo蒂姆(tim sweeney)还发推抱怨推特也在建墙,马斯克回复:“数百个(甚至更多)阻止正在极其激进地爬取推特数据,到了影响用户体验的地步。我们应该怎么做?我对所有想法都保持开放。”

刚才还在抱怨的蒂姆,很快就给出了认真的建议,如在推特的服务条款中加入禁止数据爬取、以信息安全工程保护平台,以及针对大规模滥用推特的公司采取法律行动。

值得注意的是,马斯克在回复中提到,“*”会对那些窃取数据的人采取法律行动:“(乐观地说)从现在起2到3年,期待在法庭上看到他们。”

不管“为付费订阅添柴”的猜想是不是以小人之心度了马斯克之腹,马斯克高举用户隐私大旗之外,多少有可能抱有私心。4月,马斯克被传出成立x.ai新人工智能公司,要对抗chatgpt。如果真的要训练大语言模型,推特的用户数据,当然是只给自己用*。

不论如何,主动给平台限流都做得出来,马斯克已经做好准备,要和ai初创公司们硬刚到底了。

02

就在马斯克重拳出击给全平台限流的时候,这场aicg热潮的“始作俑者”、chatgpt的造物主openai,正卷入一场集体诉讼中。

这起诉讼在美国加州北区地方法院发起,原告16人,均为匿名,均为个人。诉状很长,足足有157页,以斯蒂芬·霍金的一句话作为开头:“强大人工智能的崛起,要么是人类有史以来*的事,要么是最糟的。”被告除了openai,还有为其注资上百亿美元的微软。

核心指控是,chatgpt使用从互联网上收集的数据来“训练其技术”时,侵犯了“无数人的凯发k8国际首页登录的版权和隐私。”

起诉书中称,openai从互联网上秘密抓取3000亿字词,窃听了“书籍、文章、网站和帖子,包括未经同意获得的个人信息”,违反了隐私法。其中就提到了openai爬取大量网络数据,包括社交媒体中的数据。

他们还指出openai有个专有ai语料库,积累了大量个人数据,包括从reddit帖子及其链接到网站中获取的数据。

这是训练模型方面的指控,此外,原告还称用户与openai的产品的互动、在产品中的私人信息,也都被openai非法访问、大规模盗用。

这已经不是openai*次在美国面临集体诉讼。去年11月,就有github程序员对github、openai和微软发起集体诉讼的事件,指控openai涉嫌违反开源许可,使用他们贡献的代码训练专有ai工具github copilot。

彼时chatgpt还没有上线,如今回头看,ai训练的问题那时就已经暴露。如今,最新的集体诉讼针对的是用户更为广泛、被侵犯人群也更加广泛(基本上就是全员受害)的chatgpt,更重要的是,在aigc的狂潮之下,任何法律先例都可能影响未来。

代理该案的克拉克森公益律师事务所(clarkson)在一封声明中,将这次的集体诉讼称作“里程碑式”的联邦案件,是对整个人工智能的警告。

从这个角度看,openai肩上的担子的确很重。

openai因数据抓取和隐私安全已经惹上诸多麻烦,平台上锁、用户翻脸都只是冰山一角。

在欧洲,openai已经遭到了多个国家的调查,甚至在今年4月,意大利担心chatgpt会违反欧洲数据保护法,暂时封禁过chatgpt。

针对整个人工智能领域的监管正在推进。法国于5月推出人工智能行动计划,其中在aigc方面,法国隐私监管机构特别关注一些ai模型从互联网上搜集数据、建立数据集,用来训练大语言模型的做法。

最重磅的是欧盟人工智能监管法案(eu ai act),目前已经走向收尾阶段。该法案将有可能成为全球ai治理的范本。   

03

平台、用户、监管,三股力量已经形成合围之势,誓要尽早给aigc立立规矩,并且要从大模型训练这个起点开始。

一方面,时间紧迫,aigc发展得太快。

马斯克说“估值高得离谱的ai初创公司”指的是谁,咱也不知道。但这话一出,中箭的确实不少,毕竟现在aigc领域融资一波接一波,全是热钱。

在初创公司里,openai估值近300亿美元,融资总规模113亿美元,是aigc里最有钱的;然后是anthropic,第二有钱,估值超过40亿美元。而前几天才以13亿美元融资震惊硅谷的inflection,估值也已经有40亿美元,而它成立不过一年多。

大的可能还在后头。inflection用的是自家的大语言模型,这次13亿美元到手,宣布要搞2.2万张英伟达h100芯片,做全球*的人工智能集群。如此大规模算力,目标参数量和数据集势必也是惊人的。

另一方面,chatgpt横空出世,等它暴露出问题时,想“修补”并不是那么容易。openai的几代大语言模型,gpt-2数据集有40gb文本,gpt-3(也就是chatgpt发布时用的模型)训练数据有570gb,至于今年才发布的gpt-4,数据集大小压根没透露。

海量的数据并没有从一开始就做好记录。谷歌前研究科学家尼西亚·桑巴斯万曾在采访中表示,科技公司不会记录它们是如何收集或注释ai训练数据的,甚至不知道数据集中到底有什么。

木已成舟的chatgpt就像一个黑匣子,而且是一个打造在密室里的黑匣子,如今要做透明化、隐私保护,比如罗列到底爬取了哪些数据、阐释使用过程中会如何使用这些数据、应用户要求删除某条数据,其实很难。

互联网冲浪人和监管死咬openai们,还有一个不容忽视的原因——在社媒发展壮大的那些年,对个人网络数据保护的意识还在襁褓中,待要抗衡时,发现已错过太远。

当扎克伯格2018年首次坐上国会听证席时,他的社交媒体平台facebook已经推出了14年。彼时facebook身陷“剑桥丑闻”,公司首席技术官称有8700万用户受影响。那也是一次因数据抓取酿成的大错。

等到今年5月阿尔特曼坐上美国国会听证席,议员频频表达着在社媒时代行动不足的悔恨,意思很明了:这一次,就算不能超前,也至少要跟上aigc的脚步。

一个接一个的大模型仍然在训练当中,数据抓取是一根线头,攥住它才有望理清aigc的糊涂账。

(0)
小多多的头像小多多创始人

相关推荐

  • 12月4日下午,合肥市瑶海区委书记陆勤山等领导一行莅临安徽谷器数据考察调研,受到安徽谷器数据总经理陈宇等公司领导热情接待。调研期间,陆勤山书记一行在总经理陈宇的陪同下参观了企业展厅,考察了公司运营,并听取了公司在数字化转型服务方面的汇报,了解了公司在生产经营、产品升级、技术创新上取得的系列成果。“

    创投 2023年12月11日
  • 江苏仑山湖,2024年11月底 — 在江苏仑山湖举行的ltw国际路亚(bass)大奖赛年度总决赛上,一款颠覆传统的电动路亚艇引起现场钓手广泛关注。在此次十几年来规模*、人数最多的赛事中,擎波探索(explomar)先锋打造高性能电动路亚艇,以新质生产力正式告别传统燃油机时代,响应国家绿水青山战略,

    2024年12月4日
  • 又是上海。日前,上海玫克生储能科技有限公司(简称“美克生能源”)宣布完成数亿元d轮融资。本轮融资由国家绿色发展基金领投,老股东君联资本跟投。而在2022年,美克生能源就连续完成5轮融资超10亿元,跻身独角兽企业行列。透过身后,一位女性身影出现——美克生能源董事长魏琼。2018年放弃编制,她与北大教授

    2024年3月23日
  • 旅游收入高的省份,要么就是经济发达,要么就是自然及历史遗产景点,而广东,作为常年身居“文旅直播间”的榜一大哥,给出的答案则是:我全都有。如果要为2023年评选一批卷王,各地文旅局一定在榜单上。淄博文旅局局长大街上卖完烤串,哈尔滨阿城区文旅局局长又开始在冰雪大世界热舞。忙活的还不只是局长们,当河北文旅

    2024年2月18日 创投
  • 8月15日,coach母公司tapestry公布2024财报:截至今年6月29日,集团净销售收入66.7亿美元,同比增长1%,毛利率由上一年的70.8%增至73.3%;其中coach销售额突破50亿美元,创历史新高,属于是拉动集团业绩增长的扛把子。图源:“华丽志”已经顶着“过气”风评走了好多年的ta

    2024年8月20日 创投
  • 长春高新做lp,投了君联资本,基金聚焦创新药及生物技术、医疗器械及诊断技术、专业服务及供应链,重点关注早期创新、供应链本土化、国际化方向的投资。

    创投 2023年6月28日
  • 回归消费本质的双11,再度让电商平台和商家们获得了增长。然而,前几年身处其中的电商代运营公司们,彻底沉寂了下来。品牌们强化电商运营能力,平台也有深化业务的需求,作为电商市场的中间环节,“卖水人们”只有被边缘化的命运。这是电子商务向成熟发展的必然趋势。毕竟,从一开始,电商解决的痛点就是干掉中间商。如今

    2024年11月11日
  • 猎牛座公募基金风云录,将从基金经理经验、任职期间回报、回撤控制能力、业绩稳定性、机构认可度五个维度,对现有公募基金产品进行梳理,力争为投资者筛选出那些真正值得长期持有的基金品种。 …

  • 社会保障体系是人民生活的安全网和社会运行的稳定器。建设多层次医疗保障体系是国家社会保障体系建设的一个既定目标。2020年2月,中共中央、国务院颁布《关于深化医疗保障制度改革的意见》(以下简称《意见》)明确提出“促进各类医疗保障互补衔接;加快发展商业健康保险,丰富健康保险产品供给。”在我国医疗保障体

    2023年12月14日
  • 最近,在“减肥神药”司美格鲁肽之后,一款新的降糖药“替尔泊肽”,逐渐吸引了大众的目光。据称这款新药的减重效果更好,有临床研究称该药72周平均减重48斤。过去两年中,司美格鲁肽非常火爆,它是马斯克减肥的秘密法宝,也被英国前首相约翰逊,以及众多明星、网红在各类社交媒体上“带货”,以至于被美国fda列为紧

    2024年7月1日 创投
  • 1000亿美金,openai将成硅谷史上融资最多公司,chatgpt的火热程度是顶级的,烧钱能力也是顶级。在巨额成本下,openai面临的另一个尴尬局面是收入太少,入不敷出。

    2023年5月10日
  • openai投资的自动驾驶公司,倒闭了。自动驾驶公司ghost,最近在k8体育官网发布了“最后通告”。通告很短,标题开门见山,表示公司业务将关停,接着ghost在正文自我表扬了一番,然后解释了关停的原因。成立6年来,ghost先后提出了三大k8体育的解决方案,每个方案都很与众不同,先后融资近15亿元,参投者包括ope

    2024年4月7日 创投
  • 可能相当部分的行业人士或者车主们往往会有这样的矛盾心理:一边为国内汽车行业的崛起充满自豪,一边担心车企的生存问题。过去几年,已经申请破产清算的车企并不少,包括威马汽车、‌拜腾汽车、‌天际汽车、‌爱驰汽车等。留在牌桌上的也并不好过。就拿蔚来、小鹏、零跑三家来说,根据其各自年报,2023财年分别亏损20

    2024年9月2日
  • 最近,被称为「余大嘴」的余承东再次开炮。这一次他的目标不是手机,而是汽车行业。近日,小鹏汽车董事长何小鹏被问及如何看待「问界新 m7 大定用户愿意为 aeb 功能买单?」时表示,「友商讲了 aeb,我认为 99% 是假的,它就是造假……我们的人也去问了,它的 aeb 根本不能开,路上误刹车的情况太多

    2023年11月7日
  • 近期,一则高达1亿美金的种子轮融资消息在行业里被刷屏,成为截至目前,今年医疗领域*一笔种子轮融资。众所周知,在创投行业,种子轮是创业公司获得的*笔重要资金,由于此时项目十分初创,平均融资额往往在数十万至数百万美金之间,鲜有企业能拿到数千万,甚至上亿美金。“如果一家刚运营的项目能拿到上亿的大额融资,一

    2023年11月11日 创投
网站地图