
新智元报说念
剪辑:元宇
【新智元导读】Meta里面搞了个AI用量排名榜「Claudeonomics」,8.5万职工拼耗尽、冲段位、抢「Token神话」称呼。有东说念主一个月烧掉200万好意思元,有东说念主写外挂冲榜,有东说念主挂着Agent休眠也在跑——硅谷卷Token,还是卷到走火入魔了。
一个东说念主,30天,烧掉3285亿token!
按Anthropic公开订价粗算,这些烧掉的算力本钱接近200万好意思元。
4月初,The Information记者Jyoti Mann在X上初次曝光Meta里面「Claudeonomics」排名榜,30天全公司token总耗尽超60万亿。
伸开剩余93%这些荒诞的数字,来自Meta里面一个名叫「Claudeonomics」排名榜的比赛,8.5万东说念主参与的烧token大赛,只展示前250名。
从铜牌、银牌、金牌、铂金、翡翠,沿途升到「不朽会话」(Session Immortal),再到最高荣誉「Token神话」(Token Legend)。
没错,烧token齐烧出段位来了。
这笔账到底有多大?The Information特意作念了一个缠绵器来拆解:
The Information报说念中附带的交互式token本钱估算器,按Claude Opus 4.6占86%的模子配比、70%缓存射中率估算,1万亿token表面本钱约550万好意思元。
天然,这仅仅按公开价的估算,但数据量级自己还是实足炸裂。
要是放到所有这个词这个词Meta来看,这个数字更恐怖:最近一个月token总耗尽约60.2万亿。
这是什么主意?
The Information作念了一个估算:好意思国国会藏书楼全部藏书折算约2.66万亿token,Meta的Llama 3实践数据是15万亿token,东说念主类历史上所有这个词出书竹素加起来估算约20万亿token。
Meta职工30天烧掉的token量,是东说念主类全部出书物的3倍!
这还仅仅初始。一周之后,这个数笔据报说念跳到了73.7万亿。
音问传开后,业内盛名技能博主Gergely Orosz在X上言不虚发地驳倒:
Token用量还是是Meta绩效评估的一部分。奢睿东说念主在刷他们以为携带念念看的贪图,就这样浅近。
这还是不是某个工程师在用AI写代码的故事了,而演变成一场超大边界AI耗尽竞赛游戏:
隐敝数万东说念主,有排名、有称呼、有荣誉体系。
曝光后两天
排名榜就解除了
The Information的报说念发出后,Meta里面炸开了锅。
有职工在里面磋磨区写说念:
我提倡全球算算这背后的动力耗尽。要不是竟然在发生,我会以为是个见笑。
到了周三,排名榜从Meta内网解除了。
Meta发言东说念主对外的说法是:排名榜是由创建者自行撤下的,不是公司下令。
公司强调,职工评估看的是「骨子录用影响」,不主张把个东说念主token数据作为评估绩效的主要形式。
但Meta发出的信号是矛盾的。
据The Information报说念,Meta里面一个名为Checkpoint的AI驱动绩效跟踪系统,确乎将token使用量列为数据点之一。
排名榜天然撤了,但公司官方的AI Insights式样盘仍然对所有这个词职工绽放,你随时不错检察我方和团队的token耗尽。
Meta发言东说念主线路,AI Insights式样盘的主见是匡助公司了解各组织若何向AI原生的责任形式转型,它提供的瞻念察不仅仅token用量,还包括代码关连贪图和其他维度。
天然,PC加拿大(中国)官方网站Meta停掉了排名榜,嘴上说不以token论英豪,但排名榜的逻辑仍然存在,这让不少职工感受到公司开释出的信号并不完全一致。
「代码行数」
披上token新衣
这个排名榜天然只存在了几天,但它还是催生出了一套「刷分」操作。
据The Information征引匿名职工形容,一些Meta工程师念念出了各式办法来推广我方的AI使用贪图。
比如,一些工程师会让AI Agent 生成广泛微细改变,这些改变对功能匡助有限,但每次仍会造成一次commit,从而举高其AI使用贪图。
量上去了,排名天然顺眼。
还有东说念主缔造了转录机器东说念主,挂在会议里自动作念记载。
有的东说念主致使特意饱读吹共事来用我方缔造的转录用具,因为只消别东说念主通过你的用具跑token,耗尽量就算在你头上。
雷同的事不单发生在Meta。
亚马逊电商部门前年也出现过一个案例。
一位司理默示团队应该更多使用AI编程用具Cline。于是团队里有东说念主平直改了代码,让每次和Cline的对话看起来耗尽了10倍的token。
这个团队的AI使用排名赶快冲到了分部前哨。
不外到本年年头,亚马逊改革了系统,这个「舞弊码」失效了。
这些故事看起来有些豪恣,但熟练软件行业历史的东说念主一定不生疏。
Box CEO Aaron Levie直言:这让他念念起了AI出现之前,行业里围绕「用代码行数揣测环节员产出」的那些老争论。
代码行数曾经经被行动坐褥力贪图。
成果工程师们学会了把一瞥能写完的逻辑拆成十行:贪图涨了,产出没变,致使更差了。
当今,白金会(PlatinumGaming)官方网站相同的故事仅仅换了个计量单元:代码行数变成了token数。刷行数变成了刷commit、挂转录机器东说念主、改系统让数字翻10倍。
贪图可量化,又和绩效沾边,就一定可能会「玩坏」。
据The Information报说念,有Meta职工暗里承认,那些token用量低的东说念主,偶而分会张惶我方看起来「不够AI native」。
同期这位职工也以为,高token用量不应该成为一种身份象征,因为它并不是坐褥力的好贪图。
不卷token的公司
若何玩?
既然刷token排名的逻辑粗疏这样彰着,有莫得企业取舍另外一条路?
法律讲解装备的公司Axon取舍了把AI激发绑定在业务录用上,而不是耗尽量上。
他们的作念法是团队要是诓骗AI用具逾额完成年度门道图标的15%以上,就能拿到现款奖金。
Axon总裁Josh Isner涌现,本年公司各团队集体的门道图逾额幅度正在跟踪到30%掌握,主要归功于Claude Code和Cursor的使用。
展望本年在AI编程用具上的支拨将达到「数千万好意思元」级别。
Isner以为,当你引入「尽量多用这个用具咱们就付钱」这种侦查的时分,风险越来越大:
你若何知说念你获取的是你念念要的成果,概况说,到底有莫得任何成果?
Aaron Levie并不饱读吹tokenmaxxing,也不以为它会在硅谷除外的大公司里宽泛流行。
不外他也线路,我方聚拢这种冲动,因为现时阶段需要先让工程师充分试用这些用具。
他选了另一种形式:既然AI能让团队更高效,那就把居品标的定得更高。职工能不成完成这些加码后的标的,平直影响薪酬。
但Levie也莫得一刀切地狡赖token耗尽。他以为应该容忍一定进度的token「忽地」,因为那意味着团队在尝试新东西:
硅谷当今正处于这样一个阶段,你得让工程师去试这些用具。
Levie闲适为试错买单,但不肯意把「谁烧得最多」变成一种排名机制。
Axon和Box代表了一种不雅点:token仅仅弹药,你用了几许不繁重,你使用它作念出了什么才繁重。
当油表被当成速率表
Meta的排名榜被撤了,但背后催生它的那股力量依然广宽:
硅谷高管们集体把「多烧token」等同于「高坐褥力」的叙事极少也莫得削弱。
英伟达CEO黄仁勋
英伟达CEO黄仁勋就曾在All-In Podcast上说过一句被宽泛援用的话:
要是一个年薪50万好意思元的工程师,连至少25万好意思元的token齐没用掉,他会「高度警惕」。
他致使设念念了一个将来:Token会成为招聘时的标配福利,就像牙科保障和免费午餐一样。工程师口试时会问:「这份责任给我配几许token?」
Meta CTO Andrew Bosworth在本年2月的一次科技会议上提到,要是一个顶级工程师花掉很是于我方年薪的token本钱,却能把坐褥力擢升到10倍,这笔钱就好比「白送的钱」,应该不绝投,致使不必设上限。
前OpenAI和特斯拉AI科学家Andrej Karpathy则是再造新词:token耗尽量俨然成了AI期间个东说念主能力的新标尺:
你的token蒙胧量是几许?你能指令几许token蒙胧量(Token throughput)?
当行业大佬齐在说「多烧token即是高坐褥力」,全球听到的信号唯有一个:不烧即是过期,这种FOMO(Fear of Missing Out,错失畏怯)会赶快从「我要不要多用极少AI」变成「我敢不敢毋庸」。
莫得东说念主念念成为团队里阿谁token用量垫底的东说念主,而排名榜仅仅把这种张惶变成了一场公开竞赛。
但问题偶合在这里。
Token耗尽量之是以被追捧,是因为它是咫尺最容易量化的AI使用贪图。
你很难揣测一个工程师「用AI之后录用质料擢升了几许」,但你不错精准地看到他烧了几许token,就它和「代码行数」一样。
但容易量化,不等于值得量化。
代码行数对应的是写代码的动作,并不代表软件质料;Token耗尽量揣测的是API调用次数,不等于工程产出。
这就好比油表能告诉你烧了几许油,但它不代表速率和里程。
而AI Agent期间,只会让这个问题更泼辣。
NYT近期的报说念形容了一种新模样:
工程师同期开十几个窗口,放出几十个Agent并行跑任务,有些Agent系统被遐想成24/7不终止运行,在东说念主类休眠的时分还在执续耗尽token。
一个全职Agent一周不错跑掉7亿个token。
当token耗尽不错脱离东说念主类干豫自动增长的时分,拿耗尽量来揣测东说念主的坐褥力,就愈加造作了。
天然,Meta的Claudeonomics排名榜还是下线,但它折射出一个东说念主类在技能采选上的「经典悖论」:
当一个用具的使用量不错被精准计量、不错被公开排名、不错和绩效感知挂钩,它就势必从用具变成饰演。
代码行数是这样,commit次数是这样,专利肯求数、论文援用量、OKR完成率,透顶是这样。
每一个曾被行动坐褥力代理贪图的数字,最终齐催生出了一套刷分产业。
当今轮到了token。
下一个被异化的贪图会是什么?
也许是Agent的并发数目,也许是AI生成代码的归并率,也许是某种咱们今天还念念象不到的新数字。
只消企业还分不清「饱读吹用AI」和「侦查AI带来的委果产出」,雷同的刷榜游戏就不会停。
参考贵府:
https://www.theinformation.com/articles/tokenmaxxing-tide-may-turning?rc=epv9gi白金会app
发布于:北京市江南体育(JNsports)官网app下载
