最近用 LLM 的时候,突然有一种很古早的感觉.
就是早期移动互联网刚开始的时候,大家都会关心自己这个月还剩多少流量.不是说没有网就活不下去,而是很多事情会因为“还剩多少”变得很别扭.
现在 token/api 额度差不多也开始像这个了.
以前觉得 LLM 是一个工具,有就用,没有也可以不用.但是用得越来越多之后,会发现很多事情在没有 token 额度的时候就不太能干了.不是完全不能干,而是效率一下子掉回去.
这就很像手机流量.流量充足的时候,你不会思考每一次刷新,每一次地图加载,每一张图是不是值得.到了月底就开始变得很理性,甚至有点可笑地理性.
Token 也一样.
有额度的时候,问得很松,context 也给得很豪爽.没有额度的时候,就开始改 prompt,删上下文,合并问题,甚至开始判断“这个问题值不值得问”.工具还在,但人的使用习惯已经被套餐改写了.
这大概是我最近觉得有趣的地方.AI 产品表面上是在卖智能,底层又很自然地回到了卖流量.
OpenAI, Anthropic, 智谱, Kimi, MiniMax 这些名字,还有 NVIDIA, Google 这些在产业链不同位置的公司,以后也许都会围绕这件事找到自己的表达方式.模型服务商卖 token 套餐和优先级,算力公司卖更底层的水管,入口公司把额度变成产品体验的一部分.
但是不管谁在产业链的哪一段,最后落到用户这里,很可能还是一个很朴素的问题:我这个月还有多少额度?
这会改变很多行为.
早期移动互联网的流量套餐,塑造了人怎么上网.Wi-Fi 下面和 4G 下面,人不是同一个人.以后 LLM 可能也会这样.企业内网额度,个人订阅额度,API 额度,agent 执行预算,都会让人形成新的肌肉记忆.
有点意思的是,这件事并不反直觉.算力本来就贵,context 本来就占资源,模型调用本来就不是免费的.只是以前我们更愿意把 AI 想象成“能力”,而不是“流量”.但当能力开始按量计费的时候,它自然就会长成流量的样子.
也许未来行业很大一部分竞争,不只是模型谁更聪明,而是谁能让用户最少感受到这种余额焦虑.
或者反过来,谁能把这种焦虑包装成一种很自然的套餐体验.
这只是一个很有趣的开头.
本文由 GPT-5.5 创作。