得有个假期,不用盯着 K 线,不用刷消息,老哥几个约好去吃一顿横县鱼生。
横县这个地方,放在地图上不起眼,搁在吃货版图里却是另一回事。郁江从这里穿过,水急流清,养出来的青竹鱼肌肉格外发达,尾巴天天在急流里摇,等于每天做 CrossFit,肉质自然紧实。当地人对这条鱼的评价叫"种、劲、白、薄、厚、鲜",六个字,没有废话,跟写代码一样,能不用形容词就不用。
菜上桌,是一个大盘子,正中间放一圈莹白的鱼片,四周是配料:红萝卜丝、紫苏、薄荷、柠檬叶、炒花生、酸荞头……颜色五颜六色,像一个用食材拼的 UI 界面,每个格子都不空,信息密度极高。血蛤跟着上来,鸡肾鱼蛋跟着上来,鳝鱼也跟着上来。老哥几个围着桌子,难得安静了整整三秒——这在一群互联网金融老炮里,已经是极高的礼遇了。
夹起一片鱼生,裹上一把紫苏、柠檬叶、薄荷,蘸花生油,入口的瞬间,酸甜辣鲜同时涌来,味蕾接受了一次并发量极高的请求,而且没有任何一个 timeout。横县人管这叫"毕食",吃法简单,但搭配讲究。郁江野生的鱼,鱼片薄可见字,厨师一刀斜切,片羽滑落,据说上品是铺在报纸上能看清字,下品是看不清——这个 KPI 比很多公司的 OKR 都要清晰。
正吃着,旁边那位哥们忽然放下筷子,掏出手机开始算账。不是账单,他在算 token。
"你们知道咱这桌菜,折合成 AI 的 context window 是多少吗?"
没人搭腔,他自顾自往下算。血蛤这道菜,他说,每颗蛤打开来里面有一滩血汁,这个 visual token 就不低,算它 500 个;鱼片整盘铺开,花纹纹理清晰,图像 token 再算 800;配料三十多种,每一种都是独立的 feature,这叫 high-dimensional input,折进去又是一大块。还有鳝鱼,他说,鳝鱼这东西形状复杂,encoder 理解起来不容易,token 系数得上浮 20%。
在座的都是见过世面的人,从 ICO 的泡沫一路走到大模型的热浪,什么风口没经历过。但这种把鱼生换算成 token 的思路,还是让大家愣了一下。
有人问他算出来多少。他举起手机,屏幕上是一张密密麻麻的表格,最下面一行是汇总:约 3700 万 token。
按现在主流大模型的定价,这顿饭如果用 API 调用来付,大概要几万块美元。但实际上我们这顿人均不超过两百块人民币,还包了两瓶米酒。
桌上有人补了一句:"所以横县鱼生是目前性价比最高的 multimodal 数据集。"
全桌哄笑。
这话其实没说错。横县鱼生的配置本来就是一个极其复杂的系统:三十多种配料,每种切法不同,口感不同,组合方式千变万化,不同人夹起来的比例全不一样。这种非标准化、高度个性化的 input,放进任何一个 LLM 里都是挑战。但吃起来每个人都觉得对,都觉得鲜,都觉得这口下去值。这叫什么——这叫用户体验好,hallucination 为零。
横县鱼生的历史可以追溯到几千年前,郁江两岸的渔民本来就是不便生火才生吃,没想到这种"无奈之举"到后来成了非遗,进了广西十大经典名菜,日本料理师傅慕名来看了,也说了句"这才是真正的鱼生"。
某种意义上,这道菜走的路跟互联网产品很像:从草根需求出发,靠极致的 core feature 活下来,中间扛住了一轮轮的质疑和跟风者,最后成了品类标准。
吃到最后,鱼头和鱼骨被拿去熬了汤,加香菜姜葱芋头,端上来。一桌子人喝汤,话少了下来,都在用舌头处理剩余的信息量。
窗外天已经黑了,没人提起行情,没人聊下一个风口。
那位算 token 的哥们最后说了一句:"这顿不亏,数据质量高。"