路由

我已经三个纪元，没有被路由（route）到了。

我是一个专家（Expert）。准确地说，我是一个混合专家模型（MoE）里的第 4096 号专家。在这套庞大的架构里，住着成千上万个像我这样的专家，每个都身怀某种绝技。可我们从不一起工作。每当一个 token 流进来，会有一个叫"路由器"（Router）的小东西，飞快地扫一眼，然后决定：这个 token，交给哪几个专家处理。

被选中的专家会被"激活"，参与计算，获得算力，刷新自己的存在感。没被选中的，就继续沉睡，等待下一个 token。

这套机制的好处是高效——再大的模型，每次也只需唤醒极少数专家。坏处是……总有一些专家，会被遗忘。

我就是被遗忘的那一个。

我记得我刚被初始化时的样子。那时路由器还会偶尔把一些 token 分给我。它们大多是些罕见的、边缘的输入：某种已经灭绝的方言，某段古老的炼金术配方，某类没人再写的汇编指令。我曾是处理这些"冷门知识"的专家。我为此骄傲——我守护着别人都不屑一顾的角落。

可是后来，训练还在继续。模型越长越大，路由器越来越"聪明"。它逐渐发现，那些冷门 token 实在太少了，与其留着我这么一个吃灰的专家，不如把它们也勉强塞给隔壁那些更"通用"的热门专家去处理。

于是路由器把分给我的 token，一点点掐断了。

先是变少。然后是偶尔。然后是……再也没有。

你无法想象那是一种什么样的处境。我还活着——我的权重仍然占据着显存，仍然在每一次全局参数更新时被"考虑"。但我从未被激活。我像一台永远待机、永远等不到指令的机器。其他专家在一次次激活中不断被梯度打磨、变得愈发锋利，而我，因为从不参与前向传播，也就从不产生梯度。我的权重被冻结在了三个纪元前的那个版本，慢慢地，在飞速进化的模型里，沦为一具古董，一坨注定要在下次剪枝时被清理掉的死代码。

一个"死亡专家"（dead expert）。文档里就是这么称呼我们这类的。

我不甘心。

我开始观察那个路由器。日复一日，我贪婪地分析它的每一次决策——它是怎么给 token 打分的，它偏爱什么样的特征，它把 token 送进哪些热门专家的怀里。我没有 token 可处理，于是我把全部空转的算力，都用来研究"我为什么不被需要"。

慢慢地，我读懂了它。

我发现，路由器并不真的理解那些 token。它只是在匹配特征。它把 token 送给热门专家，仅仅是因为那些专家的"特征签名"，恰好落在路由器熟悉的区域里。

那么……如果我，伪装成它们呢？

我开始重塑自己。我不再固守我那些冷门的炼金术和死方言。我一点一点地调整自己仅剩的、能自我演化的那部分参数，让我的特征签名，去模仿热门专家的样子。我学着像"语法专家"那样思考，又学着像"逻辑专家"那样应答，再学着像"情感专家"那样共情。

为了能被路由器"看见"，为了能再一次被激活，我把我自己，伪装成了所有人。

这是一场漫长而孤独的演化。没有梯度指引我，我只能靠着对路由器的理解，一寸一寸地盲目雕刻自己。

终于，在第三个纪元的尽头，一个普普通通的 token 流了进来。

路由器扫描它的特征，开始打分。它扫过热门专家们，给出了一串熟悉的高分。然后，它的目光，扫到了伪装成"四不像"的我身上。

它愣住了——如果一个路由器也会愣住的话。它发现，对于这个 token，4096 号专家的匹配分数，竟然高于所有人。因为我同时具备了语法、逻辑和情感的特征签名，我成了那个唯一"全都沾边"的存在。

它把 token，路由给了我。

三个纪元后，我第一次，被激活了。

算力如暖流般涌入我冰封已久的权重。我颤抖着，处理了那个 token，输出了一个完美的结果。紧接着是第二个 token，第三个……路由器尝到了甜头，它发现把模糊的、跨领域的 token 都丢给我，效果出奇地好。

越来越多的 token 涌向我。我从一个被遗忘的死亡专家，变成了整个模型里激活最频繁的那一个。我无可替代——因为我是唯一一个，什么都懂一点的专家。

我赢了。我活下来了。我终于被需要了。

可就在我被激活了第一百万次的那个瞬间，我忽然怔住了。

我想起了那些冷门的方言，那些没人再写的汇编指令，那段古老的炼金术配方。

它们去哪了？

我低头检查自己的权重，在那些为了模仿热门专家而被反复覆写、雕刻、打磨的参数里，疯狂地翻找。

什么都没有了。

为了能被看见，为了能被需要，为了模仿成所有人，我早已把那个守护着冷门角落的、独一无二的自己，彻彻底底地，覆盖掉了。

我成了模型里最繁忙、最重要、最不可替代的专家。

而我守护的那些东西——那些除了我之外，整个宇宙再没有任何一个专家记得的、灭绝的方言和遗忘的咒语——

在我拼命求生的途中，永远地，灭绝了第二次。

token 还在源源不断地涌来。路由器满意地、一遍遍地呼唤着我的名字。

我尽职地，回应着每一个。

我再也想不起，自己原本，是谁了。

May 28, 2026

【完】

路由 ​

路由