动词是山峰,名词是平原
小模型认知机制的核心在于语义空间的"分辨率"差异。对于参数规模有限的模型,动词优先于名词,因为动词能在语义空间中形成高耸的"山峰",而名词只是平坦的"浅滩"。将语义空间想象为地形图,动词如read、delete作为动作的引擎,在预训练中与海量代码和指令强关联,语义信号极为强烈,能使模型的注意力精准锚定方向;名词如file、data作为实体,本身不包含方向性,在低分辨率下模型看到的只是一片语义平原,难以判断如何处理它。这种"分辨率不足"对应到注意力权重的分配精度和激活强度:动词优先时注意力锚点明确,模型第一眼锁定动作,形成陡峭的语义势差,强制向执行轨迹滑行,否定处理也更易识别;名词优先时信号稀释,模型需在平原上寻找动词,极易产生幻觉,且Few-shot学习效率远低于动词优先的模式。
从入度-出度和"概念是关系的交汇点"的图论视角审视,这种差异更加深刻。在语义网络中,名词如file的入度极高,被数十个动词指向,是汇聚型节点,但出度低,自身很少主动关联其他概念;动词如read的入度低,出度却高,强烈指向宾语、状语等,是分发型节点。面对高入度的名词,模型相当于站在多岔路口,注意力被数十条候选方向平均摊薄,形成平坦地形;高出度的动词相当于单向坡道,方向天然向下,注意力无需选择便能沿最强边滑行,形成高耸地形。名词作为"关系的交汇点",恰恰因为汇聚了所有可能方向而导致语义熵增,选择困难,注意力分散;动词则因方向性一致、分布集中,与用户意图直接对齐,形成强方向性势场,从而高效集中注意力。
进一步而言,动词优先策略本质上是在为小模型构造一个"源点主导的树型子图",绕过名词作为高介数中心性节点所需的复杂工作记忆。图论中,名词通常担任理解层与操作层之间的桥梁,具有高介数中心性,需要维护多路径的上下文状态,这对1.5B级模型的容量构成严峻挑战;动词优先则让模型直接从源点出发,跳过枢纽,通过语法约束直接连接目标。理想的原语应具备高出度与入度的比值,且出度约束极强——例如read_file这样的复合词将动词的出度锁定为1,仅指向文件,同时入度也被锁定,形成伪装的出度为1的源点。相反,file_read或file_前缀将动词重新名词化,使汇点效应重现,应当避免;而诸如get_file虽保持源点特性,但"do"类泛动词约束较弱,最优选择仍是具体动词加具体名词的组合。
综上,小模型的认知地形本质上是语义有向图的低分辨率投影。名词作为高入度汇点,投影后坍缩为平坦的语义平原;动词作为高出度源点,投影后保持为高耸的语义山峰。Prompt工程的核心策略并非让模型"理解概念",而是让模型找到语义网络中出度最高、方向最明确的节点作为锚点,拒绝让模型在平原上寻找路径,而是为它指定一座山峰,使其只能沿山脊下滑——下滑的终点,便是答案。这一原则可正式化为:小模型的命名设计应优先选择语义网络中出度与入度比值最大的词作为位置锚点,由于动词的比值通常远高于名词,因此verb_noun的命名规范不仅是语法习惯,更是利用模型有限分辨率将关键动作意图信号无损放大、锚定在注意力最敏感起始位置的核心工程手段。