be careful of teh routed_scaling_factor

wenscarl · wenscarl · commit 502d4ee624d3 · 2025-07-24T20:37:26.000Z
diff --git a/vllm/model_executor/models/deepseek_v2.py b/vllm/model_executor/models/deepseek_v2.py
@@ -186,7 +186,7 @@ def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
         if hidden_states.dtype != torch.float16:
             final_hidden_states = self.experts(
                 hidden_states=hidden_states,
-                router_logits=router_logits) * self.routed_scaling_factor
+                router_logits=router_logits)# * self.routed_scaling_factor
         else:
             # Fix FP16 overflow
             # See DeepseekV2DecoderLayer for more details.