[benchmark_inference] Reshape the output from run_routed_experts (#2650)

kshitij12345 · web-flow · commit 750620bdc3e9 · 2025-10-15T14:35:33.000+02:00
diff --git a/thunder/benchmarks/layers_for_inference_benchmark.py b/thunder/benchmarks/layers_for_inference_benchmark.py
@@ -605,7 +605,7 @@ def run_routed_experts(self, hidden_states: torch.Tensor) -> tuple[torch.Tensor,
         token_ids_sorted_by_expert_inverse_id = torch.argsort(token_ids_sorted_by_expert_id)
         outs_sorted_by_token_id = outs_sorted_by_expert_id[token_ids_sorted_by_expert_inverse_id]
 
-        return outs_sorted_by_token_id, router_logits
+        return outs_sorted_by_token_id.view(batch_size, seq_len, -1), router_logits.view(batch_size, seq_len, -1)
 
     def forward(self, hidden_states: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
         outs_sorted_by_token_id, router_logits = self.run_routed_experts(hidden_states)