AI-Hypercomputer · aman2930 · Oct 29, 2025 · Oct 30, 2025 · Oct 30, 2025 · Oct 30, 2025
diff --git a/configs/gemm_grouped_inference.yaml b/configs/gemm_grouped_inference.yaml
@@ -0,0 +1,9 @@
+benchmarks:
+- benchmark_name: "gemm_batched_simple"
+  trace_dir: "../microbenchmarks/gemm_batched_simple_inference"
+  csv_path: "../microbenchmarks/gemm_batched_simple_inference"
+  xlml_metrics_dir: "../microbenchmarks/gemm_batched_simple_inference"
+  num_runs: 1000
+  benchmark_sweep_params:
+  - {b: {start: 4, end: 256, multiplier: 2}, m: {start: 256, end: 2048, multiplier: 2}, k: {start: 256, end: 2048, multiplier: 2}, n: {start: 256, end: 2048, multiplier: 2}, in_dtype_str: "bf16", out_dtype_str: "bf16"}
+  - {b: {start: 4, end: 256, multiplier: 2}, m: {start: 256, end: 2048, multiplier: 2}, k: {start: 256, end: 2048, multiplier: 2}, n: {start: 256, end: 2048, multiplier: 2}, in_dtype_str: "fp8", out_dtype_str: "bf16"}
diff --git a/configs/gemm_grouped_rescale_inference.yaml b/configs/gemm_grouped_rescale_inference.yaml
@@ -0,0 +1,8 @@
+benchmarks:
+- benchmark_name: "gemm_batched"
+  trace_dir: "../microbenchmarks/gemm_batched_rescale_inference"
+  csv_path: "../microbenchmarks/gemm_batched_rescale_inference"
+  xlml_metrics_dir: "../microbenchmarks/gemm_batched_rescale_inference"
+  num_runs: 1000
+  benchmark_sweep_params:
+  - {b: {start: 4, end: 256, multiplier: 2}, m: {start: 56, end: 2048, multiplier: 2}, k: {start: 256, end: 2048, multiplier: 2}, n: {start: 256, end: 2048, multiplier: 2}, in_dtype_str: "fp8", out_dtype_str: "bf16"}
diff --git a/configs/gemm_rescale_inference.yaml b/configs/gemm_rescale_inference.yaml
@@ -0,0 +1,8 @@
+benchmarks:
+- benchmark_name: "gemm"
+  trace_dir: "../microbenchmarks/gemm_rescale_inference"
+  csv_path: "../microbenchmarks/gemm_rescale_inference"
+  xlml_metrics_dir: "../microbenchmarks/gemm_rescale_inference"
+  num_runs: 1000
+  benchmark_sweep_params:
+  - {m: {start: 512, end: 65536, multiplier: 2}, k: {start: 512, end: 65536, multiplier: 2}, n: {start: 512, end: 65536, multiplier: 2}}
diff --git a/configs/gemm_simple_inference.yaml b/configs/gemm_simple_inference.yaml
@@ -0,0 +1,9 @@
+benchmarks:
+- benchmark_name: "gemm_simple"
+  trace_dir: "../microbenchmarks/gemm_simple_inference"
+  csv_path: "../microbenchmarks/gemm_simple_inference"
+  xlml_metrics_dir: "../microbenchmarks/gemm_simple_inference"
+  num_runs: 1000
+  benchmark_sweep_params:
+  - {m: {start: 512, end: 65536, multiplier: 2}, k: {start: 512, end: 65536, multiplier: 2}, n: {start: 512, end: 65536, multiplier: 2}, in_dtype_str: "bf16", out_dtype_str: "bf16"}
+  - {m: {start: 512, end: 65536, multiplier: 2}, k: {start: 512, end: 65536, multiplier: 2}, n: {start: 512, end: 65536, multiplier: 2}, in_dtype_str: "fp8", out_dtype_str: "bf16"}