llvm · mshockwave · Aug 8, 2025 · Jul 24, 2025 · Jul 25, 2025 · Jul 25, 2025
@@ -2938,13 +2938,35 @@ struct BroadcastFolder : public OpRewritePattern<BroadcastOp> {
     return success();
   }
 };
+
+// Fold broadcast(shape_cast(x)) into broadcast(x) if x's type is compatible
+// with broadcast's result type.
+struct FoldBroadcastOfShapeCast : public OpRewritePattern<BroadcastOp> {
+  using OpRewritePattern::OpRewritePattern;
+
+  LogicalResult matchAndRewrite(BroadcastOp broadcastOp,
+                                PatternRewriter &rewriter) const override {
+    if (auto srcShapeCast =
+            broadcastOp.getSource().getDefiningOp<ShapeCastOp>()) {
+      VectorType srcType = srcShapeCast.getSourceVectorType();
+      VectorType destType = broadcastOp.getResultVectorType();
+      if (vector::isBroadcastableTo(srcType, destType) ==
+          BroadcastableToResult::Success) {
+        rewriter.replaceOpWithNewOp<BroadcastOp>(broadcastOp, destType,
+                                                 srcShapeCast.getSource());
+        return success();
+      }
+    }
+    return failure();
-    if (auto srcShapeCast =
-            broadcastOp.getSource().getDefiningOp<ShapeCastOp>()) {
-      VectorType srcType = srcShapeCast.getSourceVectorType();
-      VectorType destType = broadcastOp.getResultVectorType();
-      if (vector::isBroadcastableTo(srcType, destType) ==
-          BroadcastableToResult::Success) {
-        rewriter.replaceOpWithNewOp<BroadcastOp>(broadcastOp, destType,
-                                                 srcShapeCast.getSource());
-        return success();
-      }
-    }
-    return failure();
+    auto srcShapeCast =
+            broadcastOp.getSource().getDefiningOp<ShapeCastOp>();
+    if (!srcShapeCast) 
+      return failure();
+    
+    VectorType srcType = srcShapeCast.getSourceVectorType();
+    VectorType destType = broadcastOp.getResultVectorType();
+     if (vector::isBroadcastableTo(srcType, destType) !=
+          BroadcastableToResult::Success)
+          return failure();
+     
+     rewriter.replaceOpWithNewOp<BroadcastOp>(broadcastOp, destType,
+                                                 srcShapeCast.getSource());
+      return success();
-    if (auto srcShapeCast =
-            broadcastOp.getSource().getDefiningOp<ShapeCastOp>()) {
-      VectorType srcType = srcShapeCast.getSourceVectorType();
-      VectorType destType = broadcastOp.getResultVectorType();
-      if (vector::isBroadcastableTo(srcType, destType) ==
-          BroadcastableToResult::Success) {
-        rewriter.replaceOpWithNewOp<BroadcastOp>(broadcastOp, destType,
-                                                 srcShapeCast.getSource());
-        return success();
-      }
-    }
-    return failure();
+    auto srcShapeCast =
+            broadcastOp.getSource().getDefiningOp<ShapeCastOp>();
+    if (!srcShapeCast) 
+      return failure();
+    
+    VectorType srcType = srcShapeCast.getSourceVectorType();
+    VectorType destType = broadcastOp.getResultVectorType();
+     if (vector::isBroadcastableTo(srcType, destType) !=
+          BroadcastableToResult::Success)
+          return failure();
+     
+     rewriter.replaceOpWithNewOp<BroadcastOp>(broadcastOp, destType,
+                                                 srcShapeCast.getSource());
+      return success();
+  }
+};
 } // namespace
 
 void BroadcastOp::getCanonicalizationPatterns(RewritePatternSet &results,
                                               MLIRContext *context) {
   // BroadcastToShapeCast is not a default canonicalization, it is opt-in by
   // calling `populateCastAwayVectorLeadingOneDimPatterns`
-  results.add<BroadcastFolder>(context);
+  results.add<BroadcastFolder, FoldBroadcastOfShapeCast>(context);
 }
 
 //===----------------------------------------------------------------------===//

diff --git a/mlir/test/Dialect/Vector/canonicalize.mlir b/mlir/test/Dialect/Vector/canonicalize.mlir
@@ -1168,6 +1168,28 @@ func.func @canonicalize_broadcast_shapecast_both_possible(%arg0: vector<1xf32>)
 
 // -----
 
+// CHECK-LABEL: func @canonicalize_shapecast_broadcast_to_broadcast
+//   CHECK-NOT:   vector.shape_cast
+//       CHECK:   vector.broadcast {{.+}} : vector<2xf32> to vector<32x2xf32>
+func.func @canonicalize_shapecast_broadcast_to_broadcast(%arg0 : vector<2xf32>) -> vector<32x2xf32> {
+  %0 = vector.shape_cast %arg0 : vector<2xf32> to vector<1x2xf32>
+  %1 = vector.broadcast %0 : vector<1x2xf32> to vector<32x2xf32>
+  return %1 : vector<32x2xf32>
+}
+
+// -----
+
+// CHECK-LABEL: func @canonicalize_shapecast_broadcast_invalid_shape
+//       CHECK:   vector.shape_cast {{.+}} : vector<64xf32> to vector<4x16xf32
+//       CHECK:   vector.broadcast {{.+}} : vector<4x16xf32> to vector<2x4x16xf32>
+func.func @canonicalize_shapecast_broadcast_invalid_shape(%arg0 : vector<64xf32>) -> vector<2x4x16xf32> {
+  %0 = vector.shape_cast %arg0 : vector<64xf32> to vector<4x16xf32>
+  %1 = vector.broadcast %0 : vector<4x16xf32> to vector<2x4x16xf32>
+  return %1 : vector<2x4x16xf32>
+}
+
+// -----
+
 // CHECK-LABEL: fold_vector_transfer_masks
 func.func @fold_vector_transfer_masks(%A: memref<?x?xf32>) -> (vector<4x8xf32>, vector<4x[4]xf32>) {
   // CHECK: %[[C0:.+]] = arith.constant 0 : index