quic
diff --git a/‎QEfficient/diffusers/models/attention.py
Lines changed: 0 additions & 1 deletion b/‎QEfficient/diffusers/models/attention.py
Lines changed: 0 additions & 1 deletion
diff --git a/‎QEfficient/diffusers/models/attention_processor.py
Lines changed: 0 additions & 2 deletions b/‎QEfficient/diffusers/models/attention_processor.py
Lines changed: 0 additions & 2 deletions
diff --git a/‎QEfficient/diffusers/models/autoencoders/autoencoder_kl.py
Lines changed: 0 additions & 1 deletion b/‎QEfficient/diffusers/models/autoencoders/autoencoder_kl.py
Lines changed: 0 additions & 1 deletion
diff --git a/‎QEfficient/diffusers/models/pytorch_transforms.py
Lines changed: 7 additions & 2 deletions b/‎QEfficient/diffusers/models/pytorch_transforms.py
Lines changed: 7 additions & 2 deletions
diff --git a/‎QEfficient/diffusers/pipelines/stable_diffusion/pipeline_stable_diffusion.py
Lines changed: 1 addition & 1 deletion b/‎QEfficient/diffusers/pipelines/stable_diffusion/pipeline_stable_diffusion.py
Lines changed: 1 addition & 1 deletion
@@ -6,7 +6,6 @@
 # ----------------------------------------------------------------------------
 
 import torch
-
 from diffusers.models.attention import JointTransformerBlock, _chunked_feed_forward
 
 
 
@@ -8,7 +8,6 @@
 from typing import Optional
 
 import torch
-
 from diffusers.models.attention_processor import Attention, JointAttnProcessor2_0
 
 
@@ -123,7 +122,6 @@ def __call__(
             hidden_states = torch.bmm(attention_probs, value)
         else:  # self-attention, use blocked attention
             # QKV done with block-attention (a la FlashAttentionV2)
-            print(f"{query.shape = }, {key.shape = }, {value.shape = }")
             query_block_size = self.query_block_size
             query_seq_len = query.size(-2)
             num_blocks = (query_seq_len + query_block_size - 1) // query_block_size
 
@@ -6,7 +6,6 @@
 # ----------------------------------------------------------------------------
 
 import torch
-
 from diffusers import AutoencoderKL
 
 
 
@@ -6,11 +6,11 @@
 # -----------------------------------------------------------------------------
 from typing import Tuple
 
-from torch import nn
-
 from diffusers.models.attention import JointTransformerBlock
 from diffusers.models.attention_processor import Attention, JointAttnProcessor2_0
 from diffusers.models.normalization import RMSNorm
+from torch import nn
+
 from QEfficient.base.pytorch_transforms import ModuleMappingTransform
 from QEfficient.customop.rms_norm import CustomRMSNormAIC
 from QEfficient.diffusers.models.attention import QEffJointTransformerBlock
@@ -23,6 +23,11 @@
 class CustomOpsTransform(ModuleMappingTransform):
     _module_mapping = {RMSNorm: CustomRMSNormAIC}
 
+    @classmethod
+    def apply(cls, model: nn.Module) -> Tuple[nn.Module, bool]:
+        model, transformed = super().apply(model)
+        return model, transformed
+
 
 class AttentionTransform(ModuleMappingTransform):
     _module_mapping = {
 
@@ -10,9 +10,9 @@
 
 import numpy as np
 import torch
-
 from diffusers import StableDiffusionPipeline
 from diffusers.image_processor import VaeImageProcessor
+
 from QEfficient.diffusers.pipelines.pipeline_utils import QEffSafetyChecker, QEffTextEncoder, QEffUNet, QEffVAE
 from QEfficient.generation.cloud_infer import QAICInferenceSession
 from QEfficient.utils import constants