Minor fix

quic-amitraj · quic-amitraj · commit ef2cd47b1d98 · 2025-08-20T07:50:57.000Z
Signed-off-by: Amit Raj &lt;amitraj@qti.qualcomm.com&gt;
diff --git a/QEfficient/transformers/models/t5/modeling_t5.py b/QEfficient/transformers/models/t5/modeling_t5.py
@@ -177,7 +177,7 @@ def forward(
             output_attentions=output_attentions,
             cache_position=cache_position,
         )
-        hidden_states = hidden_states * self.scaling_factor + self.dropout(attention_output[0])  # Modified by patch
+        hidden_states = hidden_states * 1.0 + self.dropout(attention_output[0])  # Modified by patch
         outputs = (hidden_states,) + attention_output[1:]  # add attentions if we output them
         return outputs
 

Original file line number	Diff line number	Diff line change
`@@ -177,7 +177,7 @@ def forward(`
`177`	`177`	`output_attentions=output_attentions,`
`178`	`178`	`cache_position=cache_position,`
`179`	`179`	`)`
`180`		`- hidden_states = hidden_states * self.scaling_factor + self.dropout(attention_output[0]) # Modified by patch`
	`180`	`+ hidden_states = hidden_states * 1.0 + self.dropout(attention_output[0]) # Modified by patch`
`181`	`181`	`outputs = (hidden_states,) + attention_output[1:] # add attentions if we output them`
`182`	`182`	`return outputs`
`183`	`183`