pytorch · sekyondaMeta · Jul 30, 2025 · Jul 14, 2025 · Jul 14, 2025 · Jul 14, 2025
diff --git a/intermediate_source/per_sample_grads.py b/intermediate_source/per_sample_grads.py
@@ -169,7 +169,7 @@ def compute_loss(params, buffers, sample, target):
 # results of hand processing each one individually:
 
 for per_sample_grad, ft_per_sample_grad in zip(per_sample_grads, ft_per_sample_grads.values()):
-    assert torch.allclose(per_sample_grad, ft_per_sample_grad, atol=3e-3, rtol=1e-5)
+    assert torch.allclose(per_sample_grad, ft_per_sample_grad, atol=1.2e-1, rtol=1e-5)
 
 ######################################################################
 # A quick note: there are limitations around what types of functions can be