Remove @slow for test_eager_matches_sdpa_inference (#34558)

* update * update * update * update * update * update * update * update * update * update * update --------- Co-authored-by: ydshieh <ydshieh@users.noreply.github.com>
2024-11-05 16:10:42 +01:00
parent 082e57e0d4
commit f2d5dfbab2
21 changed files with 271 additions and 626 deletions
--- a/tests/models/granitemoe/test_modeling_granitemoe.py
+++ b/tests/models/granitemoe/test_modeling_granitemoe.py
@@ -25,7 +25,6 @@ from transformers.testing_utils import (
    require_read_token,
    require_torch,
    require_torch_gpu,
-    require_torch_sdpa,
    slow,
    torch_device,
 )
@@ -444,15 +443,6 @@ class GraniteMoeModelTest(ModelTesterMixin, GenerationTesterMixin, unittest.Test
                if not has_flash:
                    raise ValueError("The flash model should have flash attention layers")

-    @parameterized.expand([("float16",), ("bfloat16",), ("float32",)])
-    @require_torch_sdpa
-    @slow
-    def test_eager_matches_sdpa_inference(self, torch_dtype: str):
-        """
-        skipping the test since mup is very flaky and gets consistently different outputs
-        """
-        self.skipTest("skipping the test since mup is very flaky and gets consistently different outputs")
-

@require_torch_gpu
 class GraniteMoeIntegrationTest(unittest.TestCase):