[tests] remove TF tests (uses of require_tf) (#38944)

* remove uses of require_tf * remove redundant import guards * this class has no tests * nits * del tf rng comment
2025-06-25 18:29:10 +01:00
parent d37f751797
commit 1d45d90e5d
44 changed files with 21 additions and 2504 deletions
--- a/tests/tokenization/test_tokenization_utils.py
+++ b/tests/tokenization/test_tokenization_utils.py
@@ -39,7 +39,6 @@ from transformers.testing_utils import (
    CaptureStderr,
    require_flax,
    require_sentencepiece,
-    require_tf,
    require_tokenizers,
    require_torch,
    slow,
@@ -121,27 +120,6 @@ class TokenizerUtilsTest(unittest.TestCase):
                tokenizer_r("Small example to encode", return_tensors=TensorType.NUMPY), np.array_equal
            )

-    @require_tf
-    @require_tokenizers
-    def test_batch_encoding_pickle_tf(self):
-        import tensorflow as tf
-
-        def tf_array_equals(t1, t2):
-            return tf.reduce_all(tf.equal(t1, t2))
-
-        tokenizer_p = BertTokenizer.from_pretrained("google-bert/bert-base-cased")
-        tokenizer_r = BertTokenizerFast.from_pretrained("google-bert/bert-base-cased")
-
-        with self.subTest("BatchEncoding (Python, return_tensors=TENSORFLOW)"):
-            self.assert_dump_and_restore(
-                tokenizer_p("Small example to encode", return_tensors=TensorType.TENSORFLOW), tf_array_equals
-            )
-
-        with self.subTest("BatchEncoding (Rust, return_tensors=TENSORFLOW)"):
-            self.assert_dump_and_restore(
-                tokenizer_r("Small example to encode", return_tensors=TensorType.TENSORFLOW), tf_array_equals
-            )
-
    @require_torch
    @require_tokenizers
    def test_batch_encoding_pickle_pt(self):
@@ -211,22 +189,6 @@ class TokenizerUtilsTest(unittest.TestCase):
        self.assertEqual(tensor_batch["inputs"].shape, (1, 3))
        self.assertEqual(tensor_batch["labels"].shape, (1,))

-    @require_tf
-    def test_batch_encoding_with_labels_tf(self):
-        batch = BatchEncoding({"inputs": [[1, 2, 3], [4, 5, 6]], "labels": [0, 1]})
-        tensor_batch = batch.convert_to_tensors(tensor_type="tf")
-        self.assertEqual(tensor_batch["inputs"].shape, (2, 3))
-        self.assertEqual(tensor_batch["labels"].shape, (2,))
-        # test converting the converted
-        with CaptureStderr() as cs:
-            tensor_batch = batch.convert_to_tensors(tensor_type="tf")
-        self.assertFalse(len(cs.err), msg=f"should have no warning, but got {cs.err}")
-
-        batch = BatchEncoding({"inputs": [1, 2, 3], "labels": 0})
-        tensor_batch = batch.convert_to_tensors(tensor_type="tf", prepend_batch_axis=True)
-        self.assertEqual(tensor_batch["inputs"].shape, (1, 3))
-        self.assertEqual(tensor_batch["labels"].shape, (1,))
-
    @require_flax
    def test_batch_encoding_with_labels_jax(self):
        batch = BatchEncoding({"inputs": [[1, 2, 3], [4, 5, 6]], "labels": [0, 1]})
@@ -381,20 +343,6 @@ class TokenizerUtilsTest(unittest.TestCase):
        self.assertTrue(isinstance(batch["input_ids"], torch.Tensor))
        self.assertEqual(batch["input_ids"].tolist(), [[0, 1, 2, tokenizer.pad_token_id], [0, 1, 2, 3]])

-    @require_tf
-    def test_padding_accepts_tensors_tf(self):
-        import tensorflow as tf
-
-        features = [{"input_ids": tf.constant([0, 1, 2])}, {"input_ids": tf.constant([0, 1, 2, 3])}]
-        tokenizer = BertTokenizer.from_pretrained("google-bert/bert-base-cased")
-
-        batch = tokenizer.pad(features, padding=True)
-        self.assertTrue(isinstance(batch["input_ids"], tf.Tensor))
-        self.assertEqual(batch["input_ids"].numpy().tolist(), [[0, 1, 2, tokenizer.pad_token_id], [0, 1, 2, 3]])
-        batch = tokenizer.pad(features, padding=True, return_tensors="tf")
-        self.assertTrue(isinstance(batch["input_ids"], tf.Tensor))
-        self.assertEqual(batch["input_ids"].numpy().tolist(), [[0, 1, 2, tokenizer.pad_token_id], [0, 1, 2, 3]])
-
    @require_tokenizers
    def test_instantiation_from_tokenizers(self):
        bert_tokenizer = Tokenizer(WordPiece(unk_token="[UNK]"))