use a tinymodel to test generation config which aviod timeout (#34482)

* use a tinymodel to test generation config which aviod timeout * remove tailing whitespace
2024-10-29 16:39:06 +08:00
parent 63ca6d9771
commit 655bec2da7
1 changed files with 6 additions and 5 deletions
--- a/tests/utils/test_modeling_utils.py
+++ b/tests/utils/test_modeling_utils.py
@@ -1544,15 +1544,16 @@ class ModelUtilsTest(TestCasePlus):
            self.assertEqual(model.__class__.__name__, model_ref.__class__.__name__)
    def test_generation_config_is_loaded_with_model(self):
-        # Note: `TinyLlama/TinyLlama-1.1B-Chat-v1.0` has a `generation_config.json` containing `max_length: 2048`
+        # Note: `hf-internal-testing/tiny-random-MistralForCausalLM` has a `generation_config.json`
        # containing `bos_token_id: 1`
        # 1. Load without further parameters
-        model = AutoModelForCausalLM.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0")
+        model = AutoModelForCausalLM.from_pretrained(TINY_MISTRAL)
-        self.assertEqual(model.generation_config.max_length, 2048)
+        self.assertEqual(model.generation_config.bos_token_id, 1)
        # 2. Load with `device_map`
-        model = AutoModelForCausalLM.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0", device_map="auto")
+        model = AutoModelForCausalLM.from_pretrained(TINY_MISTRAL, device_map="auto")
-        self.assertEqual(model.generation_config.max_length, 2048)
+        self.assertEqual(model.generation_config.bos_token_id, 1)
    @require_safetensors
    def test_safetensors_torch_from_torch(self):