further cleanup

2019-12-18 11:50:54 +01:00
parent 8e5587fb79
commit 3d2096f516
6 changed files with 58 additions and 76 deletions
--- a/examples/run_generation.py
+++ b/examples/run_generation.py
@@ -91,7 +91,7 @@ def prepare_ctrl_input(args, _, tokenizer, prompt_text):


 def prepare_xlm_input(args, model, tokenizer, prompt_text):
-    kwargs = {"language": None, "mask_token": None}
+    kwargs = {"language": None, "mask_token_id": None}

    # Set the language
    use_lang_emb = hasattr(model.config, "use_lang_emb") and model.config.use_lang_emb
@@ -112,7 +112,7 @@ def prepare_xlm_input(args, model, tokenizer, prompt_text):
    # XLM masked-language modeling (MLM) models need masked token
    is_xlm_mlm = "mlm" in args.model_name_or_path
    if is_xlm_mlm:
-        kwargs["mask_token"] = tokenizer.mask_token_id
+        kwargs["mask_token_id"] = tokenizer.mask_token_id

    return prompt_text, kwargs

@@ -204,14 +204,13 @@ def main():
        prompt_text, model_kwargs = prepare_input(args, model, tokenizer, prompt_text)
    encoded_prompt = torch.tensor(tokenizer.encode(prompt_text, add_special_tokens=False)).unsqueeze(0)

-    output_sequences = model.decode(
-        prompt_ids=encoded_prompt,
+    output_sequences = model.generate(
+        intput_ids=encoded_prompt,
        length=args.length,
        temperature=args.temperature,
-        k=args.k,
-        p=args.p,
+        top_k=args.k,
+        top_p=args.p,
        repetition_penalty=args.repetition_penalty,
-        device=args.device,
        **model_kwargs,
    )