From 7da3ef24cd6911e168ae52eddb8b23f9fd61e6d4 Mon Sep 17 00:00:00 2001
From: Xu Hongshen <1505746949@qq.com>
Date: Tue, 12 Nov 2019 16:11:24 +0800
Subject: [PATCH] add is_impossible tensor to model inputs during fine-tuning
 xlnet on squad2.0

---
 examples/run_squad.py | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/examples/run_squad.py b/examples/run_squad.py
index d7fdc32ae7..bd44979e44 100644
--- a/examples/run_squad.py
+++ b/examples/run_squad.py
@@ -147,6 +147,8 @@ def train(args, train_dataset, model, tokenizer):
             if args.model_type in ['xlnet', 'xlm']:
                 inputs.update({'cls_index': batch[5],
                                'p_mask':       batch[6]})
+                if args.version_2_with_negative:
+                    inputs.update({'is_impossible': batch[7]})
             outputs = model(**inputs)
             loss = outputs[0]  # model outputs are always tuple in transformers (see doc)
 
@@ -339,9 +341,10 @@ def load_and_cache_examples(args, tokenizer, evaluate=False, output_examples=Fal
     else:
         all_start_positions = torch.tensor([f.start_position for f in features], dtype=torch.long)
         all_end_positions = torch.tensor([f.end_position for f in features], dtype=torch.long)
+        all_is_impossible = torch.tensor([1.0 if f.is_impossible == True else 0.0 for f in features], dtype=torch.float)
         dataset = TensorDataset(all_input_ids, all_input_mask, all_segment_ids,
                                 all_start_positions, all_end_positions,
-                                all_cls_index, all_p_mask)
+                                all_cls_index, all_p_mask, all_is_impossible)
 
     if output_examples:
         return dataset, examples, features