Use full dataset for eval (SequentialSampler in Distributed setting)

2019-12-03 11:01:37 -05:00
parent f434bfc623
commit 48cbf267c9
4 changed files with 4 additions and 4 deletions
--- a/examples/run_glue.py
+++ b/examples/run_glue.py
@@ -231,7 +231,7 @@ def evaluate(args, model, tokenizer, prefix=""):
        args.eval_batch_size = args.per_gpu_eval_batch_size * max(1, args.n_gpu)
        # Note that DistributedSampler samples randomly
-        eval_sampler = SequentialSampler(eval_dataset) if args.local_rank == -1 else DistributedSampler(eval_dataset)
+        eval_sampler = SequentialSampler(eval_dataset)
        eval_dataloader = DataLoader(eval_dataset, sampler=eval_sampler, batch_size=args.eval_batch_size)
        # multi-gpu eval
--- a/examples/run_lm_finetuning.py
+++ b/examples/run_lm_finetuning.py
@@ -300,7 +300,7 @@ def evaluate(args, model, tokenizer, prefix=""):
    args.eval_batch_size = args.per_gpu_eval_batch_size * max(1, args.n_gpu)
    # Note that DistributedSampler samples randomly
-    eval_sampler = SequentialSampler(eval_dataset) if args.local_rank == -1 else DistributedSampler(eval_dataset)
+    eval_sampler = SequentialSampler(eval_dataset)
    eval_dataloader = DataLoader(eval_dataset, sampler=eval_sampler, batch_size=args.eval_batch_size)
    # multi-gpu evaluate
--- a/examples/run_multiple_choice.py
+++ b/examples/run_multiple_choice.py
@@ -226,7 +226,7 @@ def evaluate(args, model, tokenizer, prefix="", test=False):
        args.eval_batch_size = args.per_gpu_eval_batch_size * max(1, args.n_gpu)
        # Note that DistributedSampler samples randomly
-        eval_sampler = SequentialSampler(eval_dataset) if args.local_rank == -1 else DistributedSampler(eval_dataset)
+        eval_sampler = SequentialSampler(eval_dataset)
        eval_dataloader = DataLoader(eval_dataset, sampler=eval_sampler, batch_size=args.eval_batch_size)
        # multi-gpu evaluate
--- a/examples/run_xnli.py
+++ b/examples/run_xnli.py
@@ -206,7 +206,7 @@ def evaluate(args, model, tokenizer, prefix=""):
        args.eval_batch_size = args.per_gpu_eval_batch_size * max(1, args.n_gpu)
        # Note that DistributedSampler samples randomly
-        eval_sampler = SequentialSampler(eval_dataset) if args.local_rank == -1 else DistributedSampler(eval_dataset)
+        eval_sampler = SequentialSampler(eval_dataset)
        eval_dataloader = DataLoader(eval_dataset, sampler=eval_sampler, batch_size=args.eval_batch_size)
        # multi-gpu eval