Update repo to isort v5 (#6686)

* Run new isort * More changes * Update CI, CONTRIBUTING and benchmarks
2020-08-24 11:03:01 -04:00
parent d329c9b05d
commit a573777901
89 changed files with 615 additions and 632 deletions
--- a/tests/test_activations.py
+++ b/tests/test_activations.py
@@ -5,9 +5,10 @@ from transformers.testing_utils import require_torch


 if is_torch_available():
-    from transformers.activations import _gelu_python, get_activation, gelu_new
    import torch

+    from transformers.activations import _gelu_python, gelu_new, get_activation
+

@require_torch
 class TestActivations(unittest.TestCase):
--- a/tests/test_benchmark.py
+++ b/tests/test_benchmark.py
@@ -8,10 +8,7 @@ from transformers.testing_utils import require_torch, torch_device


 if is_torch_available():
-    from transformers import (
-        PyTorchBenchmarkArguments,
-        PyTorchBenchmark,
-    )
+    from transformers import PyTorchBenchmark, PyTorchBenchmarkArguments


@require_torch
--- a/tests/test_benchmark_tf.py
+++ b/tests/test_benchmark_tf.py
@@ -9,6 +9,7 @@ from transformers.testing_utils import require_tf

 if is_tf_available():
    import tensorflow as tf
+
    from transformers import TensorFlowBenchmark, TensorFlowBenchmarkArguments


--- a/tests/test_hf_api.py
+++ b/tests/test_hf_api.py
@@ -20,7 +20,6 @@ import unittest

 import requests
 from requests.exceptions import HTTPError
-
 from transformers.hf_api import HfApi, HfFolder, ModelInfo, PresignedUrl, S3Obj


--- a/tests/test_modeling_albert.py
+++ b/tests/test_modeling_albert.py
@@ -26,13 +26,13 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor, random_attention
 if is_torch_available():
    from transformers import (
        AlbertConfig,
-        AlbertModel,
-        AlbertForPreTraining,
        AlbertForMaskedLM,
        AlbertForMultipleChoice,
+        AlbertForPreTraining,
+        AlbertForQuestionAnswering,
        AlbertForSequenceClassification,
        AlbertForTokenClassification,
-        AlbertForQuestionAnswering,
+        AlbertModel,
    )
    from transformers.modeling_albert import ALBERT_PRETRAINED_MODEL_ARCHIVE_LIST

--- a/tests/test_modeling_auto.py
+++ b/tests/test_modeling_auto.py
@@ -23,42 +23,42 @@ from transformers.testing_utils import DUMMY_UNKWOWN_IDENTIFIER, SMALL_MODEL_IDE
 if is_torch_available():
    from transformers import (
        AutoConfig,
-        BertConfig,
-        GPT2Config,
-        T5Config,
        AutoModel,
-        BertModel,
-        AutoModelForPreTraining,
-        BertForPreTraining,
        AutoModelForCausalLM,
-        GPT2LMHeadModel,
-        AutoModelWithLMHead,
        AutoModelForMaskedLM,
-        BertForMaskedLM,
-        RobertaForMaskedLM,
-        AutoModelForSeq2SeqLM,
-        T5ForConditionalGeneration,
-        AutoModelForSequenceClassification,
-        BertForSequenceClassification,
+        AutoModelForPreTraining,
        AutoModelForQuestionAnswering,
-        BertForQuestionAnswering,
+        AutoModelForSeq2SeqLM,
+        AutoModelForSequenceClassification,
        AutoModelForTokenClassification,
+        AutoModelWithLMHead,
+        BertConfig,
+        BertForMaskedLM,
+        BertForPreTraining,
+        BertForQuestionAnswering,
+        BertForSequenceClassification,
        BertForTokenClassification,
+        BertModel,
+        GPT2Config,
+        GPT2LMHeadModel,
+        RobertaForMaskedLM,
+        T5Config,
+        T5ForConditionalGeneration,
+    )
+    from transformers.modeling_auto import (
+        MODEL_FOR_CAUSAL_LM_MAPPING,
+        MODEL_FOR_MASKED_LM_MAPPING,
+        MODEL_FOR_PRETRAINING_MAPPING,
+        MODEL_FOR_QUESTION_ANSWERING_MAPPING,
+        MODEL_FOR_SEQ_TO_SEQ_CAUSAL_LM_MAPPING,
+        MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING,
+        MODEL_FOR_TOKEN_CLASSIFICATION_MAPPING,
+        MODEL_MAPPING,
+        MODEL_WITH_LM_HEAD_MAPPING,
    )
    from transformers.modeling_bert import BERT_PRETRAINED_MODEL_ARCHIVE_LIST
    from transformers.modeling_gpt2 import GPT2_PRETRAINED_MODEL_ARCHIVE_LIST
    from transformers.modeling_t5 import T5_PRETRAINED_MODEL_ARCHIVE_LIST
-    from transformers.modeling_auto import (
-        MODEL_MAPPING,
-        MODEL_FOR_PRETRAINING_MAPPING,
-        MODEL_FOR_QUESTION_ANSWERING_MAPPING,
-        MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING,
-        MODEL_FOR_TOKEN_CLASSIFICATION_MAPPING,
-        MODEL_WITH_LM_HEAD_MAPPING,
-        MODEL_FOR_CAUSAL_LM_MAPPING,
-        MODEL_FOR_MASKED_LM_MAPPING,
-        MODEL_FOR_SEQ_TO_SEQ_CAUSAL_LM_MAPPING,
-    )


@require_torch
--- a/tests/test_modeling_bart.py
+++ b/tests/test_modeling_bart.py
@@ -28,24 +28,25 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor

 if is_torch_available():
    import torch
+
    from transformers import (
        AutoModel,
        AutoModelForSequenceClassification,
        AutoTokenizer,
-        BartModel,
-        BartForConditionalGeneration,
-        BartForSequenceClassification,
-        BartForQuestionAnswering,
        BartConfig,
+        BartForConditionalGeneration,
+        BartForQuestionAnswering,
+        BartForSequenceClassification,
+        BartModel,
        BartTokenizer,
        BartTokenizerFast,
        pipeline,
    )
    from transformers.modeling_bart import (
-        shift_tokens_right,
-        invert_mask,
-        _prepare_bart_decoder_inputs,
        SinusoidalPositionalEmbedding,
+        _prepare_bart_decoder_inputs,
+        invert_mask,
+        shift_tokens_right,
    )
 PGE_ARTICLE = """ PG&E stated it scheduled the blackouts in response to forecasts for high winds amid dry conditions. The aim is to reduce the risk of wildfires. Nearly 800 thousand customers were scheduled to be affected by the shutoffs which were expected to last through at least midday tomorrow."""

--- a/tests/test_modeling_camembert.py
+++ b/tests/test_modeling_camembert.py
@@ -21,6 +21,7 @@ from transformers.testing_utils import require_torch, slow, torch_device

 if is_torch_available():
    import torch
+
    from transformers import CamembertModel


--- a/tests/test_modeling_common.py
+++ b/tests/test_modeling_common.py
@@ -29,19 +29,19 @@ if is_torch_available():
    import torch

    from transformers import (
-        AdaptiveEmbedding,
-        PretrainedConfig,
-        PreTrainedModel,
-        BertConfig,
-        BertModel,
        BERT_PRETRAINED_MODEL_ARCHIVE_LIST,
-        MODEL_FOR_MULTIPLE_CHOICE_MAPPING,
-        MODEL_FOR_QUESTION_ANSWERING_MAPPING,
        MODEL_FOR_CAUSAL_LM_MAPPING,
        MODEL_FOR_MASKED_LM_MAPPING,
+        MODEL_FOR_MULTIPLE_CHOICE_MAPPING,
+        MODEL_FOR_QUESTION_ANSWERING_MAPPING,
        MODEL_FOR_SEQ_TO_SEQ_CAUSAL_LM_MAPPING,
        MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING,
        MODEL_FOR_TOKEN_CLASSIFICATION_MAPPING,
+        AdaptiveEmbedding,
+        BertConfig,
+        BertModel,
+        PretrainedConfig,
+        PreTrainedModel,
        top_k_top_p_filtering,
    )

--- a/tests/test_modeling_ctrl.py
+++ b/tests/test_modeling_ctrl.py
@@ -24,7 +24,8 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor, random_attention

 if is_torch_available():
    import torch
-    from transformers import CTRLConfig, CTRLModel, CTRL_PRETRAINED_MODEL_ARCHIVE_LIST, CTRLLMHeadModel
+
+    from transformers import CTRL_PRETRAINED_MODEL_ARCHIVE_LIST, CTRLConfig, CTRLLMHeadModel, CTRLModel


 class CTRLModelTester:
--- a/tests/test_modeling_distilbert.py
+++ b/tests/test_modeling_distilbert.py
@@ -25,14 +25,14 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor, random_attention

 if is_torch_available():
    from transformers import (
+        DISTILBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
        DistilBertConfig,
-        DistilBertModel,
        DistilBertForMaskedLM,
        DistilBertForMultipleChoice,
-        DistilBertForTokenClassification,
        DistilBertForQuestionAnswering,
        DistilBertForSequenceClassification,
-        DISTILBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
+        DistilBertForTokenClassification,
+        DistilBertModel,
    )

    class DistilBertModelTester(object):
--- a/tests/test_modeling_electra.py
+++ b/tests/test_modeling_electra.py
@@ -26,13 +26,13 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor, random_attention
 if is_torch_available():
    from transformers import (
        ElectraConfig,
-        ElectraModel,
        ElectraForMaskedLM,
-        ElectraForTokenClassification,
-        ElectraForPreTraining,
        ElectraForMultipleChoice,
-        ElectraForSequenceClassification,
+        ElectraForPreTraining,
        ElectraForQuestionAnswering,
+        ElectraForSequenceClassification,
+        ElectraForTokenClassification,
+        ElectraModel,
    )
    from transformers.modeling_electra import ELECTRA_PRETRAINED_MODEL_ARCHIVE_LIST

--- a/tests/test_modeling_encoder_decoder.py
+++ b/tests/test_modeling_encoder_decoder.py
@@ -27,18 +27,19 @@ from .test_modeling_roberta import RobertaModelTester


 if is_torch_available():
-    from transformers import (
-        BertModel,
-        BertLMHeadModel,
-        GPT2LMHeadModel,
-        RobertaModel,
-        RobertaForCausalLM,
-        EncoderDecoderModel,
-        EncoderDecoderConfig,
-    )
    import numpy as np
    import torch

+    from transformers import (
+        BertLMHeadModel,
+        BertModel,
+        EncoderDecoderConfig,
+        EncoderDecoderModel,
+        GPT2LMHeadModel,
+        RobertaForCausalLM,
+        RobertaModel,
+    )
+

@require_torch
 class EncoderDecoderMixin:
--- a/tests/test_modeling_flaubert.py
+++ b/tests/test_modeling_flaubert.py
@@ -26,13 +26,13 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor, random_attention
 if is_torch_available():
    from transformers import (
        FlaubertConfig,
-        FlaubertModel,
-        FlaubertWithLMHeadModel,
+        FlaubertForMultipleChoice,
        FlaubertForQuestionAnswering,
        FlaubertForQuestionAnsweringSimple,
        FlaubertForSequenceClassification,
        FlaubertForTokenClassification,
-        FlaubertForMultipleChoice,
+        FlaubertModel,
+        FlaubertWithLMHeadModel,
    )
    from transformers.modeling_flaubert import FLAUBERT_PRETRAINED_MODEL_ARCHIVE_LIST

--- a/tests/test_modeling_gpt2.py
+++ b/tests/test_modeling_gpt2.py
@@ -25,12 +25,13 @@ from .test_modeling_common import ModelTesterMixin, floats_tensor, ids_tensor, r

 if is_torch_available():
    import torch
+
    from transformers import (
-        GPT2Config,
-        GPT2Model,
        GPT2_PRETRAINED_MODEL_ARCHIVE_LIST,
-        GPT2LMHeadModel,
+        GPT2Config,
        GPT2DoubleHeadsModel,
+        GPT2LMHeadModel,
+        GPT2Model,
    )


--- a/tests/test_modeling_longformer.py
+++ b/tests/test_modeling_longformer.py
@@ -25,14 +25,15 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor, random_attention

 if is_torch_available():
    import torch
+
    from transformers import (
        LongformerConfig,
-        LongformerModel,
        LongformerForMaskedLM,
+        LongformerForMultipleChoice,
+        LongformerForQuestionAnswering,
        LongformerForSequenceClassification,
        LongformerForTokenClassification,
-        LongformerForQuestionAnswering,
-        LongformerForMultipleChoice,
+        LongformerModel,
        LongformerSelfAttention,
    )

--- a/tests/test_modeling_marian.py
+++ b/tests/test_modeling_marian.py
@@ -24,18 +24,19 @@ from transformers.testing_utils import require_torch, slow, torch_device

 if is_torch_available():
    import torch
+
    from transformers import (
-        AutoTokenizer,
-        MarianConfig,
        AutoConfig,
        AutoModelWithLMHead,
-        MarianTokenizer,
+        AutoTokenizer,
+        MarianConfig,
        MarianMTModel,
+        MarianTokenizer,
    )
    from transformers.convert_marian_to_pytorch import (
+        ORG_NAME,
        convert_hf_name_to_opus_name,
        convert_opus_name_to_hf_name,
-        ORG_NAME,
    )
    from transformers.pipelines import TranslationPipeline

--- a/tests/test_modeling_mbart.py
+++ b/tests/test_modeling_mbart.py
@@ -9,12 +9,13 @@ from .test_modeling_bart import TOLERANCE, _assert_tensors_equal, _long_tensor

 if is_torch_available():
    import torch
+
    from transformers import (
        AutoModelForSeq2SeqLM,
+        AutoTokenizer,
+        BatchEncoding,
        MBartConfig,
        MBartForConditionalGeneration,
-        BatchEncoding,
-        AutoTokenizer,
    )


--- a/tests/test_modeling_mobilebert.py
+++ b/tests/test_modeling_mobilebert.py
@@ -25,16 +25,17 @@ from .test_modeling_common import ModelTesterMixin, floats_tensor, ids_tensor, r

 if is_torch_available():
    import torch
+
    from transformers import (
        MobileBertConfig,
-        MobileBertModel,
        MobileBertForMaskedLM,
+        MobileBertForMultipleChoice,
        MobileBertForNextSentencePrediction,
        MobileBertForPreTraining,
        MobileBertForQuestionAnswering,
        MobileBertForSequenceClassification,
        MobileBertForTokenClassification,
-        MobileBertForMultipleChoice,
+        MobileBertModel,
    )


--- a/tests/test_modeling_openai.py
+++ b/tests/test_modeling_openai.py
@@ -25,12 +25,13 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor

 if is_torch_available():
    import torch
+
    from transformers import (
-        OpenAIGPTConfig,
-        OpenAIGPTModel,
        OPENAI_GPT_PRETRAINED_MODEL_ARCHIVE_LIST,
-        OpenAIGPTLMHeadModel,
+        OpenAIGPTConfig,
        OpenAIGPTDoubleHeadsModel,
+        OpenAIGPTLMHeadModel,
+        OpenAIGPTModel,
    )


--- a/tests/test_modeling_reformer.py
+++ b/tests/test_modeling_reformer.py
@@ -23,18 +23,19 @@ from .test_modeling_common import ModelTesterMixin, floats_tensor, ids_tensor, r


 if is_torch_available():
+    import torch
+
    from transformers import (
+        REFORMER_PRETRAINED_MODEL_ARCHIVE_LIST,
        ReformerConfig,
        ReformerForMaskedLM,
+        ReformerForQuestionAnswering,
+        ReformerForSequenceClassification,
+        ReformerLayer,
        ReformerModel,
        ReformerModelWithLMHead,
-        ReformerForSequenceClassification,
        ReformerTokenizer,
-        ReformerLayer,
-        ReformerForQuestionAnswering,
-        REFORMER_PRETRAINED_MODEL_ARCHIVE_LIST,
    )
-    import torch


 class ReformerModelTester:
--- a/tests/test_modeling_roberta.py
+++ b/tests/test_modeling_roberta.py
@@ -25,18 +25,22 @@ from .test_modeling_common import ModelTesterMixin, floats_tensor, ids_tensor, r

 if is_torch_available():
    import torch
+
    from transformers import (
        RobertaConfig,
-        RobertaModel,
        RobertaForCausalLM,
        RobertaForMaskedLM,
        RobertaForMultipleChoice,
        RobertaForQuestionAnswering,
        RobertaForSequenceClassification,
        RobertaForTokenClassification,
+        RobertaModel,
+    )
+    from transformers.modeling_roberta import (
+        ROBERTA_PRETRAINED_MODEL_ARCHIVE_LIST,
+        RobertaEmbeddings,
+        create_position_ids_from_input_ids,
    )
-    from transformers.modeling_roberta import RobertaEmbeddings, create_position_ids_from_input_ids
-    from transformers.modeling_roberta import ROBERTA_PRETRAINED_MODEL_ARCHIVE_LIST


 class RobertaModelTester:
--- a/tests/test_modeling_t5.py
+++ b/tests/test_modeling_t5.py
@@ -28,7 +28,8 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor

 if is_torch_available():
    import torch
-    from transformers import T5Config, T5Model, T5ForConditionalGeneration
+
+    from transformers import T5Config, T5ForConditionalGeneration, T5Model
    from transformers.modeling_t5 import T5_PRETRAINED_MODEL_ARCHIVE_LIST
    from transformers.tokenization_t5 import T5Tokenizer

--- a/tests/test_modeling_tf_albert.py
+++ b/tests/test_modeling_tf_albert.py
@@ -25,15 +25,16 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers.modeling_tf_albert import (
-        TFAlbertModel,
-        TFAlbertForPreTraining,
+        TF_ALBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
        TFAlbertForMaskedLM,
        TFAlbertForMultipleChoice,
-        TFAlbertForSequenceClassification,
+        TFAlbertForPreTraining,
        TFAlbertForQuestionAnswering,
+        TFAlbertForSequenceClassification,
        TFAlbertForTokenClassification,
-        TF_ALBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFAlbertModel,
    )


--- a/tests/test_modeling_tf_auto.py
+++ b/tests/test_modeling_tf_auto.py
@@ -27,36 +27,36 @@ if is_tf_available():
        GPT2Config,
        T5Config,
        TFAutoModel,
-        TFBertModel,
+        TFAutoModelForCausalLM,
+        TFAutoModelForMaskedLM,
        TFAutoModelForPreTraining,
-        TFBertForPreTraining,
+        TFAutoModelForQuestionAnswering,
+        TFAutoModelForSeq2SeqLM,
+        TFAutoModelForSequenceClassification,
        TFAutoModelWithLMHead,
        TFBertForMaskedLM,
-        TFRobertaForMaskedLM,
-        TFAutoModelForSequenceClassification,
-        TFBertForSequenceClassification,
-        TFAutoModelForQuestionAnswering,
+        TFBertForPreTraining,
        TFBertForQuestionAnswering,
-        TFAutoModelForCausalLM,
+        TFBertForSequenceClassification,
+        TFBertModel,
        TFGPT2LMHeadModel,
-        TFAutoModelForMaskedLM,
-        TFAutoModelForSeq2SeqLM,
+        TFRobertaForMaskedLM,
        TFT5ForConditionalGeneration,
    )
+    from transformers.modeling_tf_auto import (
+        TF_MODEL_FOR_CAUSAL_LM_MAPPING,
+        TF_MODEL_FOR_MASKED_LM_MAPPING,
+        TF_MODEL_FOR_PRETRAINING_MAPPING,
+        TF_MODEL_FOR_QUESTION_ANSWERING_MAPPING,
+        TF_MODEL_FOR_SEQ_TO_SEQ_CAUSAL_LM_MAPPING,
+        TF_MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING,
+        TF_MODEL_FOR_TOKEN_CLASSIFICATION_MAPPING,
+        TF_MODEL_MAPPING,
+        TF_MODEL_WITH_LM_HEAD_MAPPING,
+    )
    from transformers.modeling_tf_bert import TF_BERT_PRETRAINED_MODEL_ARCHIVE_LIST
    from transformers.modeling_tf_gpt2 import TF_GPT2_PRETRAINED_MODEL_ARCHIVE_LIST
    from transformers.modeling_tf_t5 import TF_T5_PRETRAINED_MODEL_ARCHIVE_LIST
-    from transformers.modeling_tf_auto import (
-        TF_MODEL_MAPPING,
-        TF_MODEL_FOR_PRETRAINING_MAPPING,
-        TF_MODEL_FOR_QUESTION_ANSWERING_MAPPING,
-        TF_MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING,
-        TF_MODEL_FOR_TOKEN_CLASSIFICATION_MAPPING,
-        TF_MODEL_WITH_LM_HEAD_MAPPING,
-        TF_MODEL_FOR_CAUSAL_LM_MAPPING,
-        TF_MODEL_FOR_MASKED_LM_MAPPING,
-        TF_MODEL_FOR_SEQ_TO_SEQ_CAUSAL_LM_MAPPING,
-    )


@require_tf
--- a/tests/test_modeling_tf_bert.py
+++ b/tests/test_modeling_tf_bert.py
@@ -25,16 +25,17 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers.modeling_tf_bert import (
-        TFBertModel,
-        TFBertLMHeadModel,
        TFBertForMaskedLM,
+        TFBertForMultipleChoice,
        TFBertForNextSentencePrediction,
        TFBertForPreTraining,
-        TFBertForSequenceClassification,
-        TFBertForMultipleChoice,
-        TFBertForTokenClassification,
        TFBertForQuestionAnswering,
+        TFBertForSequenceClassification,
+        TFBertForTokenClassification,
+        TFBertLMHeadModel,
+        TFBertModel,
    )


--- a/tests/test_modeling_tf_camembert.py
+++ b/tests/test_modeling_tf_camembert.py
@@ -20,8 +20,9 @@ from transformers.testing_utils import require_tf, slow


 if is_tf_available():
-    import tensorflow as tf
    import numpy as np
+    import tensorflow as tf
+
    from transformers import TFCamembertModel


--- a/tests/test_modeling_tf_common.py
+++ b/tests/test_modeling_tf_common.py
@@ -28,20 +28,20 @@ from transformers.testing_utils import _tf_gpu_memory_limit, require_tf, slow


 if is_tf_available():
-    import tensorflow as tf
    import numpy as np
+    import tensorflow as tf

    from transformers import (
-        tf_top_k_top_p_filtering,
-        TFAdaptiveEmbedding,
-        TFSharedEmbeddings,
-        TF_MODEL_FOR_MULTIPLE_CHOICE_MAPPING,
-        TF_MODEL_FOR_QUESTION_ANSWERING_MAPPING,
-        TF_MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING,
-        TF_MODEL_FOR_TOKEN_CLASSIFICATION_MAPPING,
        TF_MODEL_FOR_CAUSAL_LM_MAPPING,
        TF_MODEL_FOR_MASKED_LM_MAPPING,
+        TF_MODEL_FOR_MULTIPLE_CHOICE_MAPPING,
+        TF_MODEL_FOR_QUESTION_ANSWERING_MAPPING,
        TF_MODEL_FOR_SEQ_TO_SEQ_CAUSAL_LM_MAPPING,
+        TF_MODEL_FOR_SEQUENCE_CLASSIFICATION_MAPPING,
+        TF_MODEL_FOR_TOKEN_CLASSIFICATION_MAPPING,
+        TFAdaptiveEmbedding,
+        TFSharedEmbeddings,
+        tf_top_k_top_p_filtering,
    )

    if _tf_gpu_memory_limit is not None:
@@ -260,6 +260,7 @@ class TFModelTesterMixin:
            return

        import torch
+
        import transformers

        config, inputs_dict = self.model_tester.prepare_config_and_inputs_for_common()
--- a/tests/test_modeling_tf_ctrl.py
+++ b/tests/test_modeling_tf_ctrl.py
@@ -25,7 +25,8 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
-    from transformers.modeling_tf_ctrl import TFCTRLModel, TFCTRLLMHeadModel, TF_CTRL_PRETRAINED_MODEL_ARCHIVE_LIST
+
+    from transformers.modeling_tf_ctrl import TF_CTRL_PRETRAINED_MODEL_ARCHIVE_LIST, TFCTRLLMHeadModel, TFCTRLModel


 class TFCTRLModelTester(object):
--- a/tests/test_modeling_tf_distilbert.py
+++ b/tests/test_modeling_tf_distilbert.py
@@ -25,14 +25,15 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers.modeling_tf_distilbert import (
-        TFDistilBertModel,
+        TF_DISTILBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
        TFDistilBertForMaskedLM,
+        TFDistilBertForMultipleChoice,
        TFDistilBertForQuestionAnswering,
        TFDistilBertForSequenceClassification,
        TFDistilBertForTokenClassification,
-        TFDistilBertForMultipleChoice,
-        TF_DISTILBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFDistilBertModel,
    )


--- a/tests/test_modeling_tf_electra.py
+++ b/tests/test_modeling_tf_electra.py
@@ -27,13 +27,13 @@ if is_tf_available():
    import tensorflow as tf

    from transformers.modeling_tf_electra import (
-        TFElectraModel,
        TFElectraForMaskedLM,
        TFElectraForMultipleChoice,
        TFElectraForPreTraining,
+        TFElectraForQuestionAnswering,
        TFElectraForSequenceClassification,
        TFElectraForTokenClassification,
-        TFElectraForQuestionAnswering,
+        TFElectraModel,
    )


--- a/tests/test_modeling_tf_flaubert.py
+++ b/tests/test_modeling_tf_flaubert.py
@@ -23,18 +23,18 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor


 if is_tf_available():
-    import tensorflow as tf
    import numpy as np
+    import tensorflow as tf

    from transformers import (
+        TF_FLAUBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
        FlaubertConfig,
+        TFFlaubertForMultipleChoice,
+        TFFlaubertForQuestionAnsweringSimple,
+        TFFlaubertForSequenceClassification,
+        TFFlaubertForTokenClassification,
        TFFlaubertModel,
        TFFlaubertWithLMHeadModel,
-        TFFlaubertForSequenceClassification,
-        TFFlaubertForQuestionAnsweringSimple,
-        TFFlaubertForTokenClassification,
-        TFFlaubertForMultipleChoice,
-        TF_FLAUBERT_PRETRAINED_MODEL_ARCHIVE_LIST,
    )


--- a/tests/test_modeling_tf_gpt2.py
+++ b/tests/test_modeling_tf_gpt2.py
@@ -25,11 +25,12 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers.modeling_tf_gpt2 import (
-        TFGPT2Model,
-        TFGPT2LMHeadModel,
-        TFGPT2DoubleHeadsModel,
        TF_GPT2_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFGPT2DoubleHeadsModel,
+        TFGPT2LMHeadModel,
+        TFGPT2Model,
        shape_list,
    )

--- a/tests/test_modeling_tf_longformer.py
+++ b/tests/test_modeling_tf_longformer.py
@@ -25,11 +25,12 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers import (
        LongformerConfig,
-        TFLongformerModel,
        TFLongformerForMaskedLM,
        TFLongformerForQuestionAnswering,
+        TFLongformerModel,
        TFLongformerSelfAttention,
    )

--- a/tests/test_modeling_tf_mobilebert.py
+++ b/tests/test_modeling_tf_mobilebert.py
@@ -25,15 +25,16 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers.modeling_tf_mobilebert import (
-        TFMobileBertModel,
        TFMobileBertForMaskedLM,
+        TFMobileBertForMultipleChoice,
        TFMobileBertForNextSentencePrediction,
        TFMobileBertForPreTraining,
-        TFMobileBertForSequenceClassification,
-        TFMobileBertForMultipleChoice,
-        TFMobileBertForTokenClassification,
        TFMobileBertForQuestionAnswering,
+        TFMobileBertForSequenceClassification,
+        TFMobileBertForTokenClassification,
+        TFMobileBertModel,
    )


--- a/tests/test_modeling_tf_openai.py
+++ b/tests/test_modeling_tf_openai.py
@@ -25,11 +25,12 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers.modeling_tf_openai import (
-        TFOpenAIGPTModel,
-        TFOpenAIGPTLMHeadModel,
-        TFOpenAIGPTDoubleHeadsModel,
        TF_OPENAI_GPT_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFOpenAIGPTDoubleHeadsModel,
+        TFOpenAIGPTLMHeadModel,
+        TFOpenAIGPTModel,
    )


--- a/tests/test_modeling_tf_roberta.py
+++ b/tests/test_modeling_tf_roberta.py
@@ -24,16 +24,17 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor


 if is_tf_available():
-    import tensorflow as tf
    import numpy
+    import tensorflow as tf
+
    from transformers.modeling_tf_roberta import (
-        TFRobertaModel,
+        TF_ROBERTA_PRETRAINED_MODEL_ARCHIVE_LIST,
        TFRobertaForMaskedLM,
+        TFRobertaForMultipleChoice,
+        TFRobertaForQuestionAnswering,
        TFRobertaForSequenceClassification,
        TFRobertaForTokenClassification,
-        TFRobertaForQuestionAnswering,
-        TFRobertaForMultipleChoice,
-        TF_ROBERTA_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFRobertaModel,
    )


--- a/tests/test_modeling_tf_t5.py
+++ b/tests/test_modeling_tf_t5.py
@@ -26,7 +26,8 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
-    from transformers import TFT5Model, TFT5ForConditionalGeneration, T5Tokenizer
+
+    from transformers import T5Tokenizer, TFT5ForConditionalGeneration, TFT5Model


 class TFT5ModelTester:
--- a/tests/test_modeling_tf_transfo_xl.py
+++ b/tests/test_modeling_tf_transfo_xl.py
@@ -26,11 +26,8 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
-    from transformers import (
-        TFTransfoXLModel,
-        TFTransfoXLLMHeadModel,
-        TF_TRANSFO_XL_PRETRAINED_MODEL_ARCHIVE_LIST,
-    )
+
+    from transformers import TF_TRANSFO_XL_PRETRAINED_MODEL_ARCHIVE_LIST, TFTransfoXLLMHeadModel, TFTransfoXLModel


 class TFTransfoXLModelTester:
--- a/tests/test_modeling_tf_xlm.py
+++ b/tests/test_modeling_tf_xlm.py
@@ -25,15 +25,16 @@ from .test_modeling_tf_common import TFModelTesterMixin, ids_tensor

 if is_tf_available():
    import tensorflow as tf
+
    from transformers import (
-        XLMConfig,
+        TF_XLM_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFXLMForMultipleChoice,
+        TFXLMForQuestionAnsweringSimple,
+        TFXLMForSequenceClassification,
+        TFXLMForTokenClassification,
        TFXLMModel,
        TFXLMWithLMHeadModel,
-        TFXLMForSequenceClassification,
-        TFXLMForQuestionAnsweringSimple,
-        TFXLMForTokenClassification,
-        TFXLMForMultipleChoice,
-        TF_XLM_PRETRAINED_MODEL_ARCHIVE_LIST,
+        XLMConfig,
    )


--- a/tests/test_modeling_tf_xlm_roberta.py
+++ b/tests/test_modeling_tf_xlm_roberta.py
@@ -20,8 +20,9 @@ from transformers.testing_utils import require_tf, slow


 if is_tf_available():
-    import tensorflow as tf
    import numpy as np
+    import tensorflow as tf
+
    from transformers import TFXLMRobertaModel


--- a/tests/test_modeling_tf_xlnet.py
+++ b/tests/test_modeling_tf_xlnet.py
@@ -28,13 +28,13 @@ if is_tf_available():
    import tensorflow as tf

    from transformers.modeling_tf_xlnet import (
-        TFXLNetModel,
-        TFXLNetLMHeadModel,
+        TF_XLNET_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFXLNetForMultipleChoice,
+        TFXLNetForQuestionAnsweringSimple,
        TFXLNetForSequenceClassification,
        TFXLNetForTokenClassification,
-        TFXLNetForQuestionAnsweringSimple,
-        TFXLNetForMultipleChoice,
-        TF_XLNET_PRETRAINED_MODEL_ARCHIVE_LIST,
+        TFXLNetLMHeadModel,
+        TFXLNetModel,
    )


--- a/tests/test_modeling_transfo_xl.py
+++ b/tests/test_modeling_transfo_xl.py
@@ -25,7 +25,8 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor

 if is_torch_available():
    import torch
-    from transformers import TransfoXLConfig, TransfoXLModel, TransfoXLLMHeadModel
+
+    from transformers import TransfoXLConfig, TransfoXLLMHeadModel, TransfoXLModel
    from transformers.modeling_transfo_xl import TRANSFO_XL_PRETRAINED_MODEL_ARCHIVE_LIST


--- a/tests/test_modeling_xlm.py
+++ b/tests/test_modeling_xlm.py
@@ -25,15 +25,16 @@ from .test_modeling_common import ModelTesterMixin, ids_tensor, random_attention

 if is_torch_available():
    import torch
+
    from transformers import (
        XLMConfig,
+        XLMForMultipleChoice,
+        XLMForQuestionAnswering,
+        XLMForQuestionAnsweringSimple,
+        XLMForSequenceClassification,
+        XLMForTokenClassification,
        XLMModel,
        XLMWithLMHeadModel,
-        XLMForTokenClassification,
-        XLMForQuestionAnswering,
-        XLMForSequenceClassification,
-        XLMForQuestionAnsweringSimple,
-        XLMForMultipleChoice,
    )
    from transformers.modeling_xlm import XLM_PRETRAINED_MODEL_ARCHIVE_LIST

--- a/tests/test_modeling_xlm_roberta.py
+++ b/tests/test_modeling_xlm_roberta.py
@@ -22,6 +22,7 @@ from transformers.testing_utils import slow

 if is_torch_available():
    import torch
+
    from transformers import XLMRobertaModel


--- a/tests/test_modeling_xlnet.py
+++ b/tests/test_modeling_xlnet.py
@@ -29,13 +29,13 @@ if is_torch_available():

    from transformers import (
        XLNetConfig,
-        XLNetModel,
-        XLNetLMHeadModel,
        XLNetForMultipleChoice,
-        XLNetForSequenceClassification,
-        XLNetForTokenClassification,
        XLNetForQuestionAnswering,
        XLNetForQuestionAnsweringSimple,
+        XLNetForSequenceClassification,
+        XLNetForTokenClassification,
+        XLNetLMHeadModel,
+        XLNetModel,
    )
    from transformers.modeling_xlnet import XLNET_PRETRAINED_MODEL_ARCHIVE_LIST

--- a/tests/test_optimization_tf.py
+++ b/tests/test_optimization_tf.py
@@ -8,7 +8,8 @@ if is_tf_available():
    import tensorflow as tf
    from tensorflow.python.eager import context
    from tensorflow.python.framework import ops
-    from transformers import create_optimizer, GradientAccumulator
+
+    from transformers import GradientAccumulator, create_optimizer


@require_tf
--- a/tests/test_tokenization_common.py
+++ b/tests/test_tokenization_common.py
@@ -28,11 +28,7 @@ from transformers.tokenization_utils import AddedToken


 if TYPE_CHECKING:
-    from transformers import (
-        PretrainedConfig,
-        PreTrainedModel,
-        TFPreTrainedModel,
-    )
+    from transformers import PretrainedConfig, PreTrainedModel, TFPreTrainedModel


 def merge_model_tokenizer_mappings(
@@ -1398,6 +1394,7 @@ class TokenizerTesterMixin:
    @require_torch
    def test_torch_encode_plus_sent_to_model(self):
        import torch
+
        from transformers import MODEL_MAPPING, TOKENIZER_MAPPING

        MODEL_TOKENIZER_MAPPING = merge_model_tokenizer_mappings(MODEL_MAPPING, TOKENIZER_MAPPING)
--- a/tests/test_tokenization_reformer.py
+++ b/tests/test_tokenization_reformer.py
@@ -232,7 +232,8 @@ class ReformerTokenizationTest(TokenizerTesterMixin, unittest.TestCase):
    @require_torch
    def test_torch_encode_plus_sent_to_model(self):
        import torch
-        from transformers import ReformerModel, ReformerConfig
+
+        from transformers import ReformerConfig, ReformerModel

        # Build sequence
        first_ten_tokens = list(self.big_tokenizer.get_vocab().keys())[:10]
--- a/tests/test_tokenization_transfo_xl.py
+++ b/tests/test_tokenization_transfo_xl.py
@@ -24,7 +24,7 @@ from .test_tokenization_common import TokenizerTesterMixin


 if is_torch_available():
-    from transformers.tokenization_transfo_xl import TransfoXLTokenizer, VOCAB_FILES_NAMES
+    from transformers.tokenization_transfo_xl import VOCAB_FILES_NAMES, TransfoXLTokenizer


@require_torch