[model_cards] xlnet_chinese_large & roberta_chinese_large

2020-04-24 16:12:42 -04:00
parent 623ba0236d
commit 73d6a2f901
6 changed files with 84 additions and 0 deletions
--- a/model_cards/clue/albert_chinese_small/README.md
+++ b/model_cards/clue/albert_chinese_small/README.md
@@ -1,3 +1,7 @@
 ---
 language: chinese
 ---
 ## albert_chinese_small
 ### Overview
--- a/model_cards/clue/albert_chinese_tiny/README.md
+++ b/model_cards/clue/albert_chinese_tiny/README.md
@@ -1,3 +1,7 @@
 ---
 language: chinese
 ---
 ## albert_chinese_tiny
 ### Overview
--- a/model_cards/clue/roberta_chinese_3L312_clue_tiny/README.md
+++ b/model_cards/clue/roberta_chinese_3L312_clue_tiny/README.md
@@ -1,3 +1,7 @@
 ---
 language: chinese
 ---
 # Introduction
 This model was trained on TPU and the details are as follows:
--- a/model_cards/clue/roberta_chinese_base/README.md
+++ b/model_cards/clue/roberta_chinese_base/README.md
@@ -1,3 +1,7 @@
 ---
 language: chinese
 ---
 ## roberta_chinese_base
 ### Overview
--- a/model_cards/clue/roberta_chinese_large/README.md
+++ b/model_cards/clue/roberta_chinese_large/README.md
@@ -0,0 +1,35 @@
 ---
 language: chinese
 ---
 ## roberta_chinese_large
 ### Overview
 **Language model:** roberta-large
 **Model size:** 1.2G
 **Language:** Chinese
 **Training data:** [CLUECorpusSmall](https://github.com/CLUEbenchmark/CLUECorpus2020)
 **Eval data:** [CLUE dataset](https://github.com/CLUEbenchmark/CLUE)
 ### Results
 For results on downstream tasks like text classification, please refer to [this repository](https://github.com/CLUEbenchmark/CLUE).
 ### Usage
 **NOTE:** You have to call **BertTokenizer** instead of RobertaTokenizer !!!
 ```
 import torch
 from transformers import BertTokenizer, BertModel
 tokenizer = BertTokenizer.from_pretrained("clue/roberta_chinese_large")
 roberta = BertModel.from_pretrained("clue/roberta_chinese_large")
 ```
 ### About CLUE benchmark
 Organization of Language Understanding Evaluation benchmark for Chinese: tasks & datasets, baselines, pre-trained Chinese models, corpus and leaderboard.
 Github: https://github.com/CLUEbenchmark
 Website: https://www.cluebenchmarks.com/
--- a/model_cards/clue/xlnet_chinese_large/README.md
+++ b/model_cards/clue/xlnet_chinese_large/README.md
@@ -0,0 +1,33 @@
 ---
 language: chinese
 ---
 ## xlnet_chinese_large
 ### Overview
 **Language model:** xlnet-large
 **Model size:** 1.3G
 **Language:** Chinese
 **Training data:** [CLUECorpusSmall](https://github.com/CLUEbenchmark/CLUECorpus2020)
 **Eval data:** [CLUE dataset](https://github.com/CLUEbenchmark/CLUE)
 ### Results
 For results on downstream tasks like text classification, please refer to [this repository](https://github.com/CLUEbenchmark/CLUE).
 ### Usage
 ```
 import torch
 from transformers import XLNetTokenizer,XLNetModel
 tokenizer = XLNetTokenizer.from_pretrained("clue/xlnet_chinese_large")
 xlnet = XLNetModel.from_pretrained("clue/xlnet_chinese_large")
 ```
 ### About CLUE benchmark
 Organization of Language Understanding Evaluation benchmark for Chinese: tasks & datasets, baselines, pre-trained Chinese models, corpus and leaderboard.
 Github: https://github.com/CLUEbenchmark
 Website: https://www.cluebenchmarks.com/