Trainer (#3800)
* doc
* [tests] Add sample files for a regression task
* [HUGE] Trainer
* Feedback from @sshleifer
* Feedback from @thomwolf + logging tweak
* [file_utils] when downloading concurrently, get_from_cache will use the cached file for subsequent processes
* [glue] Use default max_seq_length of 128 like before
* [glue] move DataTrainingArguments around
* [ner] Change interface of InputExample, and align run_{tf,pl}
* Re-align the pl scripts a little bit
* ner
* [ner] Add integration test
* Fix language_modeling with API tweak
* [ci] Tweak loss target
* Don't break console output
* amp.initialize: model must be on right device before
* [multiple-choice] update for Trainer
* Re-align to 827d6d6ef0
This commit is contained in:
1
examples/tests_samples/.gitignore
vendored
1
examples/tests_samples/.gitignore
vendored
@@ -1,6 +1,7 @@
|
||||
*.*
|
||||
cache*
|
||||
temp*
|
||||
!*.txt
|
||||
!*.tsv
|
||||
!*.json
|
||||
!.gitignore
|
||||
202
examples/tests_samples/GermEval/dev.txt
Normal file
202
examples/tests_samples/GermEval/dev.txt
Normal file
@@ -0,0 +1,202 @@
|
||||
Gleich O
|
||||
darauf O
|
||||
entwirft O
|
||||
er O
|
||||
seine O
|
||||
Selbstdarstellung O
|
||||
" O
|
||||
Ecce B-OTH
|
||||
homo I-OTH
|
||||
" O
|
||||
in O
|
||||
enger O
|
||||
Auseinandersetzung O
|
||||
mit O
|
||||
diesem O
|
||||
Bild O
|
||||
Jesu B-PER
|
||||
. O
|
||||
|
||||
1980 O
|
||||
kam O
|
||||
der O
|
||||
Crown B-OTH
|
||||
als O
|
||||
Versuch O
|
||||
von O
|
||||
Toyota B-ORG
|
||||
, O
|
||||
sich O
|
||||
in O
|
||||
der O
|
||||
Oberen O
|
||||
Mittelklasse O
|
||||
zu O
|
||||
etablieren O
|
||||
, O
|
||||
auch O
|
||||
nach O
|
||||
Deutschland B-LOC
|
||||
. O
|
||||
|
||||
– O
|
||||
4:26 O
|
||||
# O
|
||||
Sometime B-OTH
|
||||
Ago/La I-OTH
|
||||
Fiesta I-OTH
|
||||
– O
|
||||
23:18 O
|
||||
Alle O
|
||||
Stücke O
|
||||
wurden O
|
||||
von O
|
||||
Corea B-PER
|
||||
komponiert O
|
||||
mit O
|
||||
Ausnahme O
|
||||
der O
|
||||
einleitenden O
|
||||
Improvisation O
|
||||
zu O
|
||||
Sometime B-OTH
|
||||
Ago I-OTH
|
||||
. O
|
||||
|
||||
Bis O
|
||||
2013 O
|
||||
steigen O
|
||||
die O
|
||||
Mittel O
|
||||
aus O
|
||||
dem O
|
||||
EU-Budget B-ORGpart
|
||||
auf O
|
||||
rund O
|
||||
120 O
|
||||
Millionen O
|
||||
Euro B-OTH
|
||||
. O
|
||||
|
||||
Daraus O
|
||||
entwickelte O
|
||||
sich O
|
||||
im O
|
||||
Rokoko B-OTH
|
||||
die O
|
||||
Sitte O
|
||||
des O
|
||||
gemeinsamen O
|
||||
Weinens O
|
||||
im O
|
||||
Theater O
|
||||
, O
|
||||
das O
|
||||
die O
|
||||
Standesgrenzen O
|
||||
innerhalb O
|
||||
des O
|
||||
Publikums O
|
||||
überbrücken O
|
||||
sollte O
|
||||
. O
|
||||
|
||||
Die O
|
||||
Spinne O
|
||||
hatte O
|
||||
sie O
|
||||
mit O
|
||||
Seidenfäden O
|
||||
an O
|
||||
ihrem O
|
||||
Schwanz O
|
||||
gefesselt O
|
||||
und O
|
||||
nach O
|
||||
oben O
|
||||
gezogen O
|
||||
. O
|
||||
|
||||
In O
|
||||
Deutschland B-LOC
|
||||
ist O
|
||||
nach O
|
||||
StGB O
|
||||
eine O
|
||||
Anwerbung O
|
||||
für O
|
||||
die O
|
||||
Fremdenlegion O
|
||||
strafbar O
|
||||
. O
|
||||
|
||||
Am O
|
||||
Donnerstag O
|
||||
wird O
|
||||
sich O
|
||||
zeigen O
|
||||
, O
|
||||
ob O
|
||||
die O
|
||||
Idee O
|
||||
der O
|
||||
DLR-Forscher B-ORGpart
|
||||
funktioniert O
|
||||
. O
|
||||
|
||||
Der O
|
||||
sechste O
|
||||
Lauf O
|
||||
der O
|
||||
ADAC B-ORG
|
||||
GT I-ORG
|
||||
Mastersstand O
|
||||
ganz O
|
||||
klar O
|
||||
im O
|
||||
Mittelpunkt O
|
||||
des O
|
||||
Motorsport-Wochenendes O
|
||||
auf O
|
||||
dem O
|
||||
Eurospeedway B-ORG
|
||||
Lausitz I-ORG
|
||||
. O
|
||||
|
||||
Nach O
|
||||
den O
|
||||
schwächeren O
|
||||
Vorgaben O
|
||||
der O
|
||||
Wall B-ORG
|
||||
Street I-ORG
|
||||
vom O
|
||||
Vortag O
|
||||
setzten O
|
||||
die O
|
||||
deutschen B-LOCderiv
|
||||
Standardwerte O
|
||||
ihren O
|
||||
Konsolidierungskurs O
|
||||
fort O
|
||||
. O
|
||||
|
||||
Kolb B-PER
|
||||
war O
|
||||
seit O
|
||||
1986 O
|
||||
im O
|
||||
Turnverein O
|
||||
als O
|
||||
Leiter O
|
||||
tätig O
|
||||
, O
|
||||
darunter O
|
||||
elf O
|
||||
Jahre O
|
||||
als O
|
||||
Hauptleiter O
|
||||
in O
|
||||
der O
|
||||
Männerriege O
|
||||
. O
|
||||
25
examples/tests_samples/GermEval/labels.txt
Normal file
25
examples/tests_samples/GermEval/labels.txt
Normal file
@@ -0,0 +1,25 @@
|
||||
B-LOC
|
||||
B-LOCderiv
|
||||
B-LOCpart
|
||||
B-ORG
|
||||
B-ORGderiv
|
||||
B-ORGpart
|
||||
B-OTH
|
||||
B-OTHderiv
|
||||
B-OTHpart
|
||||
B-PER
|
||||
B-PERderiv
|
||||
B-PERpart
|
||||
I-LOC
|
||||
I-LOCderiv
|
||||
I-LOCpart
|
||||
I-ORG
|
||||
I-ORGderiv
|
||||
I-ORGpart
|
||||
I-OTH
|
||||
I-OTHderiv
|
||||
I-OTHpart
|
||||
I-PER
|
||||
I-PERderiv
|
||||
I-PERpart
|
||||
O
|
||||
200
examples/tests_samples/GermEval/train.txt
Normal file
200
examples/tests_samples/GermEval/train.txt
Normal file
@@ -0,0 +1,200 @@
|
||||
Schartau B-PER
|
||||
sagte O
|
||||
dem O
|
||||
" O
|
||||
Tagesspiegel B-ORG
|
||||
" O
|
||||
vom O
|
||||
Freitag O
|
||||
, O
|
||||
Fischer B-PER
|
||||
sei O
|
||||
" O
|
||||
in O
|
||||
einer O
|
||||
Weise O
|
||||
aufgetreten O
|
||||
, O
|
||||
die O
|
||||
alles O
|
||||
andere O
|
||||
als O
|
||||
überzeugend O
|
||||
war O
|
||||
" O
|
||||
. O
|
||||
|
||||
Firmengründer O
|
||||
Wolf B-PER
|
||||
Peter I-PER
|
||||
Bree I-PER
|
||||
arbeitete O
|
||||
Anfang O
|
||||
der O
|
||||
siebziger O
|
||||
Jahre O
|
||||
als O
|
||||
Möbelvertreter O
|
||||
, O
|
||||
als O
|
||||
er O
|
||||
einen O
|
||||
fliegenden O
|
||||
Händler O
|
||||
aus O
|
||||
dem O
|
||||
Libanon B-LOC
|
||||
traf O
|
||||
. O
|
||||
|
||||
Ob O
|
||||
sie O
|
||||
dabei O
|
||||
nach O
|
||||
dem O
|
||||
Runden O
|
||||
Tisch O
|
||||
am O
|
||||
23. O
|
||||
April O
|
||||
in O
|
||||
Berlin B-LOC
|
||||
durch O
|
||||
ein O
|
||||
pädagogisches O
|
||||
Konzept O
|
||||
unterstützt O
|
||||
wird O
|
||||
, O
|
||||
ist O
|
||||
allerdings O
|
||||
zu O
|
||||
bezweifeln O
|
||||
. O
|
||||
|
||||
Bayern B-ORG
|
||||
München I-ORG
|
||||
ist O
|
||||
wieder O
|
||||
alleiniger O
|
||||
Top- O
|
||||
Favorit O
|
||||
auf O
|
||||
den O
|
||||
Gewinn O
|
||||
der O
|
||||
deutschen B-LOCderiv
|
||||
Fußball-Meisterschaft O
|
||||
. O
|
||||
|
||||
Dabei O
|
||||
hätte O
|
||||
der O
|
||||
tapfere O
|
||||
Schlussmann O
|
||||
allen O
|
||||
Grund O
|
||||
gehabt O
|
||||
, O
|
||||
sich O
|
||||
viel O
|
||||
früher O
|
||||
aufzuregen O
|
||||
. O
|
||||
|
||||
ARD-Programmchef B-ORGpart
|
||||
Günter B-PER
|
||||
Struve I-PER
|
||||
war O
|
||||
wegen O
|
||||
eines O
|
||||
vierwöchigen O
|
||||
Urlaubs O
|
||||
für O
|
||||
eine O
|
||||
Stellungnahme O
|
||||
nicht O
|
||||
erreichbar O
|
||||
. O
|
||||
|
||||
Alternativ O
|
||||
sollten O
|
||||
sich O
|
||||
die O
|
||||
Restaurantbetreiber O
|
||||
aus O
|
||||
Sicht O
|
||||
der O
|
||||
Solingerin B-LOCderiv
|
||||
zu O
|
||||
längeren O
|
||||
Öffnungszeiten O
|
||||
verpflichten O
|
||||
, O
|
||||
um O
|
||||
wartende O
|
||||
Kunden O
|
||||
aufzunehmen O
|
||||
. O
|
||||
|
||||
Die O
|
||||
Deutsche B-ORG
|
||||
Flugsicherung I-ORG
|
||||
( O
|
||||
DFS B-ORG
|
||||
) O
|
||||
beschloss O
|
||||
ein O
|
||||
Flugverbot O
|
||||
für O
|
||||
alle O
|
||||
internationalen O
|
||||
Flughäfen O
|
||||
mit O
|
||||
Ausnahme O
|
||||
der O
|
||||
beiden O
|
||||
Berliner B-LOCderiv
|
||||
Flughäfen O
|
||||
bis O
|
||||
2.00 O
|
||||
Uhr O
|
||||
nachts O
|
||||
. O
|
||||
|
||||
New O
|
||||
Small O
|
||||
Family O
|
||||
mit O
|
||||
E-Motor O
|
||||
: O
|
||||
Studie O
|
||||
E-Up O
|
||||
! O
|
||||
|
||||
Eine O
|
||||
Schwachstelle O
|
||||
war O
|
||||
beispielsweise O
|
||||
der O
|
||||
Spiegelkasten O
|
||||
. O
|
||||
|
||||
Denn O
|
||||
durch O
|
||||
den O
|
||||
Einsatz O
|
||||
moderner O
|
||||
Fahrzeugtechnik O
|
||||
( O
|
||||
Dieseltriebwagen O
|
||||
) O
|
||||
und O
|
||||
schalldämmender O
|
||||
Fenster O
|
||||
entsteht O
|
||||
keine O
|
||||
Einschränkung O
|
||||
der O
|
||||
Wohnqualität O
|
||||
. O
|
||||
10
examples/tests_samples/STS-B/dev.tsv
Normal file
10
examples/tests_samples/STS-B/dev.tsv
Normal file
@@ -0,0 +1,10 @@
|
||||
index genre filename year old_index source1 source2 sentence1 sentence2 score
|
||||
0 main-captions MSRvid 2012test 0000 none none A man with a hard hat is dancing. A man wearing a hard hat is dancing. 5.000
|
||||
1 main-captions MSRvid 2012test 0002 none none A young child is riding a horse. A child is riding a horse. 4.750
|
||||
2 main-captions MSRvid 2012test 0003 none none A man is feeding a mouse to a snake. The man is feeding a mouse to the snake. 5.000
|
||||
3 main-captions MSRvid 2012test 0007 none none A woman is playing the guitar. A man is playing guitar. 2.400
|
||||
4 main-captions MSRvid 2012test 0008 none none A woman is playing the flute. A man is playing a flute. 2.750
|
||||
5 main-captions MSRvid 2012test 0010 none none A woman is cutting an onion. A man is cutting onions. 2.615
|
||||
6 main-captions MSRvid 2012test 0015 none none A man is erasing a chalk board. The man is erasing the chalk board. 5.000
|
||||
7 main-captions MSRvid 2012test 0023 none none A woman is carrying a boy. A woman is carrying her baby. 2.333
|
||||
8 main-captions MSRvid 2012test 0027 none none Three men are playing guitars. Three men are on stage playing guitars. 3.750
|
||||
|
10
examples/tests_samples/STS-B/train.tsv
Normal file
10
examples/tests_samples/STS-B/train.tsv
Normal file
@@ -0,0 +1,10 @@
|
||||
index genre filename year old_index source1 source2 sentence1 sentence2 score
|
||||
0 main-captions MSRvid 2012test 0001 none none A plane is taking off. An air plane is taking off. 5.000
|
||||
1 main-captions MSRvid 2012test 0004 none none A man is playing a large flute. A man is playing a flute. 3.800
|
||||
2 main-captions MSRvid 2012test 0005 none none A man is spreading shreded cheese on a pizza. A man is spreading shredded cheese on an uncooked pizza. 3.800
|
||||
3 main-captions MSRvid 2012test 0006 none none Three men are playing chess. Two men are playing chess. 2.600
|
||||
4 main-captions MSRvid 2012test 0009 none none A man is playing the cello. A man seated is playing the cello. 4.250
|
||||
5 main-captions MSRvid 2012test 0011 none none Some men are fighting. Two men are fighting. 4.250
|
||||
6 main-captions MSRvid 2012test 0012 none none A man is smoking. A man is skating. 0.500
|
||||
7 main-captions MSRvid 2012test 0013 none none The man is playing the piano. The man is playing the guitar. 1.600
|
||||
8 main-captions MSRvid 2012test 0014 none none A man is playing on a guitar and singing. A woman is playing an acoustic guitar and singing. 2.200
|
||||
|
Reference in New Issue
Block a user