Lysandre
100e3b6f21
Bias should be resized with the weights
...
Created a link between the linear layer bias and the model attribute bias. This does not change anything for the user nor for the conversion scripts, but allows the `resize_token_embeddings` method to resize the bias as well as the weights of the decoder.
Added a test.
2020-01-14 13:43:45 -05:00
..
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-14 13:43:45 -05:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00
2020-01-06 15:11:12 +01:00