From 5e7f085fcc944ca3c6f99a34ff1cad6a38ef6685 Mon Sep 17 00:00:00 2001 From: Joaq <55513213+jQuinRivero@users.noreply.github.com> Date: Wed, 25 May 2022 19:46:53 -0300 Subject: [PATCH] Added es version of bertology.mdx doc (#17255) * added bertology es doc * toctree fix * Update docs/source/es/bertology.mdx Co-authored-by: Omar U. Espejel * Update docs/source/es/bertology.mdx Co-authored-by: Omar U. Espejel * Update docs/source/es/bertology.mdx Co-authored-by: Omar U. Espejel * change position of bertology in _toctree.yml Co-authored-by: Omar U. Espejel --- docs/source/es/_toctree.yml | 2 ++ docs/source/es/bertology.mdx | 36 ++++++++++++++++++++++++++++++++++++ 2 files changed, 38 insertions(+) create mode 100644 docs/source/es/bertology.mdx diff --git a/docs/source/es/_toctree.yml b/docs/source/es/_toctree.yml index 6d65dbcf00..5014aef757 100644 --- a/docs/source/es/_toctree.yml +++ b/docs/source/es/_toctree.yml @@ -33,4 +33,6 @@ - sections: - local: philosophy title: Filosofía + - local: bertology + title: BERTología title: Guías conceptuales \ No newline at end of file diff --git a/docs/source/es/bertology.mdx b/docs/source/es/bertology.mdx new file mode 100644 index 0000000000..4a3a1e551b --- /dev/null +++ b/docs/source/es/bertology.mdx @@ -0,0 +1,36 @@ + + +# BERTología + +Hay un creciente campo de estudio empeñado en la investigación del funcionamiento interno de los transformers de gran escala como BERT +(que algunos llaman "BERTología"). Algunos buenos ejemplos de este campo son: + + +- BERT Rediscovers the Classical NLP Pipeline por Ian Tenney, Dipanjan Das, Ellie Pavlick: + https://arxiv.org/abs/1905.05950 +- Are Sixteen Heads Really Better than One? por Paul Michel, Omer Levy, Graham Neubig: https://arxiv.org/abs/1905.10650 +- What Does BERT Look At? An Analysis of BERT's Attention por Kevin Clark, Urvashi Khandelwal, Omer Levy, Christopher D. + Manning: https://arxiv.org/abs/1906.04341 + +Para asistir al desarrollo de este nuevo campo, hemos incluido algunas features adicionales en los modelos BERT/GPT/GPT-2 para +ayudar a acceder a las representaciones internas, principalmente adaptado de la gran obra de Paul Michel +(https://arxiv.org/abs/1905.10650): + + +- accediendo a todos los hidden-states de BERT/GPT/GPT-2, +- accediendo a todos los pesos de atención para cada head de BERT/GPT/GPT-2, +- adquiriendo los valores de salida y gradientes de las heads para poder computar la métrica de importancia de las heads y realizar la poda de heads como se explica + en https://arxiv.org/abs/1905.10650. + +Para ayudarte a entender y usar estas features, hemos añadido un script específico de ejemplo: [bertology.py](https://github.com/huggingface/transformers/tree/main/examples/research_projects/bertology/run_bertology.py) mientras extraes información y cortas un modelo pre-entrenado en +GLUE.