Escolar Documentos
Profissional Documentos
Cultura Documentos
Transformer
Transformer - Intuição
Ideia principal:
- 2 sequências (iguais no caso de self attention – auto atenção), A e B
- Calcular como cada elemento de A está relacionado a cada elemento de B
- Depois recombinamos A de acordo com essa relação
joy
tree
despair
Scaled-dot product
example:
Scaled-dot product
V_len
Q_len
Attention layer
1 0 0 0 0
1 1 0 0 0
1 1 1 0 0
*
1 1 1 1 0
1 1 1 1 1 I am happy
<SOS> am happy
Sem convoluções
Sem recorrência