iwiwi 備忘録

学んだことを殴り書きます。自分向けのメモです。

2023-04-03から1日間の記事一覧

RoFormer: Enhanced Transformer with Rotary Position Embedding

LLM

arxiv.org GPT-NeoX等で使われているposition embedding。 そもそも三角関数足す元祖のposition embeddingしか知らなかったので、relative position embeddingがどういうものかも知れてよかった。この手法自体は足す(additive)んじゃなくて回転させる(multic…