iwiwi 備忘録

学んだことを殴り書きます。自分向けのメモです。

2023-03-29から1日間の記事一覧

Pythia: A Suite for Analyzing Large Language Models Across Training and Scaling

LLM

arxiv.org EleutherAIの人たちが、学習完了したLLMだけでなく、学習過程の分析をしたい人のために、スナップショットを一杯公開したよ、という話だと理解した。 コードとかも色々あるので参考になるかも。