2023-03-18から1日間の記事一覧

2023-03-18

Learning Transferable Visual Models From Natural Language Supervision

LLM 拡散モデル

arxiv.org 概要 CLIPの論文。CLIPのtext encoderがstable diffusionでも使われている。画像認識の基盤モデルを作る試み。膨大な(image, text)ペアから事前学習し、ImageNet1kを含む様々なタスクをゼロショットで（classに対応するtext指定するだけで）めち…

iwiwi 備忘録

学んだことを殴り書きます。自分向けのメモです。

2023-03-18から1日間の記事一覧

Learning Transferable Visual Models From Natural Language Supervision