LLMとVisual Perceptio…
ViTの構造を見直すことで高効率なアーキ…
論文:Scaling Laws of S…
高速にOpen Vocabulary物体…
ICLR 2024の論文を読んだ。Vis…
CVPR 2024に採択されている、Vi…
Appleから提案されているモバイルデバ…
低いFLOPSのモデルで大規模な事前学習…
事前学習手法の物体検出への適用時に発生す…
Vision and Languageモ…