LLMとVisual Perceptionを組み合わせた論文を読んだ。論文:PerceptionGPT: Effectively Fusing Visual Perception into LLM (CVPR 2024) […]
月: 2024年5月
Single headで高効率なViTを提案:SHViT: Single-Head Vision Transformer with Memory Efficient Macro Design
ViTの構造を見直すことで高効率なアーキテクチャを提案している論文を読んだ。論文:SHViT: Single-Head Vision Transformer with Memory Efficient Macro Des […]