10001 ideas

[論文読み] Visualizing the Loss Landscape of Neural Nets (NeurIPS 2018)

タイトル：Visualizing the Loss Landscape of Neural Nets 著者、所属：どんなもの？本論文は、ニューラルネットワークの学習における非凸の損失関数（ロスランドスケープ）を高解像度 […]

LLMとVisual Perceptionを組み合わせた論文を読んだ。論文：PerceptionGPT: Effectively Fusing Visual Perception into LLM (CVPR 2024) […]

ViTの構造を見直すことで高効率なアーキテクチャを提案している論文を読んだ。論文：SHViT: Single-Head Vision Transformer with Memory Efficient Macro Des […]

論文：Scaling Laws of Synthetic Images for Model Training … for Now (CVPR 2024) どんなもの？ Synthetic Dataを用いてモデルを学習した […]

高速にOpen Vocabulary物体検出を行う手法の論文を読んだ。YOLO-World: Real-Time Open-Vocabulary Object Detection (CVPR 2024) どんなもの？ O […]

ICLR 2024の論文を読んだ。Visionモデルをfinetuneする際にSGDを使って最初の層をfreezeすることで、AdamWと同程度の性能を少ないメモリ消費量で実現できる。論文：HOW TO FINE-TUN […]

CVPR 2024に採択されている、Vision&Languageにより自動運転タスクの性能向上を行う論文を読んだ。著者らはSyracuse大学とBosch Research所属。論文：VLP: Vision L […]

Appleから提案されているモバイルデバイス向けのCLIP学習手法とCLIPモデルの論文を読んだ。CVPR 2024で採択されている。論文：MobileCLIP: Fast Image-Text Models throu […]

低いFLOPSのモデルで大規模な事前学習データセットを活用する際に効果的に学習するモデルを提案している論文を読んだ。論文：ParameterNet: Parameters Are All You Need (CVPR 2 […]

事前学習手法の物体検出への適用時に発生する問題点を挙げて、物体検出に適した事前学習手法を提案しているAlignDet: Aligning Pre-training and Fine-tuning in Object De […]