高速にOpen Vocabulary物体検出を行う手法の論文を読んだ。YOLO-World: Real-Time Open-Vocabulary Object Detection (CVPR 2024) どんなもの? O […]
タグ: 論文
[論文読み] SGDでVisionモデルをfinetuneするときは最初の層をfreezeする:HOW TO FINE-TUNE VISION MODELS WITH SGD
ICLR 2024の論文を読んだ。Visionモデルをfinetuneする際にSGDを使って最初の層をfreezeすることで、AdamWと同程度の性能を少ないメモリ消費量で実現できる。論文:HOW TO FINE-TUN […]
[論文読み] Vision&Languageによる自動運転タスクの精度向上:VLP: Vision Language Planning for Autonomous Driving
CVPR 2024に採択されている、Vision&Languageにより自動運転タスクの性能向上を行う論文を読んだ。著者らはSyracuse大学とBosch Research所属。論文:VLP: Vision L […]
[論文読み] モバイルデバイス向けの効果的なCLIP学習手法:MobileCLIP: Fast Image-Text Models through Multi-Modal Reinforced Training
Appleから提案されているモバイルデバイス向けのCLIP学習手法とCLIPモデルの論文を読んだ。CVPR 2024で採択されている。論文:MobileCLIP: Fast Image-Text Models throu […]
[論文読み] low FLOPSモデルで大規模事前学習セットを有効活用 ParameterNet: Parameters Are All You Need
低いFLOPSのモデルで大規模な事前学習データセットを活用する際に効果的に学習するモデルを提案している論文を読んだ。論文:ParameterNet: Parameters Are All You Need (CVPR 2 […]
[論文読み] 物体検出に適した事前学習手法を提案 AlignDet: Aligning Pre-training and Fine-tuning in Object Detection
事前学習手法の物体検出への適用時に発生する問題点を挙げて、物体検出に適した事前学習手法を提案しているAlignDet: Aligning Pre-training and Fine-tuning in Object De […]
[論文読み] シンプルなカリキュラム学習で精度を保って高速化 EfficientTrain: Exploring Generalized Curriculum Learning for Training Visual Backbones
単純なアイデアで学習精度を保ったまま高速化を実現した、カリキュラム学習の論文を読んだ。 論文:EfficientTrain: Exploring Generalized Curriculum Learning for T […]
[論文読み] 高速にunlearningを実現、Boundary Unlearning
読んだ論文:Boundary Unlearning (CVPR 2023) どんなもの? Unlearning手法の一つとしてboundary unlearningという手法を提案。boundary unlearning […]
[論文読み] 未ラベル画像を大量に使用し高精度 Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data
TikTokから出ている単眼深度推定の論文「Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data」を読みました。 URL: https:// […]
[論文読み] NuScenes-MQA: Integrated Evaluation of Captions and QA for Autonomous Driving Datasets using Markup Annotations
LLMを活用して完全自動運転を目指すTuring社からの論文を読みました。 論文:NuScenes-MQA: Integrated Evaluation of Captions and QA for Autonomous […]