論文 | 10001 ideas

[論文読み] 高速なOpen Vocabulary 物体検出 YOLO-World: Real-Time Open-Vocabulary Object Detection

高速にOpen Vocabulary物体検出を行う手法の論文を読んだ。YOLO-World: Real-Time Open-Vocabulary Object Detection (CVPR 2024) どんなもの？ O […]

ICLR 2024の論文を読んだ。Visionモデルをfinetuneする際にSGDを使って最初の層をfreezeすることで、AdamWと同程度の性能を少ないメモリ消費量で実現できる。論文：HOW TO FINE-TUN […]

CVPR 2024に採択されている、Vision&Languageにより自動運転タスクの性能向上を行う論文を読んだ。著者らはSyracuse大学とBosch Research所属。論文：VLP: Vision L […]

Appleから提案されているモバイルデバイス向けのCLIP学習手法とCLIPモデルの論文を読んだ。CVPR 2024で採択されている。論文：MobileCLIP: Fast Image-Text Models throu […]

低いFLOPSのモデルで大規模な事前学習データセットを活用する際に効果的に学習するモデルを提案している論文を読んだ。論文：ParameterNet: Parameters Are All You Need (CVPR 2 […]

事前学習手法の物体検出への適用時に発生する問題点を挙げて、物体検出に適した事前学習手法を提案しているAlignDet: Aligning Pre-training and Fine-tuning in Object De […]

単純なアイデアで学習精度を保ったまま高速化を実現した、カリキュラム学習の論文を読んだ。論文：EfficientTrain: Exploring Generalized Curriculum Learning for T […]

読んだ論文：Boundary Unlearning (CVPR 2023) どんなもの？ Unlearning手法の一つとしてboundary unlearningという手法を提案。boundary unlearning […]

TikTokから出ている単眼深度推定の論文「Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data」を読みました。 URL: https:// […]

LLMを活用して完全自動運転を目指すTuring社からの論文を読みました。論文：NuScenes-MQA: Integrated Evaluation of Captions and QA for Autonomous […]