Appleから提案されているモバイルデバイス向けのCLIP学習手法とCLIPモデルの論文を読んだ。CVPR 2024で採択されている。論文:MobileCLIP: Fast Image-Text Models throu […]
[論文読み] low FLOPSモデルで大規模事前学習セットを有効活用 ParameterNet: Parameters Are All You Need
低いFLOPSのモデルで大規模な事前学習データセットを活用する際に効果的に学習するモデルを提案している論文を読んだ。論文:ParameterNet: Parameters Are All You Need (CVPR 2 […]
[論文読み] 物体検出に適した事前学習手法を提案 AlignDet: Aligning Pre-training and Fine-tuning in Object Detection
事前学習手法の物体検出への適用時に発生する問題点を挙げて、物体検出に適した事前学習手法を提案しているAlignDet: Aligning Pre-training and Fine-tuning in Object De […]
[論文読み] Vision-Language学習データセットを圧縮:Too Large; Data Reduction for Vision-Language Pre-Training
Vision and Languageモデルの学習には非常に大きなデータセットが必要といわれている。そのデータセットを小さく圧縮する論文があったので読んでみた。論文:Too Large; Data Reduction f […]
[論文読み] シンプルなカリキュラム学習で精度を保って高速化 EfficientTrain: Exploring Generalized Curriculum Learning for Training Visual Backbones
単純なアイデアで学習精度を保ったまま高速化を実現した、カリキュラム学習の論文を読んだ。 論文:EfficientTrain: Exploring Generalized Curriculum Learning for T […]
[論文読み] 高速にunlearningを実現、Boundary Unlearning
読んだ論文:Boundary Unlearning (CVPR 2023) どんなもの? Unlearning手法の一つとしてboundary unlearningという手法を提案。boundary unlearning […]
[論文読み] 未ラベル画像を大量に使用し高精度 Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data
TikTokから出ている単眼深度推定の論文「Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data」を読みました。 URL: https:// […]
[論文読み] NuScenes-MQA: Integrated Evaluation of Captions and QA for Autonomous Driving Datasets using Markup Annotations
LLMを活用して完全自動運転を目指すTuring社からの論文を読みました。 論文:NuScenes-MQA: Integrated Evaluation of Captions and QA for Autonomous […]
[論文読み] Global Features are All You Need for Image Retrieval and Reranking
Global Features are All You Need for Image Retrieval and Reranking (https://arxiv.org/abs/2308.06954) ICCV 202 […]
[論文読み] Tracking Everything Everywhere All at Once
論文:Tracking Everything Everywhere All at Once(ICCV 2023)デモページ:https://omnimotion.github.io/ どんなもの? OmniMotionと […]