Hiro | 10001 ideas

[論文読み] Vision-Language学習データセットを圧縮：Too Large; Data Reduction for Vision-Language Pre-Training

Vision and Languageモデルの学習には非常に大きなデータセットが必要といわれている。そのデータセットを小さく圧縮する論文があったので読んでみた。論文：Too Large; Data Reduction f […]

単純なアイデアで学習精度を保ったまま高速化を実現した、カリキュラム学習の論文を読んだ。論文：EfficientTrain: Exploring Generalized Curriculum Learning for T […]

読んだ論文：Boundary Unlearning (CVPR 2023) どんなもの？ Unlearning手法の一つとしてboundary unlearningという手法を提案。boundary unlearning […]

TikTokから出ている単眼深度推定の論文「Depth Anything: Unleashing the Power of Large-Scale Unlabeled Data」を読みました。 URL: https:// […]

LLMを活用して完全自動運転を目指すTuring社からの論文を読みました。論文：NuScenes-MQA: Integrated Evaluation of Captions and QA for Autonomous […]

Global Features are All You Need for Image Retrieval and Reranking (https://arxiv.org/abs/2308.06954) ICCV 202 […]

論文：Tracking Everything Everywhere All at Once（ICCV 2023）デモページ：https://omnimotion.github.io/ どんなもの？ OmniMotionと […]

大規模言語モデルに関連する知識を俯瞰的に見につけようと思い、まずは『大規模言語モデルは新たな知能か』から読み始めた。初学者やChatGPTなどのLLMシステムを使用する人が、いったいどのような仕組みで、大規模言語モデルが […]

CNNの構造をmathematical programmingで探索することで短時間で高性能なモデルを探索した論文を読んだのでメモ。論文：DeepMAD: Mathematical Architecture Desig […]

GPTを活用したサービスの一つとしてスライドを自動で生成するSlidesGPTというサービスが出てきているので、使ってみた。https://slidesgpt.com/index.html 「力学入門」というタイトルでス […]