ITエンジニアの転職にフォーカスした本が発売されたので読んでみた。結論としては、体系だってまとめられており、転職に一歩踏み出すエンジニアに向けては参考になる部分が多い本だと言える。 ITエンジニアには同一企業で昇給を目指 […]
Physical AIの幕開け:「基盤モデル×ロボット」で何が起きているのか?
ここ最近、「Physical AI」という概念がバズワードのように盛り上がりつつあるのを感じる。 ロボットなどの身体性を持った機械にAIを組み込んでいく、という流れがいよいよ本格化してきた。 従来のLLMや画像認識AIと […]
書評:人が壊れるマネジメントプロジェクトを始める前に知っておきたいアンチパターン 50
『人が壊れるマネジメント プロジェクトを始める前に知っておきたいアンチパターン50』を読んだ。よくあるマネジメントの本に書かれているマネージャーとしてのあり方だけにとどまらず、メンバーのメンタルが壊れてしまうアンチパター […]
[論文読み] Visualizing the Loss Landscape of Neural Nets (NeurIPS 2018)
タイトル:Visualizing the Loss Landscape of Neural Nets 著者、所属: どんなもの?本論文は、ニューラルネットワークの学習における非凸の損失関数(ロスランドスケープ)を高解像度 […]
LLMを用いた効果的なVisual Perception, PerceptionGPT: Effectively Fusing Visual Perception into LLM
LLMとVisual Perceptionを組み合わせた論文を読んだ。論文:PerceptionGPT: Effectively Fusing Visual Perception into LLM (CVPR 2024) […]
Single headで高効率なViTを提案:SHViT: Single-Head Vision Transformer with Memory Efficient Macro Design
ViTの構造を見直すことで高効率なアーキテクチャを提案している論文を読んだ。論文:SHViT: Single-Head Vision Transformer with Memory Efficient Macro Des […]
[論文読み] Synthetic画像でのScaling則:Scaling Laws of Synthetic Images for Model Training … for Now
論文:Scaling Laws of Synthetic Images for Model Training … for Now (CVPR 2024) どんなもの? Synthetic Dataを用いてモデルを学習した […]
[論文読み] 高速なOpen Vocabulary 物体検出 YOLO-World: Real-Time Open-Vocabulary Object Detection
高速にOpen Vocabulary物体検出を行う手法の論文を読んだ。YOLO-World: Real-Time Open-Vocabulary Object Detection (CVPR 2024) どんなもの? O […]
[論文読み] SGDでVisionモデルをfinetuneするときは最初の層をfreezeする:HOW TO FINE-TUNE VISION MODELS WITH SGD
ICLR 2024の論文を読んだ。Visionモデルをfinetuneする際にSGDを使って最初の層をfreezeすることで、AdamWと同程度の性能を少ないメモリ消費量で実現できる。論文:HOW TO FINE-TUN […]
[論文読み] Vision&Languageによる自動運転タスクの精度向上:VLP: Vision Language Planning for Autonomous Driving
CVPR 2024に採択されている、Vision&Languageにより自動運転タスクの性能向上を行う論文を読んだ。著者らはSyracuse大学とBosch Research所属。論文:VLP: Vision L […]