LLMを活用して完全自動運転を目指すTuring社からの論文を読みました。 論文:NuScenes-MQA: Integrated Evaluation of Captions and QA for Autonomous […]
[論文読み] Global Features are All You Need for Image Retrieval and Reranking
Global Features are All You Need for Image Retrieval and Reranking (https://arxiv.org/abs/2308.06954) ICCV 202 […]
[論文読み] Tracking Everything Everywhere All at Once
論文:Tracking Everything Everywhere All at Once(ICCV 2023)デモページ:https://omnimotion.github.io/ どんなもの? OmniMotionと […]
[書評]『 大規模言語モデルは新たな知能か』を読んだ
大規模言語モデルに関連する知識を俯瞰的に見につけようと思い、まずは『大規模言語モデルは新たな知能か』から読み始めた。初学者やChatGPTなどのLLMシステムを使用する人が、いったいどのような仕組みで、大規模言語モデルが […]
[論文読み] DeepMAD: Mathematical Architecture Design for Deep Convolutional Neural Network
CNNの構造をmathematical programmingで探索することで短時間で高性能なモデルを探索した論文を読んだのでメモ。 論文:DeepMAD: Mathematical Architecture Desig […]
ChatGPTの技術を活用して、プレゼンを自動で作るSlidesGPT
GPTを活用したサービスの一つとしてスライドを自動で生成するSlidesGPTというサービスが出てきているので、使ってみた。https://slidesgpt.com/index.html 「力学入門」というタイトルでス […]
ChatGPTはプログラマの夢を見るか
ChatGPTは、人工知能によって訓練されたチャットボットであり、プログラマが抱く理想像を具現化することができるか否かは不透明である。プログラマが渇望する夢は、スムーズなコーディングと効率的な開発を可能にすることである。 […]
【論文読み】Point Transformer
一言でいうと Vision Transoformerを使って点群データを処理する方法を考案 論文リンク https://arxiv.org/abs/2012.09164 著者所属機関 Hengshuang Zhao1 L […]
【論文読み】Pre-Trained Image Processing Transformer
一言でいうと Vision Transoformerを使って複数タスクに対応できる画像処理用のネットワークを考案。複数タスクでSoTAを達成。未知のタスクに対してもfine tuningすることで高精度で処理が可能。 論 […]
『5G 大容量・低遅延・他接続のしくみ』を読んだ
最近話題の5Gの概要をつかむためにブルーバックスの『5G 大容量・低遅延・他接続のしくみ』を読んだ。 通信の領域は基本的なことしかわかっていなかったので、携帯電話の黎明期から今日の5Gに至るまでの歴史的な技術の変遷が書か […]