Search result of “user:sakai1250”

@sakai1250(sakai 1250)

2026/03/16

論文解説】画像や動画の「あらゆる概念」をセグメンテーションするSAM 3の登場！

1. 概要本記事では、Segment Anything Model、通称SAMシリーズの最新版「SAM 3: Segment Anything with Concepts」の論文を解説します。...

0

Comment0

@sakai1250(sakai 1250)

2025/12/09

Stochastic Activations: SILU と RELU をランダムに切り替えて最適化とスパース性を両立する手法

Stochastic Activations: SILU と RELU をランダムに切り替えて最適化とスパース性を両立する手法背景トークン効率とスパース性の問題大規模言語モデルは、Feed...

2

1

Comment0

@sakai1250(sakai 1250)

2025/12/09

複素波埋め込みによる意味検索手法「ResonanceDB」

Wave-Based Semantic Memory 背景意味検索では、多くのシステムがembeddingを保存し、cosine similarityによって検索対象との距離を測ってきた。こ...

0

Comment0

@sakai1250(sakai 1250)

2025/12/09

Kimi K2 Thinkingが何をしてるのかまとめてみた

Kimi K2は何をしているのか Muon の学習不安定性と QK-Clip、MuonClip、Self-Critique RL のポイント背景大規模言語モデルの性能は、どれだけ効率よくトー...

1

0

Comment0

@sakai1250(sakai 1250)

2024/03/20

【ICLR2024】解決策は「トークンの捨て場」を作ることだった？（Vision Transformers Need Registers）

Vision Transformers Need Registers: 解説概要この記事では、視覚表現学習におけるVision Transformer（ViT）の改善策を提案する論文「Vis...

9

10

Comment1

@sakai1250(sakai 1250)

2024/12/22

Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction：画像生成における自己回帰モデル(VAR)

画像生成における自己回帰モデル(VAR) この記事について本記事は「Visual Autoregressive Modeling: Scalable Image Generation via ...

1

2

Comment0

@sakai1250(sakai 1250)

2025/08/03

【ICCV2025】Mambaは低周波が得意？周波数で処理を分ける「TinyViM」

最近、Transformerに代わる新しいモデルとして「Mamba」が注目されています。連続的なデータを扱うのが得意で、計算量も少ないのが利点です。ただ、画像認識の世界、特にスマホのような軽...

1

0

Comment0

@sakai1250(sakai 1250)

2025/07/27

【CVPR2024】NICE: 脳神経科学に着想を得たReplay-freeなClass Incremental Learning

Deep Neural Networksは、独立同分布を前提とした静的なデータセット上で絶大な性能を発揮する一方で、動的な環境下で逐次的に知識を蓄積するContinual Learning (C...

0

1

Comment0

@sakai1250(sakai 1250)

2025/07/21

【ICCV2025】点追跡を”長距離オプティカルフロー”と見なして高解像度・高速・高精度を実現した「AllTracker」

【論文読み】今回は2025年6月に発表された、点追跡（Point Tracking）の分野で大きな注目を集めている「AllTracker」という論文を読んでいきます。論文: AllTrack...

0

1

Comment0

@sakai1250(sakai 1250)

2025/03/29

Ubuntu コマンド逆引きチートシート

Ubuntu コマンド逆引きチートシート Ubuntuを使っていると、「こういう操作がしたいけど、どのコマンドを使えばいいのだろう？」と思うことが多いかもしれません。ここでは、よくある目的ごと...

2

1

Comment0

@sakai1250(sakai 1250)

2024/12/30

Mamba特集～NeurIPS2024編～

※まとめができ次第，随時更新中です！！はじめに 12/10～12/15にバンクーバーで開催されたNeurips2024の数ある論文の中で、今年注目が集まっているMambaに関する論文を集めまし...

3

2

Comment0

@sakai1250(sakai 1250)

2023/07/08

SwiftUIの入門に見るべきサイト

※追記 Swiftを学び初めて1年、ついにiOSアプリをリリースしました!!! LINEヤフー株式会社様主催のHackU2023でも賞をいただくことができました...!! ・毎日の服の上下の組み...

32

Comment0

@sakai1250(sakai 1250)

2024/03/20

画像分野のMamba, "Vision Mamba"

はじめに画像処理分野では、アテンションマップを用いたViT（Vision Transformer）の登場によりさらなる発展を遂げてきました。しかし、ViTによる高解像度画像の処理における計算コ...

6

7

Comment0

@sakai1250(sakai 1250)

2024/07/21

【CVPR2024】継続学習の新手法：干渉のない低ランク適応（InfLoRA）

【CVPR2024】継続学習の新手法：干渉のない低ランク適応（InfLoRA）概要この記事では、CVPR 2024で発表予定の論文「InfLoRA: Interference-Free Lo...

0

Comment0

@sakai1250(sakai 1250)

2024/12/22

GPUの性能を最大限引き出す！FlashRNNによる50倍高速化

GPUの性能を最大限引き出す！FlashRNNによる50倍高速化はじめに近年、自然言語処理や時系列予測などの分野では、Transformerに代表されるシーケンス並列化可能なニューラルネット...

0

Comment0

@sakai1250(sakai 1250)

2024/12/01

SAM2を上回る！？「SAMURAI」

SAMモデルをベースにした高精度な物体追跡手法「SAMURAI」 SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tr...

3

1

Comment0

@sakai1250(sakai 1250)

2024/12/01

【ECCV2024】Vision Transformerの特徴マップを高密度化する軽量な変換手法「LiFT」

Vision Transformerの特徴マップを高密度化する軽量な変換手法「LiFT」 LiFT: A Surprisingly Simple Lightweight Feature Tran...

0

Comment0

@sakai1250(sakai 1250)

2024/09/25

【ECCV2024】Few-shot Class-incremental Learning: 中間特徴の潜在能力を引き出す新手法

Few-shot Class-incremental Learning: 中間特徴の潜在能力を引き出す新手法 1. 概要本記事では、「Rethinking Few-shot Class-inc...

1

Comment0

@sakai1250(sakai 1250)

2024/09/25

【ECCV2024】DQ-DETR: 動的クエリを用いた小物体検出のための新しいDETRモデル

1. 概要本研究では、航空画像における小物体検出のための新しいDETRモデル「DQ-DETR」を提案しています。従来のDETRモデルは固定数のオブジェクトクエリを使用するため、画像内のオブジェ...

3

Comment0

@sakai1250(sakai 1250)

2024/09/25

【ECCV2024】Vision Transformerの性能向上: CLIPを活用した忘却の軽減と適応的パラメータ融合

【ECCV2024】Vision Transformerの性能向上: テキスト特徴量を活用した忘却の軽減と適応的パラメータ融合 1. 概要本研究では、大規模な視覚言語事前学習モデルCLIPを用...

0

1

Comment0

Search article