CURRENT RESEARCH

POMDP-based Multi-Agent
Attack Modeling System

部分観測マルコフ決定過程を基盤とした協調型マルチエージェント攻撃モデルの構築と、 次世代サイバーセキュリティ防御システムへの応用研究

研究概要

本研究は、単一エージェントのPOMDPモデルを協調型マルチエージェントシステム(MAS)へと拡張し、 複数のマルウェアが信念状態を共有しながら協調的に行動する高度な攻撃モデルの構築を目指しています。 これにより、現実の高度標的型攻撃(APT)をより正確にモデル化し、 効果的な防御戦略の開発につなげることを目的としています。

主要な研究要素

01

部分観測性

攻撃者は防御システムの完全な状態を観測できない環境下で、 限られた情報から最適な行動を選択する必要があります。

02

信念状態共有

複数のエージェントが観測結果と信念状態を共有し、 協調的な意思決定を実現するメカニズムを設計します。

03

通信最適化

エージェント間の通信頻度と量を最適化し、 検知リスクを最小化しながら協調効果を最大化します。

技術的アプローチ

手法候補

  • 協調学習アルゴリズム:
    Dec-POMDP (小規模最適)
    MADDPG (連続制御)
    IQL (軽量ベースライン)
  • 共有知識モデル:
    信念状態の共有

評価指標

  • 評価項目:
    攻撃成功率
    検知率
    平均手数
  • 評価目標:
    攻撃成功率80%以上
    検知率20%以下

研究計画

Phase 1: 基盤構築

POMDPモデルの実装と単体エージェントの意思決定アルゴリズム開発

2025 Q1-Q2

Phase 2: MAS拡張

マルチエージェントシステムへの拡張と信念状態共有メカニズムの設計

2025 Q3-Q4

Phase 3: 最適化

通信プロトコルの最適化と検知回避戦略の実装

2026 Q1-Q2

Phase 4: 評価・検証

実環境シミュレーションと防御システムへの応用

2026 Q3-Q4

期待される成果