部分観測マルコフ決定過程を基盤とした協調型マルチエージェント攻撃モデルの構築と、 次世代サイバーセキュリティ防御システムへの応用研究
本研究は、単一エージェントのPOMDPモデルを協調型マルチエージェントシステム(MAS)へと拡張し、 複数のマルウェアが信念状態を共有しながら協調的に行動する高度な攻撃モデルの構築を目指しています。 これにより、現実の高度標的型攻撃(APT)をより正確にモデル化し、 効果的な防御戦略の開発につなげることを目的としています。
攻撃者は防御システムの完全な状態を観測できない環境下で、 限られた情報から最適な行動を選択する必要があります。
複数のエージェントが観測結果と信念状態を共有し、 協調的な意思決定を実現するメカニズムを設計します。
エージェント間の通信頻度と量を最適化し、 検知リスクを最小化しながら協調効果を最大化します。
┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ Agent A │────▶│ Belief │◀────│ Agent B │ │ (POMDP) │ │ Sharing │ │ (POMDP) │ └─────────────┘ └─────────────┘ └─────────────┘ │ │ │ ▼ ▼ ▼ ┌─────────────────────────────────────────────────┐ │ Target System Environment │ │ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ │ │ Sensor │ │ Defense │ │ Honeypot│ │ │ └─────────┘ └─────────┘ └─────────┘ │ └─────────────────────────────────────────────────┘
POMDPモデルの実装と単体エージェントの意思決定アルゴリズム開発
マルチエージェントシステムへの拡張と信念状態共有メカニズムの設計
通信プロトコルの最適化と検知回避戦略の実装
実環境シミュレーションと防御システムへの応用