2026年1月 | テックカイセツ

【検証】LLMはミニクエストを攻略できるのか？

ブラウザ完結のDQ風ミニ探索ゲームを使い、GPT-5 / mini / nanoでAIプレイを検証。

2026.01.22

プログラミング

Transformerによる記憶付きDQNに、World ModelとMPCを組み合わせた迷路AIデモを解説。過去を覚え、数手先を先読みして行動するエージェントの仕組みを紹介します。

2026.01.13

プログラミング

局所観測の迷路ではなぜ強化学習は迷うのか？Transformerで過去16ステップを統合し、「記憶」を持つDQN迷路デモを可視化。ループ脱出の挙動を解説します。

2026.01.06

プログラミング