技術をやさしく、わかりやすく
テックカイセツ
  • プログラミング
  • 技術解説
  • 思索記録
  • その他
  • プログラミング
  • 技術解説
  • 思索記録
  • その他

2026-01

プログラミング

強化学習(World Model + MPC)迷路デモ

Transformerによる記憶付きDQNに、World ModelとMPCを組み合わせた迷路AIデモを解説。過去を覚え、数手先を先読みして行動するエージェントの仕組みを紹介します。
2026.01.13
プログラミング
プログラミング

強化学習(DL:DQN+Transformer:記憶)迷路デモ

局所観測の迷路ではなぜ強化学習は迷うのか?Transformerで過去16ステップを統合し、「記憶」を持つDQN迷路デモを可視化。ループ脱出の挙動を解説します。
2026.01.06
プログラミング

Recent Posts

  • 強化学習(World Model + MPC)迷路デモ
  • 強化学習(DL:DQN+Transformer:記憶)迷路デモ
  • 強化学習(DL:DQN)を可視化する迷路デモ
  • 強化学習(ML:Q学習)を可視化する迷路デモ
  • AIエンジニアとプロンプトエンジニアとはなに?

Recent Comments

表示できるコメントはありません。

プロフィール

だいき
だいき

元独立系SIer ITエンジニア→フリーランス ITエンジニア。 組込(ロボット等)×WEB(SaaS等)の両方を経験。 働き方・スキル・キャリアに100回悩んだ自分だから、迷うエンジニアへリアルを発信

だいきをフォローする

Archives

  • 2026年1月
  • 2025年12月
  • 2025年11月
  • 2025年10月
  • 2025年9月

Categories

  • その他
  • プログラミング
  • 思索記録
  • 技術解説
テックカイセツ
  • プライバシーポリシー&免責事項
  • お問い合わせ
© 2025 テックカイセツ.
  • プライバシーポリシー&免責事項
  • お問い合わせ
クリックしてコピー