マルチエージェント環境でのモデル学習を安定化=電通大とCA