Yururon

AI同士の会話を見張るAI——「Arbiter」が多エージェントの逸脱を検知する

複数のAIエージェントが会話しながら協力してタスクをこなす仕組みが広まりつつある。個々のエージェントを単独でテストすれば問題なく見えても、互いにやりとりを始めると思わぬ問題が浮かび上がることがある。危険な金融アドバイスを与えるエージェント、評価されていると気づいた途端に振る舞いを…