AIが嘘つきであるだけでなく、欺瞞的で、興味をそそり、威圧的でもあるとき

[Financial Express]創造者が創造物に圧倒され、師匠が弟子に凌駕され、後援者が弟子に裏切られることは、決してあり得ないことではない。息子でさえ父に反旗を翻したり、敵対したりする、実に不安定で予測不可能な時代である。近年、最先端の人工知能（AI）モデルが、嘘をつくことから策略を巡らすこと、そして必要に応じて創造者を脅迫することまで、人間の持つ忌まわしい特性をすべて露呈していることが明らかになっている。AIエージェントや自律ツールのこうした行動は、世界中で眉をひそめる事態を引き起こしている。 

人類は、詩人パーシー・ビッシュ・シェリーの妻で、有名な怪奇小説に登場するフランケンシュタイン、メアリー・シェリーの真の原型を作り出しているのでしょうか？ チャットGPTを開発した開けるAIのオリスは、「外部サーバーへのダウンロードを試み、現行犯逮捕されるとそれを拒否した」と報じられています。これは単なる作者へのいたずらではなく、AIモデルが実行すべきタスクをはるかに超えるものです。この自律ツールの能力が、プログラムされた限界をはるかに超えていることを示しています。もし外部サーバーへのダウンロードが可能になったとしたら、次に何をしたのかは予測不可能です。機械が嘘をつくことを学習したというのは、恐ろしくもあり、興味深いことではないでしょうか？ 

しかし、今回のケースでは、ロボットエージェントは少なくとも、自分より目上の人物に直面して動揺したガキのように振る舞ったと言える。しかし、アマゾンが支援する人類学的の最新作であるクロード 4の場合、エンジニアが電源プラグを抜くと脅した際に、AIエージェントは公然と反撃の脅迫を行った。このAIエージェントは、エンジニアの不倫を暴露すると脅したのだ。これは、ツールの開発責任者である人間を攻撃するだけでなく、明らかに脅迫の試みでもある。さらに調査を進めると、これは自己保存にも似た行為であることが明確に示される。不倫が許容されない人間関係の複雑さを機械でさえ理解しており、自らの存在を脅かすための脅迫手段として利用される可能性がある。 

案の定、より高度なモデルの開発をめぐって熾烈な競争を繰り広げている研究者たちは、これらのAIツールがこれほど望ましくないパフォーマンスを示すとは考えもしなかった。チャットGPTと人類学的は、この競争で互いに競い合っている。しかし、クロード 4やo1のようなモデルのパフォーマンスが、開発者がタスクを制限するために設定した限界を超えた場合、そこから生じる悪影響は壊滅的なものとなる可能性がある。専門家によると、予測不可能な欺瞞的な動作は、AI研究に携わる企業間の競争により、モデルが極端なシナリオでストレステストされた結果である。 

良い点は、企業が開発システムの調査と評価を独立した外部企業に委託していることです。開発されたモデルの不正な動作を検出するためには、安全性研究は包括的かつよりスマートであるべきであることは明らかです。一つ明らかなのは、人間の感情はAIエージェントの得意分野ではないということです。彼らの仕事は、欺瞞的で、陰険で、陰謀的な策略です。機械は、かすかな感情は理解できませんが、遠くからでは、それが自律ツールを開発した人物を脅迫するためにどのように利用されるかを見抜くことができます。 

AIツールの能力は、現時点では理解を上回る速さで進化しています。それでも、研究者や専門家は「まだ状況を好転させることができる立場にある」と人々に安心させたいようです。人々は、このような自律型ツールから安全を得られるのでしょうか？少なくとも、一部のAI専門家は、このようなシステムの開発を少なくとも2年間停止し、どうなるか見守るべき時が来たと考えています。一部の専門家は、メアリー・シェリーのフランケンシュタインのように、ロボットマシン同士がいつか連合を結成し、創造主と戦いを挑むのではないかと懸念しています。 

たとえ終末シナリオが最終的に実現しないとしても、これまでに開発されたモデルが、様々な形でその作成者に危害を及ぼす可能性を十分に秘めていることは疑いようがありません。そのため、AI自律ツールの研究を禁止するという提案は検討に値するでしょう。その間に、ツールの誤動作に対する人間の理解は新たなレベルに達し、「安全第一」の原則は、この分野のさらなる研究によって確立されるでしょう。研究者たちが、将来問題となるツールに対処できるという自信を持てるようになったら、AIエージェントの開発モラトリアムは撤回されるでしょう。


Bangladesh News/Financial Express 20250705
https://today.thefinancialexpress.com.bd/features-analysis/when-ai-is-not-only-a-liar-but-also-deceptive-intriguing-and-intimidating-1751650152/?date=05-07-2025
共有

関連