[The Daily Star]医療分野における人工知能(AI)の活用が拡大するにつれ、これらのシステムの信頼性について疑問が生じています。プロスメディシン誌に掲載された新たな研究によると、AIシステムは単独で考えるよりも「一緒に考える」方がより正確に機能することが研究者によって明らかになりました。
この研究では、GPT-4に基づく5つのAIモデルからなるグループ(「カウンシル」)を、米国医師免許試験(USMLE)の3段階から公開されている325問でテストしました。これらの試験は、基礎医学から臨床意思決定まで、あらゆる分野を網羅しています。AIカウンシルは、共同作業を行った結果、ステップ1で97%、ステップ2で93%、ステップ3で94%の正答率を達成し、単独のAIモデルを上回る成績を収めました。
通常、AIシステムは同じ質問に対して異なる回答を出すことがあり、中には間違った回答や作り話の回答も含まれる可能性があります。研究者たちは、このばらつきを弱点と捉えるのではなく、AIが回答について議論し、推論を比較し、意見が一致しない場合は選択肢を再検討するシステムを設計しました。ファシリテータープログラムがこの議論を導き、グループが共通の答えに到達するまで何度も試行を繰り返します。
AI が当初意見の相違を抱いたとき、議論のプロセスにより 83% の確率で正しい答えが導き出され、単純な多数決では見逃されていたであろう間違いの半分以上も修正されました。
研究者たちは、これはコラボレーションがAIの自己修正を助け、信頼性を高めることを示していると考えています。このアプローチはまだ実際の病院でテストされていませんが、将来的には医療、教育、その他精度が重要となる分野において、より安全で信頼性の高いAIツールにつながる可能性があります。
Bangladesh News/The Daily Star 20260104
https://www.thedailystar.net/health/healthcare/news/when-ais-collaborate-accuracy-medicine-improves-4072296
関連