初版の国際AI安全報告発表以来、AI能力は重要領域において継続的に改善されている。新しい訓練技術により、AI システムは段階的推論を実行するよう教育されている。推論時増強技術が主要な駆動力となり、単なるより大規模なモデルの訓練ではなくなっている。その結果、汎用AI システムは科学研究からソフトウェア開発に至るまで、複数領域にわたる複雑な問題を解決できるようになった。信頼性の課題は依然として存在するが、プログラミング、数学、および専門家レベルの科学問題ベンチマークにおけるパフォーマンスは継続的に改善されている。これらの能力向上は、生物兵器およびサイバー攻撃のリスクを含む多様なリスクに影響を及ぼし、監視と制御可能性に新たな課題をもたらしている。
AI分野の発展は極めて迅速であり、単一年度報告では変化のペースに追いつくことができない。重大な変化は数ヶ月、さらには数週間以内に発生する可能性があるため、政策立案者、研究者、および一般市民に適時な情報を提供するために、より頻繁な主要更新が必要である。
本報告書の目的は以下の通りである:
本報告書は、AI能力評価、安全リスク、社会的影響など複数領域の最新研究成果をカバーする168篇の関連文献を引用している。*でマークされた文献はAI企業により発表されたか、少なくとも50%の著者が営利AI企業に属していることを示し、産学研結合の特徴を反映している。
総合評価: 本報告書はAI安全研究の現在の最高水準を代表し、AI の急速な発展とその影響を理解するための貴重な洞察を提供している。これは単なる技術評価報告書ではなく、責任あるAI 開発を推進するための重要な文献であり、政策立案者、研究者、および実務者にとって重要な価値を持つ。