世界最大級の図書館が「AIデータの宝庫」として注目浴びる
2024.09.30
1億8000万点もの書籍や資料を所蔵する米国議会図書館が、AI企業から「AIデータの宝庫」として注目を集めている。AI企業は、同図書館の膨大なデータを最先端のAIモデルの訓練に利用しようとしている。
AI開発者を魅了するパブリックドメインのコンテンツ
米国議会図書館のデジタルアーカイブには、400以上の言語による幅広いジャンルの希少で信頼性の高い資料が含まれる。特に注目されるのは、185ペタバイトに及ぶパブリックドメインのデータが無料で提供されている点である。
AI活用に潜む課題
AIモデルは、過去の事象を現代の認識で解釈するバイアスが指摘されている。同図書館のデジタル戦略部長ナタリー・スミス氏は、誤情報の生成や拡散のリスクについて警鐘を鳴らしている。実際、AIモデルによる法案要約のテストでは誤認識が生じた例がある。
展望
同図書館はAIツールの活用を慎重に検討する一方で、今後さらに多くの制約のないデータをデジタル化し、提供する計画を進めている。