2026年問題とは?AIのデータが不足する!?これからの機械学習はどうなるの?
- ツイート
-
- 2023/07/31
AIは日々進化を遂げており、その動向は世界中から注目を集めています。しかし2026年には、ChatGPTのような大規模言語モデルのAIが学習するためのデータに危機が訪れると言われていることをご存じですか?
今回は「2026年問題」について、そして、これからのAIについて考えていきます。
2026年問題は「AIだからこそ」ぶつかる問題と言えそうです。一緒にみていきましょう!
目次
2026年問題とは
2026年問題とは、大規模言語モデル(LLM)の学習に必要なデータが徐々に使いつくされ、2026年までには良質なデータが枯渇してしまうという問題です。AI研究の第一人者であるカリフォルニア大学のスチュアート・ラッセル教授が、国連のAIサミットでこの問題を提言し、話題になっています。
生成系AI開発者がチャットボットなど言語モデルを使ったAIを開発する際、テキストデータでAIをトレーニングしますが、トレーニングするのためのテキストが不足してしまう恐れがあります。言語モデルを使ったAI開発には質の高いテキストデータが必要とされていますが、2026年までにはそのデータをAIが取り込み終わってしまう可能性が高いということを、ラッセル教授は主張しているのです。
質の高いテキストとは、書籍やニュース記事、論文などを指します。これらのテキストは、AIがトレーニングする形で公開しているものがあまり多く残っていないと考えられているため、2026年には学習のためのデータが枯渇してしまうのではと考えられています。質の高いテキスト以外の、編集が加えられていないテキスト(質の低いテキスト)のほうも2030年には枯渇してしまうことが危惧されています。
AIの将来は?
学習のためのデータが枯渇してしまうことにより、言語モデルを使ったAIにはどのような影響があるのでしょうか。
考えられるのは、機械学習の進歩の減速です。
これまでAIはめまぐるしく変化し、急速に進化を遂げてきました。特にChatGPTをはじめとする生成系AIはその進化が顕著で、これから多くの仕事をAIに任せることができる可能性が高いと考えられていました。しかし、AIのアウトプットに質のばらつきが出てしまうと、様々な場面で影響が出てしまう可能性があります。
スタンフォード大学は、ChatGPTの知能が突如急激に低下したという研究結果を発表しました。調査によると、容易な数学の問題の正答率が数ヶ月で98%から2%に悪化したとのこと。さらには、回答を生成する際のプロセスの透明度も低下していることも明らかになりました。
回答の精度低下の要因について、OpenAIは詳細を明かしていないため、明らかにはなっていませんが、AIのトレーニングに利用しているデータの質が影響を及ぼしていると考えることもできるのではないでしょうか。
2026年問題の解決策
現時点では、2026年問題の明確な解決策は提示されていませんが、これからAIと人間が共生していくにあたって、問題の解決は急務です。
AIの研究者たちは、データを合成したり他の手法でデータを収集するなど、解決策を模索しているとのことです。また、データの汚染やモデル崩壊などの恐れも指摘されていますが、メディアと提携し、高品質のデータを取得する方法なども、解決策の一つとして挙げられています。
まとめ
今回は2026年問題についてご紹介しました。AIは最先端技術として注目されていますが、まだまだ課題が多くあることも事実です。
とはいえ、AIはこれからの世界を大きく変える可能性が非常に高い最先端技術であることは間違いありません。AIに関する知識を身につけることができれば、未来の担い手として活躍することができるでしょう。
インターネット・アカデミーでは、AIに関する知識を学べる講座を豊富にご用意しています。AIプログラミング講座では、人工知能の基礎から機械学習の実践まで網羅に学習することができるので、AIを学び始めたいという方にもおすすめです。ご興味のある方はぜひ無料カウンセリングまでお越しください。
人工知能の基礎から機械学習の実践まで網羅
AIプログラミング講座AI活用の全体像を把握し、短期間で今話題の機械学習(マシンラーニング)や深層学習(ディープラーニング)の実装ができるようになります。Pythonプログラミング知識が既にあり、AIの導入に関して興味がある方が対象の講座です。
相談してコースを選びたい方はカウンセラーに無料で相談
※無理な勧誘は一切ありません
無料で相談してみる
2026年...いったい何が起きちゃうのかな?