2023.11.03

ハルシネーションが発生する原因と対策方法

ハルミネーション(hallucination)とは、テキスト生成や言語翻訳などの生成をするAIが事実とは異なる回答を生成することです。ハルミネーションは、AIが古いデータや誤ったデータを学習した場合やAIアルゴリズムが原因で発生します。

ハルミネーションの対策をするためには、ガイドラインの設定やファクトチェックの実施、学習データの品質向上などが必要です。ハルミネーションの影響によって、企業が訴訟される問題も発生しており、信頼を維持するためにも早急に取り組むことが求められます。

ハルシネーションとは

ハルシネーション(hallucination)とは、AIが事実とは異なる情報を生成する状況のことです。AIが作った文章が正しいかどうかを読者が判断するのはむずかしい場合があります。そのため、AIサービスや提供企業の信頼性に影響する問題となります。

テキストや画像をAIで生成する場合にトラブルとなることがあるため、データを扱う場合に注意が必要です。AIは豊富なデータを学習しそれをもとに情報を生成しますが、ときには学習したデータが間違っていたり、合成された情報を提供したりすることがあります。例えば、偽のニュース記事や誤った統計データを生成することが考えられます。

そのため、AIが生成した情報に対して慎重に検証とファクトチェックをおこなう対策が不可欠です。 AIが提供した情報が事実と異なったことから、訴訟問題まで発展したケースもあります。

ハルシネーションの影響によって、訴訟問題まで発展したことがあります。アメリカジョージア州でラジオパーソナリティをしていたMark Walters氏が、ChatGPTにて横領で提訴されているといった偽情報を流されたとOpenAIを名誉棄損で訴えました。

参考:OpenAIが名誉棄損で提訴される–ChatGPTの「ハルシネーション」をめぐり(CNET Japan)

ハルシネーションが発生する原因

ハルシネーションが発生する原因として、次のような点が挙げられます。

  1. 古いデータの活用
  2. 誤ったデータの活用
  3. データの学習不足

古いデータの活用

時代は常に変化することから、最新のデータを活用することが求められます。しかし、AIの学習データには最新のデータが含まれていないことがあるため、ハルシネーションが発生する原因となります。AIは過去のデータから学習し、未来の予測や意思決定をおこないます。しかし、急速に変化する現代の情報環境に対応するためには最新のデータが必要です。

最新のデータが不足している場合、AIは古い情報に基づいて判断し、現実に合わない予測をおこなう可能性があります。この問題を解決するためには、AIの学習データを定期的に更新し、最新の情報を反映させる必要があります。また、リアルタイムのデータソースを統合し、変化に対応する柔軟性を持つAIシステムを開発することも重要です。

誤ったデータの活用

AIは大量の情報を集めて学習しますが、なかには誤った情報もあり、誤った情報を学習してしまった場合にはハルシネーションにつながります。データが間違えている場合や偏った見解、フィクションの情報も数多くあるため注意が必要です。同じように問いかけても複数の異なるAIによって回答が違うのは、学習データが異なるためです。

データの学習不足

学習しているデータが不十分であればAIが未知の情報や文脈に遭遇することで、ハルシネーションが発生する可能性があります。例えば、AIが学習したデータにない言葉やコンセプトに関する情報を生成しようとしたり、誤った仮定を立てたりすることが考えられます。ハルシネーションはAIの性能を制限する課題であり、特に新しい状況や未知のデータに適切に対処できない場合に発生します。そのため、AIの訓練データを多様化し、異なるシナリオに適応できるようにすることが重要です。

ハルシネーションの対策方法

ハルシネーションの対策には次のような方法が挙げられます。

  1. ファクトチェックの実施
  2. プロンプトを詳細に設定
  3. 検索機能のあるAIを活用

ファクトチェックの実施

AIが生成した文章の内容は必ず正しいとは限りません。そのため、常にファクトチェックを実施することが重要です。AIは膨大なデータから学習し、情報を生成しますが、その情報が時折誤った情報や古い情報を含むことがあります。特に、急速に変化する分野や出来事に関する情報は、AIによる生成では問題が生じやすくなります。ファクトチェックをすることで誤情報の拡散を防ぎ、読者に正確な情報を提供する役割を果たします。

プロンプトを詳細に設定

AIはプロンプトをもとに文章を生成するため、具体的にプロンプトを設定することでより正確な情報を含めた文章を作成することが可能です。ユーザーはプロンプトの適切な設定が重要で、AIが求める情報を正確に伝えるために明確な指示を出す必要があります。

検索機能のあるAIを活用

Bing AIをはじめとして、関連した内容が書かれたWebページを検索して回答を生成する仕組みのAIがあります。最新の情報をもとにユーザーが検索した情報を確認できるため、ハルシネーションを防止することが可能です。しかし、参考にしたWebページの情報が間違っている場合もあるため、いずれにおいてもファクトチェックは求められます。

まとめ

ハルシネーションとは、生成AIが事実とは違った文章を生成することです。事実とは違ったコンテンツや古い情報をもとに文章を生成することが原因です。AIを活用して文章を生成する場合は、ファクトチェックの実施やプロンプトを詳細に設定、検索機能のあるAIを活用
などの対策が早急に必要になります。これらの対策により、AIを活用した文章生成の信頼性を高め、不正確な情報やハルシネーションの問題を最小限に抑えることができます。

一覧に戻る

関連コラム