公開日

グラフRAGはなぜ最高のRAGシステムの一つなのか

著者

リトリーバル・オーガスト・ジェネレーション(RAG)にはグラフデータベースが適している!

Image

RAGシステムは、通常、正しいコンテキストを取得するのが非常に悪いです。取得した情報は、元のドキュメントに非常にローカルであり、ユーザーのクエリーに関連するドキュメントを取得するのが難しいかもしれません。そこで、Microsoft GraphRAGが解決策を提供します。

2つの重要な部分があります。まず、さまざまなドキュメントの要約をさまざまなスケールで作成します。これにより、全体として、ドキュメントに含まれるグローバルな情報と、テキストの小さなチャンクに含まれるローカルな情報を理解できます。次に、テキスト情報をグラフィカルな形式に変換します。テキストに含まれる情報は、ノードとエッジの集合として表現できるという仮定に基づいています。これにより、テキストに含まれる情報をグラフデータベースに保存できるノードベースの知識ベースとして表現できます。

データインデックスパイプラインは以下の通りです。

  1. 元のドキュメントをサブテキストに分割します。
  2. LLMを使用して、エンティティ、関係、説明を構造化された形式で抽出します。
  3. 異なるテキストチャンクにわたる重複するエンティティと関係を解決します。説明をより完全なものにまとめることができます。
  4. エンティティと関係のグラフ表現を構築します。
  5. グラフから、エンティティを階層的にクラスタリングします。各エンティティは、クラスタのスケールに応じて複数のクラスタに属します。
  6. 各コミュニティをエンティティと関係の説明を使用して要約します。各エンティティには、コミュニティの異なるスケールを表す複数の要約があります。

取得時には、ユーザーのクエリーを、キーワードを抽出してレキシカル検索を行い、ベクトル表現を使用して意味検索を行うことができます。検索からエンティティを取得し、エンティティから関連するコミュニティの要約を取得します。これらの要約は、生成時にコンテキストとして使用され、ユーザーのクエリーに答えます。

私たちは、実装するまで、ものごとを理解することができません。

日本語版は Ai 支援を使用しているため、小さな間違いが存在する可能性があることをご了承ください。

著者

Ai Base Network (ABN), ABN ASIAは、アカデミアに深く関わり、アメリカ、オランダ、ハンガリー、日本、韓国、シンガポール、ベトナムでの仕事経験を持つ人々によって設立されました。ABN ASIAは、学問とテクノロジーが機会と出会う場所です。最先端のソリューションと優れたソフトウェア開発サービスにより、ビジネスがレベルアップし、グローバルシーンに挑戦できるよう支援しています。 私たちの取り組み: より速く。 より良い。 より信頼性が高くなります。 ほとんどの場合、価格も安くなります。

いつでも、ITサービス、デジタルコンサルティング、既製のソフトウェアソリューション、または提案依頼書(RFP)をお探しの際は、お気軽にお問い合わせください。お問い合わせ先は[email protected]です。お客様のテクノロジーに関するニーズにお応えします。

ABNAsia.org

© ABN ASIA