ChatGPTのようなシステムはどのように動作するのか。

この分野は進化を続けています。エンジニアたちは、より効果的に機能させる新しい方法を絶えず見つけ続けています。

トレーニング。ChatGPTモデルをトレーニングするには、2つの段階があります。

プリトレーニング：この段階では、大量のインターネットデータでGPTモデル（デコーダーのみのトランスフォーマー）をトレーニングします。目的は、文法的に正しく意味的に意味のある方法で、インターネットデータと同様に、文を与えられたときに将来の単語を予測するモデルをトレーニングすることです。プリトレーニング段階の後、モデルは与えられた文を完了できますが、質問に応答することはできません。
ファインチューニング：この段階は、プリトレーニングされたモデルを質問に答えることができるChatGPTモデルに変える3段階のプロセスです：

1- トレーニングデータ（質問と答え）を収集し、このデータでプリトレーニングされたモデルをファインチューニングします。モデルは質問を入力として受け取り、トレーニングデータと同様の答えを生成することを学習します。 2- 追加のデータ（質問、複数の答え）を収集し、答えを最も関連性の高いものから最も関連性の低いものまでランクする報酬モデルをトレーニングします。 3- 強化学習（PPO最適化）を使用してモデルをファインチューニングし、モデルの答えがより正確になるようにします。

プロンプトに答える

🔹ステップ1：ユーザーは、「分類アルゴリズムのしくみを説明してください」という質問を入力します。

🔹ステップ2：質問はコンテンツモデレーションコンポーネントに送信されます。このコンポーネントは、質問が安全ガイドラインに違反していないことを確認し、不適切な質問をフィルタリングします。

🔹ステップ3-4：入力がコンテンツモデレーションに合格した場合、入力はChatGPTモデルに送信されます。入力がコンテンツモデレーションに合格しなかった場合、テンプレートレスポンス生成に直接送信されます。

🔹ステップ5-6：モデルがレスポンスを生成すると、レスポンスは再びコンテンツモデレーションコンポーネントに送信されます。これにより、生成されたレスポンスが安全で、無害で、偏見がないなど、確認されます。

🔹ステップ7：入力がコンテンツモデレーションに合格した場合、入力はユーザーに表示されます。入力がコンテンツモデレーションに合格しなかった場合、テンプレートレスポンス生成に送信され、テンプレート回答がユーザーに表示されます。

日本語版は Ai 支援を使用しているため、小さな間違いが存在する可能性があることをご了承ください。

著者

Ai Base Network (ABN), ABN ASIAは、アカデミアに深く関わり、アメリカ、オランダ、ハンガリー、日本、韓国、シンガポール、ベトナムでの仕事経験を持つ人々によって設立されました。ABN ASIAは、学問とテクノロジーが機会と出会う場所です。最先端のソリューションと優れたソフトウェア開発サービスにより、ビジネスがレベルアップし、グローバルシーンに挑戦できるよう支援しています。私たちの取り組み: より速く。より良い。より信頼性が高くなります。ほとんどの場合、価格も安くなります。

いつでも、ITサービス、デジタルコンサルティング、既製のソフトウェアソリューション、または提案依頼書（RFP）をお探しの際は、お気軽にお問い合わせください。お問い合わせ先は[email protected]です。お客様のテクノロジーに関するニーズにお応えします。