公開日

ディープラーニングにおける正則化:その背後にある直感

著者

正則化の基礎

Image


💡 ディープラーニングにおける正則化:直感的な理解

正則化 101 の定義
モデルはトレーニングデータではうまく動作しますが、未知のデータではうまく動作しません。 過剰適合 :)

しかし、それ以外にも何かあるのでしょうか?それを調べてみましょう。


学校で、教科書や先生の言葉をすべて暗記したが、少し質問を変えるとうまく答えられなかったあの人を覚えていますか?

何が起こったのですか?

彼はただ教科書や先生の言葉を暗記しただけで、概念を理解して新しい質問に適用することができませんでした。

それが 過剰適合 であり、それを修正するために、 正則化 が必要です。


正則化 は、良い先生のように、学生に無関係な詳細を暗記するのではなく、核となる概念に焦点を当てるように導きます。

正則化は本質的に 3 つの問題 を解決します:

1️⃣ 過剰適合:モデルがトレーニングデータのノイズや無関係な詳細に適合するのを防ぎます。

2️⃣ モデル複雑度:モデルが過剰に学習するのを防ぐために、モデル複雑度を制限します。

3️⃣ 偏りと分散のトレードオフ:過剰適合(複雑すぎる)と過少適合(単純すぎる)のバランスをとります。


では、正則化はどのように行うのでしょうか? 実際には、いくつかの方法があります。

最も重要なものを見てみましょう。数学を使わずに理解してみましょう。


1️⃣ L1 と L2 正則化 – 大きな重みを抑制する方法。ペナルティ項により、大きな重みが抑制されます。

  • L1: 絶対重み にペナルティを加えます。
  • L2: 重みの二乗 にペナルティを加えます。

2️⃣ ドロップアウト – トレーニング中にランダムにニューロンの一部を「ドロップアウト」(0 に設定)します。これにより、ネットワークは特定のニューロンに過剰に依存するのを避け、汎化を促進します。

3️⃣ データ拡張 – 友達に質問のさまざまなバリエーションを与えるようなものです。概念を把握する能力を向上させます。

4️⃣ 早期停止 – モデルがデータを暗記し始める 前に トレーニングを停止します。

5️⃣ バッチ正規化 – 各層でデータを正規化(平均 = 0、分散 = 1)し、すべてのニューロンが次の層で公平に扱われるようにします。

6️⃣ エラスティックネット – L1 と L2 正則化の組み合わせです。

日本語版は Ai 支援を使用しているため、小さな間違いが存在する可能性があることをご了承ください。

著者

Ai Base Network (ABN), ABN ASIAは、アカデミアに深く関わり、アメリカ、オランダ、ハンガリー、日本、韓国、シンガポール、ベトナムでの仕事経験を持つ人々によって設立されました。ABN ASIAは、学問とテクノロジーが機会と出会う場所です。最先端のソリューションと優れたソフトウェア開発サービスにより、ビジネスがレベルアップし、グローバルシーンに挑戦できるよう支援しています。 私たちの取り組み: より速く。 より良い。 より信頼性が高くなります。 ほとんどの場合、価格も安くなります。

いつでも、ITサービス、デジタルコンサルティング、既製のソフトウェアソリューション、または提案依頼書(RFP)をお探しの際は、お気軽にお問い合わせください。お問い合わせ先は[email protected]です。お客様のテクノロジーに関するニーズにお応えします。

ABNAsia.org

© ABN ASIA