- เผยแพร่เมื่อ
การปรับให้เป็นระเบียบใน Deep Learning: ความเข้าใจเบื้องหลัง
- ผู้เขียน

- ชื่อ
- AbnAsia.org
- @steven_n_t
การปรับให้เป็นปกติ 101

💡 การปรับให้เป็นปกติใน Deep Learning: ความเข้าใจเบื้องหลัง
คำจำกัดความของการปรับให้เป็นปกติ 101:
แบบจำลองทำงานได้ดีกับข้อมูลการฝึกอบรม แต่ไม่ดีนักกับข้อมูลที่ไม่เคยเห็นมาก่อน การปรับให้เป็นปกติมากเกินไป :)
แต่มีอะไรอีกไหม? มาหาคำตอบกัน
จำได้ไหมคนหนึ่งในโรงเรียนที่จำทุกอย่างที่เขียนในหนังสือหรือพูดโดยครู แต่ไม่ได้ทำผลงานได้ดีเท่าไหร่เมื่อมีคำถามที่เปลี่ยนแปลงไปบ้าง
เกิดอะไรขึ้น?
เขาจำบทเรียนได้ แต่ไม่เข้าใจแนวคิดเบื้องหลังเพื่อใช้กับคำถามที่ไม่เคยเห็นมาก่อน
นั่นคือ การปรับให้เป็นปกติมากเกินไป และเพื่อแก้ไขปัญหานี้ เราต้องการ การปรับให้เป็นปกติ
การปรับให้เป็นปกติ ทำหน้าที่เหมือนครูที่ดี ช่วยให้นักเรียนมุ่งเน้นไปที่แนวคิดหลักมากกว่าการจำรายละเอียดที่ไม่เกี่ยวข้อง
การปรับให้เป็นปกติแก้ปัญหาทั้งหมด 3 ข้อ:
1️⃣ การปรับให้เป็นปกติมากเกินไป: ป้องกันไม่ให้แบบจำลองปรับให้เข้ากับเสียงรบกวนหรือรายละเอียดที่ไม่เกี่ยวข้องในข้อมูลการฝึกอบรม
2️⃣ ความซับซ้อนของแบบจำลอง: ลดความซับซ้อนของแบบจำลองโดยจำกัดความสามารถของมัน เพื่อให้ไม่เรียนรู้มากเกินไป
3️⃣ การแลกเปลี่ยนระหว่างความเอนเอียงและความแปรปรวน: สร้างความสมดุลระหว่างการปรับให้เป็นปกติน้อยเกินไป (ง่ายเกินไป) และการปรับให้เป็นปกติมากเกินไป (ซับซ้อนเกินไป)
แล้วเราจะทำการปรับให้เป็นปกติได้อย่างไร?
มีหลายวิธี
มาดูกันวิธีที่สำคัญที่สุด – และลองทำความเข้าใจโดยไม่ต้องใช้เลขคณิตกัน
1️⃣ การปรับให้เป็นปกติ L1 และ L2 – วิธีหนึ่งในการขัดขวางน้ำหนักที่ใหญ่มาก เทอมการลงโทษทำให้น้ำหนักที่ใหญ่ถูกลดลง
- L1: การลงโทษเพิ่มที่ น้ำหนักสัมบูรณ์
- L2: การลงโทษเพิ่มที่ น้ำหนักที่ยกกำลังสอง
2️⃣ การหยุดทำงานแบบสุ่ม – หยุดทำงานแบบสุ่ม (ตั้งค่าเป็นศูนย์) ส่วนหนึ่งของเซลล์ประสาทระหว่างการฝึกอบรม สิ่งนี้ทำให้เครือข่ายหลีกเลี่ยงการอาศัยเซลล์ประสาทเฉพาะเจาะจง ส่งเสริมการเรียนรู้ทั่วไป
3️⃣ การเพิ่มข้อมูล – เหมือนกับการให้คำถามที่แตกต่างกันแก่เพื่อน เพื่อให้พวกเขาดีขึ้นในการจับแนวคิด
4️⃣ การหยุดการฝึกอบรมก่อนเวลา – หยุดการฝึกอบรม ก่อนที่ แบบจำลองจะเริ่มจำข้อมูล
5️⃣ การปรับมาตรฐานแบบแบตช์ – ปรับมาตรฐานข้อมูล (ค่าเฉลี่ย = 0 ค่าแปรผัน = 1) ที่แต่ละชั้น เพื่อให้เซลล์ประสาททุกตัวมีโอกาสเท่ากันในชั้นต่อไป
6️⃣ การปรับให้เป็นปกติแบบยืดหยุ่น – การผสมผสานระหว่างการปรับให้เป็นปกติ L1 และ L2
โปรดทราบว่าเวอร์ชันภาษาไทยได้รับการช่วยเหลือจาก AI ดังนั้นอาจมีข้อผิดพลาดเล็กน้อย
ผู้เขียน
Ai Base Network (ABN), ABN ASIA ถูกก่อตั้งขึ้นโดยคนที่มีรากฐานลึกในวงการวิชาการ มีประสบการณ์การทำงานในสหรัฐอเมริกา ดัตช์ ฮังการี ญี่ปุ่น เกาหลีใต้ สิงคโปร์ และเวียดนาม ABN Asia เป็นที่เราพบกันของวิทยาลัยและเทคโนโลยี ด้วยโซลูชันขั้นสูงและบริการพัฒนาซอฟต์แวร์ที่มีความสามารถ เราช่วยธุรกิจเติบโตและเข้าสู่ฉากโลก ความมุ่งมั่นของเรา: ด่วนขึ้น ดีขึ้น น่าเชื่อถือมากขึ้น ในกรณีส่วนมาก: ราคาถูกด้วย
หากคุณต้องการบริการ IT การให้คำปรึกษาดิจิทัล โซลูชันซอฟต์แวร์ใช้ได้หรือหากคุณต้องการส่งคำขอข้อเสนอ (RFPs) อย่าลังเลที่จะติดต่อเรา คุณสามารถติดต่อเราได้ที่ [email protected] เราพร้อมช่วยเหลือคุณด้านทุกความต้องการทางเทคโนโลยีของคุณทุกเมื่อ

© ABN ASIA