Overfitting คืออะไร
การโอเวอร์โหลดเป็นข้อผิดพลาดในการสร้างแบบจำลองที่เกิดขึ้นเมื่อฟังก์ชั่นนั้นใกล้เคียงกับชุดข้อมูลจุดที่ จำกัด มากเกินไป โดยทั่วไปแล้วการใช้ตัวแบบมากเกินไปจะเป็นรูปแบบของการสร้างแบบจำลองที่ซับซ้อนมากเกินไปเพื่ออธิบายความเป็นไปได้ในข้อมูลที่กำลังศึกษา
ในความเป็นจริงข้อมูลที่ศึกษามักจะมีระดับของข้อผิดพลาดหรือสัญญาณรบกวนแบบสุ่มอยู่ภายใน ดังนั้นการพยายามสร้างแบบจำลองให้สอดคล้องกับข้อมูลที่ไม่ถูกต้องเล็กน้อยมากเกินไปอาจทำให้ตัวแบบติดกับข้อผิดพลาดมากมายและลดกำลังการทำนายได้
ประเด็นที่สำคัญ
- การโอเวอร์โหลดเป็นข้อผิดพลาดในการสร้างแบบจำลองที่เกิดขึ้นเมื่อฟังก์ชั่นนั้นใกล้เคียงกับชุดข้อมูลที่มีจำนวน จำกัด มากเกินไปผู้เชี่ยวชาญด้านการเงินจะต้องตระหนักถึงอันตรายที่จะเกิดขึ้นจากการโมเดลมากเกินไปจากข้อมูลที่มี จำกัด
การทำความเข้าใจ
ตัวอย่างเช่นปัญหาที่พบบ่อยคือการใช้อัลกอริธึมคอมพิวเตอร์เพื่อค้นหาฐานข้อมูลที่ครอบคลุมของข้อมูลการตลาดในอดีตเพื่อค้นหารูปแบบ จากการศึกษาที่เพียงพอก็มักจะเป็นไปได้ที่จะพัฒนาทฤษฎีบทที่ซับซ้อนซึ่งดูเหมือนจะทำนายสิ่งต่าง ๆ เช่นผลตอบแทนในตลาดหุ้นอย่างแม่นยำ
อย่างไรก็ตามเมื่อนำไปใช้กับข้อมูลที่อยู่นอกกลุ่มตัวอย่างทฤษฎีบทดังกล่าวอาจพิสูจน์ได้ว่าเป็นเพียงการให้ข้อมูลมากเกินไปของแบบจำลองกับสิ่งที่อยู่ในความเป็นจริงเพียงแค่มีโอกาสเกิดขึ้น ในทุกกรณีมันเป็นสิ่งสำคัญที่จะทดสอบรูปแบบกับข้อมูลที่อยู่นอกตัวอย่างที่ใช้ในการพัฒนา
ผู้เชี่ยวชาญด้านการเงินจะต้องตระหนักถึงอันตรายของการโมเดลมากเกินไปโดยอ้างอิงจากข้อมูลที่ จำกัด