การละเลยขนาดตัวอย่างคืออะไร?
ตัวอย่างการละเลยขนาดเป็นอคติทางปัญญาที่ศึกษาอย่างมีชื่อเสียงโดย Amos Tversky และ Daniel Kahneman มันเกิดขึ้นเมื่อผู้ใช้ข้อมูลสถิติทำการสรุปที่ผิดพลาดโดยไม่สามารถพิจารณาขนาดตัวอย่างของข้อมูลที่เป็นปัญหาได้
สาเหตุพื้นฐานของการละเลยขนาดตัวอย่างก็คือผู้คนมักจะไม่เข้าใจว่าความแปรปรวนระดับสูงมีแนวโน้มที่จะเกิดขึ้นในกลุ่มตัวอย่างขนาดเล็ก ดังนั้นจึงเป็นเรื่องสำคัญที่จะต้องพิจารณาว่าขนาดตัวอย่างที่ใช้ในการสร้างสถิตินั้นมีขนาดใหญ่พอที่จะให้ข้อสรุปที่มีความหมายหรือไม่
การรู้ว่าเมื่อใดกลุ่มตัวอย่างที่มีขนาดใหญ่พอจะท้าทายให้กับผู้ที่ไม่มีความเข้าใจวิธีการทางสถิติที่ดี
ประเด็นที่สำคัญ
- ตัวอย่างการละเลยขนาดเป็นอคติเกี่ยวกับความรู้ความเข้าใจที่ศึกษาโดย Amos Tversky และ Daniel Kahneman ประกอบด้วยการเขียนข้อสรุปที่ผิดพลาดจากข้อมูลทางสถิติเนื่องจากไม่ได้พิจารณาผลกระทบของขนาดตัวอย่างผู้ที่ต้องการลดความเสี่ยงของการละเลยขนาดกลุ่มตัวอย่างควรจำไว้ว่า ขนาดตัวอย่างเกี่ยวข้องกับผลลัพธ์ทางสถิติที่ผันผวนมากขึ้นและในทางกลับกัน
ทำความเข้าใจกับการละเลยขนาดตัวอย่าง
เมื่อขนาดตัวอย่างเล็กเกินไปข้อสรุปที่แม่นยำและเชื่อถือได้ไม่สามารถวาดได้ ในบริบทของการเงินสิ่งนี้สามารถหลอกลวงนักลงทุนได้หลายวิธี
ตัวอย่างเช่นนักลงทุนอาจเห็นกองทุนเพื่อการลงทุนใหม่โดยมีผลตอบแทน 15% ต่อปีตั้งแต่เริ่มก่อตั้ง นักลงทุนอาจจะรวมไว้อย่างรวดเร็วว่ากองทุนนี้เป็นตั๋วของพวกเขาไปสู่การสร้างความมั่งคั่งอย่างรวดเร็ว อย่างไรก็ตามข้อสรุปนี้อาจนำไปสู่การเข้าใจผิดที่เป็นอันตรายหากกองทุนไม่ได้ลงทุนมานานมาก ในกรณีดังกล่าวผลลัพธ์อาจเกิดจากความผิดปกติระยะสั้นและมีส่วนเกี่ยวข้องกับวิธีการลงทุนจริงของกองทุน
การละเลยขนาดตัวอย่างมักจะสับสนกับการละเลยอัตราฐานซึ่งเป็นอคติทางปัญญาแยกต่างหาก ในขณะที่การละเลยขนาดตัวอย่างหมายถึงความล้มเหลวในการพิจารณาบทบาทของขนาดตัวอย่างในการพิจารณาความน่าเชื่อถือของการเรียกร้องทางสถิติ แต่อัตราการละเลยฐานนั้นเกี่ยวข้องกับแนวโน้มของผู้คนในการละเลยความรู้ที่มีอยู่เกี่ยวกับปรากฏการณ์เมื่อประเมินข้อมูลใหม่
ตัวอย่างในโลกแห่งความจริงของการละเลยขนาดตัวอย่าง
เพื่อให้เข้าใจถึงการละเลยขนาดตัวอย่างให้พิจารณาตัวอย่างต่อไปนี้ซึ่งมาจากการวิจัยโดย Amos Tversky และ Daniel Kahneman:
บุคคลถูกขอให้วาดจากตัวอย่างลูกบอลห้าลูกและพบว่าสี่ลูกเป็นสีแดงและอีกลูกหนึ่งเป็นสีเขียว
คนวาดจากตัวอย่างลูกบอล 20 ลูกและพบว่า 12 เป็นสีแดงและแปดเป็นสีเขียว
ตัวอย่างใดให้หลักฐานที่ดีกว่าว่าลูกบอลมีสีแดงเป็นส่วนใหญ่?
คนส่วนใหญ่บอกว่าตัวอย่างแรกที่เล็กกว่านั้นให้หลักฐานที่แข็งแกร่งกว่าเพราะอัตราส่วนของสีแดงต่อสีเขียวนั้นสูงกว่าตัวอย่างที่มีขนาดใหญ่กว่ามาก อย่างไรก็ตามในความเป็นจริงอัตราส่วนที่สูงขึ้นนั้นมีมากกว่าเมื่อเทียบกับขนาดตัวอย่างที่เล็กลง ตัวอย่าง 20 ตัวอย่างมีหลักฐานที่ชัดเจนกว่านี้มาก
อีกตัวอย่างจาก Amos Tversky และ Daniel Kahneman มีดังนี้:
เมืองนี้ให้บริการโดยโรงพยาบาลสองแห่ง ในโรงพยาบาลขนาดใหญ่มีทารกเกิดขึ้นเฉลี่ย 45 คนต่อวันและในโรงพยาบาลขนาดเล็กมีเด็กเกิดประมาณ 15 คนต่อวัน แม้ว่า 50% ของทารกทั้งหมดจะเป็นเด็กผู้ชาย แต่เปอร์เซ็นต์ที่แน่นอนก็ผันผวนในแต่ละวัน
ในช่วงหนึ่งปีโรงพยาบาลแต่ละแห่งบันทึกวันที่ทารกมากกว่า 60% เป็นเด็ก โรงพยาบาลไหนที่บันทึกวันดังกล่าวมากขึ้น?
เมื่อถามคำถามนี้ 22% ของผู้ตอบแบบสอบถามกล่าวว่าโรงพยาบาลขนาดใหญ่จะรายงานวันดังกล่าวมากขึ้นขณะที่ 56% กล่าวว่าผลลัพธ์จะเหมือนกันสำหรับโรงพยาบาลทั้งสองแห่ง ในความเป็นจริงคำตอบที่ถูกต้องคือโรงพยาบาลขนาดเล็กจะบันทึกวันดังกล่าวได้มากขึ้นเนื่องจากโรงพยาบาลขนาดเล็กจะทำให้เกิดความแปรปรวนมากขึ้น
ดังที่เราได้กล่าวไว้ก่อนหน้านี้รากของการละเลยขนาดของกลุ่มตัวอย่างคือคนมักจะไม่เข้าใจว่าระดับความแปรปรวนในระดับสูงมีแนวโน้มที่จะเกิดขึ้นในกลุ่มตัวอย่างขนาดเล็ก ในการลงทุนอาจมีค่าใช้จ่ายสูงมากอย่างแน่นอน