กฎเชิงประจักษ์คืออะไร
กฎเชิงประจักษ์เรียกอีกอย่างว่ากฎสามซิกม่าหรือกฎ 68-95-99.7 เป็นกฎทางสถิติที่ระบุว่าสำหรับการแจกแจงแบบปกติข้อมูลเกือบทั้งหมดตกอยู่ภายในค่าเบี่ยงเบนมาตรฐานสามค่า (แสดงโดยσ) ของค่าเฉลี่ย (เขียนแทนโดย µ) แยกตามกฎเชิงประจักษ์แสดงให้เห็นว่า 68% อยู่ในส่วนเบี่ยงเบนมาตรฐานแรก (µ ±σ), 95% ภายในสองส่วนเบี่ยงเบนมาตรฐานแรก (µ ±2σ) และ 99.7% ภายในสามส่วนเบี่ยงเบนมาตรฐานแรก (µ ±3σ).
กฎเชิงประจักษ์
ทำความเข้าใจกับกฎเชิงประจักษ์
กฎเชิงประจักษ์มักใช้ในสถิติสำหรับการพยากรณ์ผลลัพธ์ขั้นสุดท้าย หลังจากคำนวณค่าเบี่ยงเบนมาตรฐานและก่อนรวบรวมข้อมูลที่ถูกต้องกฎนี้สามารถใช้เป็นค่าประมาณคร่าวๆของผลลัพธ์ของข้อมูลที่กำลังจะมาถึง ความน่าจะเป็นนี้สามารถใช้ในระหว่างกาลได้เนื่องจากการรวบรวมข้อมูลที่เหมาะสมอาจใช้เวลานานหรือเป็นไปไม่ได้ กฎเชิงประจักษ์ยังใช้เป็นวิธีคร่าวๆในการทดสอบ "ปกติ" หากจุดข้อมูลมากเกินไปอยู่นอกขอบเขตเบี่ยงเบนมาตรฐานทั้งสามนี่แสดงว่าการแจกแจงไม่ปกติ
ประเด็นที่สำคัญ
- กฎเชิงประจักษ์ระบุว่าข้อมูลเกือบทั้งหมดอยู่ภายใน 3 ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ยสำหรับการแจกแจงแบบปกติภายใต้กฎนี้ 68% ของข้อมูลอยู่ในส่วนเบี่ยงเบนมาตรฐานเดียวร้อยละเก้าสิบห้าของข้อมูลอยู่ภายในสองส่วนเบี่ยงเบนมาตรฐานภายใน ค่าเบี่ยงเบนมาตรฐานสามค่าคือ 99.7% ของข้อมูล
ตัวอย่างของกฎเชิงประจักษ์
สมมติว่าประชากรสัตว์ในสวนสัตว์เป็นที่รู้กันว่ามีการแจกจ่ายตามปกติ สัตว์แต่ละตัวมีอายุเฉลี่ย 13.1 ปีและค่าเบี่ยงเบนมาตรฐานของอายุการใช้งานคือ 1.5 ปี หากมีคนต้องการทราบความน่าจะเป็นที่สัตว์จะมีอายุยืนกว่า 14.6 ปีพวกเขาสามารถใช้กฎเชิงประจักษ์ได้ เมื่อทราบว่าค่าเฉลี่ยของการกระจายคือ 13.1 ปีช่วงอายุต่อไปนี้จะเกิดขึ้นสำหรับแต่ละส่วนเบี่ยงเบนมาตรฐาน:
- ค่าเบี่ยงเบนมาตรฐานหนึ่งค่า (µ ±σ): (13.1 - 1.5) ถึง (13.1 + 1.5) หรือ 11.6 ถึง 14.6 ค่าเบี่ยงเบนมาตรฐานสองค่า (µ ±2σ): 13.1 - (2 x 1.5) ถึง 13.1 + (2 x 1.5), หรือ 10.1 ถึง 16.1 ส่วนเบี่ยงเบนมาตรฐานสามค่า (µ ±3σ): 13.1 - (3 x 1.5) ถึง 13.1 + (3 x 1.5) หรือ 8.6 ถึง 17.6
ผู้ที่แก้ไขปัญหานี้จำเป็นต้องคำนวณความน่าจะเป็นโดยรวมของสัตว์ที่มีชีวิต 14.6 ปีขึ้นไป กฎเชิงประจักษ์แสดงให้เห็นว่า 68% ของการกระจายอยู่ภายในส่วนเบี่ยงเบนมาตรฐานเดียวในกรณีนี้จาก 11.6 ถึง 14.6 ปี ดังนั้นการกระจายที่เหลือ 32% จึงอยู่นอกช่วงนี้ ครึ่งหนึ่งอยู่เหนือ 14.6 และครึ่งหนึ่งอยู่ต่ำกว่า 11.6 ดังนั้นความน่าจะเป็นของสัตว์ที่มีชีวิตมากกว่า 14.6 คือ 16% (คำนวณเป็น 32% หารด้วยสอง)
เป็นอีกตัวอย่างหนึ่งสมมติว่าสัตว์ในสวนสัตว์มีอายุเฉลี่ย 10 ปีโดยมีค่าเบี่ยงเบนมาตรฐาน 1.4 ปี สมมติว่าผู้ดูแลสัตว์เลี้ยงพยายามที่จะหาความน่าจะเป็นของสัตว์ที่มีชีวิตมากกว่า 7.2 ปี การกระจายนี้มีลักษณะดังนี้:
- ค่าเบี่ยงเบนมาตรฐานหนึ่งค่า (µ ±σ): 8.6 ถึง 11.4 ปีส่วนเบี่ยงเบนมาตรฐานสองอัน (µ ±2σ): 7.2 ถึง 12.8 ปีที่เบี่ยงเบนมาตรฐานสามส่วน ((µ ±3σ): 5.8 ถึง 14.2 ปี
กฎเชิงประจักษ์ระบุว่า 95% ของการกระจายอยู่ภายในสองส่วนเบี่ยงเบนมาตรฐาน ดังนั้น 5% อยู่นอกส่วนเบี่ยงเบนมาตรฐานสองค่า ครึ่งหนึ่งเหนือ 12.8 ปีและอีกครึ่งหนึ่งต่ำกว่า 7.2 ปี ดังนั้นความน่าจะเป็นของการมีชีวิตมากกว่า 7.2 ปีคือ:
95% + (5% / 2) = 97.5%