ควอไทล์คืออะไร
ควอไทล์เป็นคำทางสถิติที่อธิบายถึงการแบ่งการสังเกตเป็นสี่ช่วงเวลาที่กำหนดขึ้นอยู่กับค่าของข้อมูลและวิธีที่พวกเขาเปรียบเทียบกับชุดการสังเกตทั้งหมด
ทำความเข้าใจกับควอไทล์
เพื่อทำความเข้าใจควอไทล์มันเป็นสิ่งสำคัญที่จะเข้าใจค่ามัธยฐานเป็นตัวชี้วัดของแนวโน้มกลาง ค่ามัธยฐานของสถิติคือค่ากลางของชุดของตัวเลข เป็นจุดที่ครึ่งหนึ่งของข้อมูลอยู่ด้านล่างและสูงกว่าค่ากลาง
ดังนั้นเมื่อกำหนดตัวเลข 13 ชุดค่ามัธยฐานจะเป็นเลขเจ็ด ตัวเลขหกตัวก่อนหน้าค่านี้คือตัวเลขต่ำสุดในข้อมูลและตัวเลขหกตัวหลังค่ามัธยฐานเป็นตัวเลขสูงสุดในชุดข้อมูลที่กำหนด เนื่องจากค่ามัธยฐานไม่ได้รับผลกระทบจากค่าที่มากเกินไปหรือค่าผิดปกติในการแจกแจงบางครั้งจึงเป็นที่ต้องการของค่าเฉลี่ย
ค่ามัธยฐานเป็นตัวประมาณค่าที่ตั้งที่แข็งแกร่ง แต่ไม่ได้บอกอะไรเลยว่าข้อมูลในด้านใดด้านหนึ่งของค่านั้นถูกกระจายหรือกระจายออกไป นั่นคือที่ที่ขั้นตอนในควอไทล์ควอไทล์วัดการแพร่กระจายของค่าด้านบนและด้านล่างค่าเฉลี่ยโดยแบ่งการกระจายออกเป็นสี่กลุ่ม
ประเด็นที่สำคัญ
- ควอไทล์วัดการกระจายของค่าด้านบนและด้านล่างของค่าเฉลี่ยโดยการแบ่งการกระจายออกเป็นสี่กลุ่มควอไทล์แบ่งข้อมูลออกเป็นสามจุด - ควอไทล์ที่ต่ำกว่าค่ามัธยฐานและควอไทล์บน - ในรูปแบบสี่กลุ่มของชุดข้อมูล เพื่อคำนวณช่วง interquartile ซึ่งเป็นการวัดความแปรปรวนรอบมัธยฐาน
Quartiles ทำงานอย่างไร
เช่นเดียวกับค่ามัธยฐานแบ่งข้อมูลออกเป็นครึ่งเพื่อให้ 50% ของการวัดอยู่ต่ำกว่าค่ามัธยฐานและ 50% อยู่เหนือควอไทล์แบ่งข้อมูลออกเป็นไตรมาสเพื่อให้ 25% ของการวัดน้อยกว่าควอไทล์ล่าง 50 % น้อยกว่าค่าเฉลี่ยและ 75% น้อยกว่าควอไทล์ชั้นบน
ควอไทล์แบ่งข้อมูลออกเป็นสามจุด - ควอไทล์ที่ต่ำกว่า, ค่ามัธยฐานและควอไทล์บน - เพื่อจัดกลุ่มสี่ชุดของชุดข้อมูล ควอไทล์ต่ำหรือควอไทล์แรกแสดงว่าเป็น Q1 และเป็นตัวเลขกลางที่อยู่ระหว่างค่าที่เล็กที่สุดของชุดข้อมูลและค่ามัธยฐาน ควอไทล์ที่สอง Q2 ยังเป็นค่ามัธยฐาน ควอไทล์ชั้นบนหรือชั้นสามซึ่งแสดงเป็นไตรมาสที่ 3 เป็นจุดศูนย์กลางที่อยู่ระหว่างค่ามัธยฐานและจำนวนการแจกแจงสูงสุด
ทีนี้เราสามารถแมปสี่กลุ่มที่เกิดขึ้นจากควอไทล์ กลุ่มแรกของค่ามีจำนวนน้อยที่สุดจนถึง Q1; กลุ่มที่สองรวมถึง Q1 ถึงค่ามัธยฐาน; ชุดที่สามคือค่ามัธยฐานถึงไตรมาสที่ 3; หมวดหมู่ที่สี่ประกอบด้วย Q3 ถึงจุดข้อมูลสูงสุดของทั้งชุด
ควอไทล์แต่ละอันมี 25% ของการสำรวจทั้งหมด โดยทั่วไปข้อมูลจะถูกจัดเรียงจากน้อยไปหามากที่สุด:
- ควอไทล์แรก: 25% ต่ำสุดของควอไทล์ที่สอง: ระหว่าง 25.1% และ 50% (ขึ้นอยู่กับค่ามัธยฐาน) ควอไทล์ที่สาม: 51% ถึง 75% (สูงกว่าค่ามัธยฐาน) ควอไทล์ที่สี่: สูงสุด 25% ของตัวเลข
ตัวอย่างควอไทล์
ลองทำงานกับตัวอย่าง สมมติว่าการแจกแจงคะแนนคณิตศาสตร์ในชั้นเรียนของนักเรียน 19 คนตามลำดับจากน้อยไปมากคือ:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
ก่อนอื่นให้ทำเครื่องหมายมัธยฐาน Q2 ซึ่งในกรณีนี้คือค่าที่สิบ: 75
Q1 คือจุดศูนย์กลางระหว่างคะแนนที่เล็กที่สุดและค่ามัธยฐาน ในกรณีนี้ Q1 จะอยู่ระหว่างคะแนนที่หนึ่งและที่ห้า: 68
Q3 คือค่ากลางระหว่าง Q2 และคะแนนสูงสุด: 84
ตอนนี้เรามีควอไทล์แล้วลองตีความตัวเลขของพวกเขา คะแนน 68 (Q1) หมายถึงควอไทล์แรกและเป็นไทล์ที่ 25 68 คือค่ามัธยฐานของครึ่งล่างของคะแนนที่ตั้งอยู่ในข้อมูลที่มีอยู่เช่นค่ามัธยฐานของคะแนนจาก 59 ถึง 75
Q1 บอกเราว่าคะแนน 25% ของคะแนนน้อยกว่า 68 และ 75% ของคะแนนชั้นเรียนจะสูงกว่า Q2 (ค่ามัธยฐาน) คือเปอร์เซ็นไทล์ที่ 50 และแสดงให้เห็นว่า 50% ของคะแนนน้อยกว่า 75 และ 50% ของคะแนนนั้นสูงกว่า 75 ในที่สุดไตรมาสที่ 3 เปอร์เซ็นต์ที่ 75 แสดงให้เห็นว่า 25% ของคะแนนนั้น มากกว่าและ 75% น้อยกว่า 84
ข้อควรพิจารณาพิเศษ
หากจุดข้อมูลสำหรับ Q1 อยู่ห่างจากค่ามัธยฐานมากกว่าไตรมาส 3 มาจากค่ามัธยฐานเราสามารถบอกได้ว่ามีการกระจายตัวที่มากขึ้นในค่าที่เล็กกว่าของชุดข้อมูลมากกว่าในค่าขนาดใหญ่ ตรรกะเดียวกันนี้ใช้ถ้า Q3 อยู่ห่างจาก Q2 มากกว่า Q1 มาจากค่ามัธยฐาน
อีกทางหนึ่งหากมีจุดข้อมูลจำนวนเท่ากันค่ามัธยฐานจะเป็นค่าเฉลี่ยของตัวเลขสองจุดกลาง ในตัวอย่างของเราด้านบนถ้าเรามีนักเรียน 20 คนแทนที่จะเป็น 19 ค่ามัธยฐานของคะแนนของพวกเขาจะเป็นค่าเฉลี่ยเลขคณิตของเลขสิบและเลขสิบเอ็ด
Quartiles ใช้ในการคำนวณช่วง interquartile ซึ่งเป็นการวัดความแปรปรวนรอบมัธยฐาน ช่วง interquartile นั้นคำนวณได้ง่าย ๆ ว่าเป็นความแตกต่างระหว่างควอไทล์ตัวแรกและตัวที่สาม: Q3 - Q1 ผลก็คือช่วงของครึ่งกลางของข้อมูลที่แสดงว่าการกระจายข้อมูลเป็นอย่างไร
สำหรับชุดข้อมูลขนาดใหญ่ Microsoft Excel มีฟังก์ชัน QUARTILE เพื่อคำนวณควอไทล์