การกระจายตัวตัวอย่างคืออะไร
การแจกแจงตัวอย่างคือการแจกแจงความน่าจะเป็นของสถิติที่ได้จากตัวอย่างจำนวนมากที่ดึงมาจากประชากรเฉพาะ การกระจายตัวตัวอย่างของประชากรที่กำหนดคือการแจกแจงความถี่ของช่วงของผลลัพธ์ที่แตกต่างกันซึ่งอาจเกิดขึ้นสำหรับสถิติของประชากร
ทำความเข้าใจเกี่ยวกับการกระจายตัวตัวอย่าง
ข้อมูลจำนวนมากถูกดึงและใช้งานโดยนักวิชาการนักสถิตินักวิจัยนักการตลาดนักวิเคราะห์ ฯลฯ เป็นตัวอย่างจริง ๆ ไม่ใช่ประชากร ตัวอย่างคือส่วนย่อยของประชากร ตัวอย่างเช่นนักวิจัยทางการแพทย์ที่ต้องการเปรียบเทียบน้ำหนักเฉลี่ยของทารกทุกคนที่เกิดในอเมริกาเหนือจาก 1995-2005 กับผู้ที่เกิดในอเมริกาใต้ในช่วงเวลาเดียวกันไม่สามารถใช้เวลาในการดึงข้อมูลสำหรับประชากรทั้งหมดของ กว่าล้านลูกที่เกิดขึ้นในช่วงเวลาสิบปี เขาจะใช้น้ำหนักของพูดแทนเด็ก 100 คนในแต่ละทวีปเท่านั้นเพื่อหาข้อสรุป น้ำหนักของทารก 200 คนที่ใช้เป็นตัวอย่างและน้ำหนักเฉลี่ยที่คำนวณได้คือค่าเฉลี่ยตัวอย่าง
ตอนนี้สมมติว่าแทนที่จะใช้ตัวอย่างน้ำหนักทารกแรกเกิดเพียง 100 ตัวอย่างจากแต่ละทวีปนักวิจัยทางการแพทย์จะสุ่มตัวอย่างแบบสุ่มจากประชากรทั่วไปและคำนวณค่าเฉลี่ยตัวอย่างสำหรับแต่ละกลุ่มตัวอย่าง ดังนั้นสำหรับอเมริกาเหนือเขาดึงข้อมูลสำหรับน้ำหนักแรกเกิด 100 รายการที่บันทึกไว้ในสหรัฐอเมริกาแคนาดาและเม็กซิโกดังนี้: สี่ 100 ตัวอย่างจากโรงพยาบาลที่ได้รับการคัดเลือกในสหรัฐอเมริกาห้าตัวอย่าง 70 ตัวอย่างจากแคนาดาและอีกสามรายการจากเม็กซิโก 150 รายการ น้ำหนักทารกแรกเกิดรวม 1200 ชุดแบ่งเป็น 12 ชุด นอกจากนี้เขายังรวบรวมข้อมูลตัวอย่างน้ำหนักแรกเกิด 100 จาก 12 ประเทศในอเมริกาใต้
แต่ละตัวอย่างมีค่าเฉลี่ยตัวอย่างของตัวเองและการกระจายตัวของค่าเฉลี่ยตัวอย่างเรียกว่าการกระจายตัวอย่าง
น้ำหนักเฉลี่ยที่คำนวณสำหรับชุดตัวอย่างแต่ละชุดเป็นการกระจายตัวตัวอย่างของค่าเฉลี่ย ไม่ใช่แค่ค่าเฉลี่ยเท่านั้นที่สามารถคำนวณได้จากตัวอย่าง สถิติอื่น ๆ เช่นค่าเบี่ยงเบนมาตรฐานความแปรปรวนสัดส่วนและช่วงสามารถคำนวณได้จากข้อมูลตัวอย่าง ค่าเบี่ยงเบนมาตรฐานและการวัดความแปรปรวนความแปรปรวนของการกระจายตัวตัวอย่าง
จำนวนการสังเกตในประชากรจำนวนการสังเกตในตัวอย่างและกระบวนการที่ใช้ในการวาดชุดตัวอย่างเป็นตัวกำหนดความแปรปรวนของการแจกแจงตัวอย่าง ค่าเบี่ยงเบนมาตรฐานของการกระจายตัวตัวอย่างเรียกว่าข้อผิดพลาดมาตรฐาน ในขณะที่ค่าเฉลี่ยของการกระจายตัวตัวอย่างเท่ากับค่าเฉลี่ยของประชากรข้อผิดพลาดมาตรฐานขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐานของประชากรขนาดของประชากรและขนาดของกลุ่มตัวอย่าง
การรู้ว่าค่าเฉลี่ยของชุดตัวอย่างแต่ละชุดนั้นแยกจากกันและจากค่าเฉลี่ยของประชากรจะบ่งบอกว่าค่าเฉลี่ยตัวอย่างใกล้เคียงกับค่าเฉลี่ยของประชากรอย่างไร ข้อผิดพลาดมาตรฐานของการแจกแจงตัวอย่างจะลดลงเมื่อขนาดตัวอย่างเพิ่มขึ้น
ข้อควรพิจารณาพิเศษ
ประชากรหรือกลุ่มตัวอย่างหนึ่งชุดจะมีการแจกแจงแบบปกติ อย่างไรก็ตามเนื่องจากการกระจายการสุ่มตัวอย่างรวมถึงการสังเกตหลายชุดจึงไม่จำเป็นต้องมีรูปทรงระฆังโค้ง
จากตัวอย่างของเราประชากรทารกโดยเฉลี่ยในอเมริกาเหนือและอเมริกาใต้มีการแจกแจงแบบปกติเพราะเด็กบางคนจะมีน้ำหนักต่ำกว่าค่าเฉลี่ยหรือต่ำกว่าค่าเฉลี่ยส่วนใหญ่เป็นทารกที่อยู่ระหว่าง) หากน้ำหนักเฉลี่ยของทารกแรกเกิดในอเมริกาเหนือคือเจ็ดปอนด์ตัวอย่างน้ำหนักเฉลี่ยในแต่ละตัวอย่างการสังเกต 12 ชุดที่บันทึกไว้ในอเมริกาเหนือจะใกล้เคียงกับเจ็ดปอนด์เช่นกัน
อย่างไรก็ตามหากคุณวาดกราฟค่าเฉลี่ยแต่ละค่าที่คำนวณในแต่ละกลุ่มตัวอย่าง 1, 200 กลุ่มรูปร่างที่ได้อาจส่งผลให้เกิดการแจกแจงแบบเดียวกัน แต่เป็นการยากที่จะทำนายด้วยความมั่นใจว่ารูปร่างจริงจะออกมาเป็นอย่างไร ตัวอย่างยิ่งนักวิจัยใช้จากประชากรมากกว่าหนึ่งล้านน้ำหนักน้ำหนักยิ่งกราฟจะเริ่มก่อตัวกระจายปกติ
- การกระจายตัวตัวอย่างคือการแจกแจงความน่าจะเป็นของสถิติที่ได้จากตัวอย่างจำนวนมากที่ดึงมาจากประชากรเฉพาะการกระจายตัวตัวอย่างของประชากรที่กำหนดคือการแจกแจงความถี่ของช่วงของผลลัพธ์ที่แตกต่างกันซึ่งอาจเกิดขึ้นสำหรับสถิติของ ประชากรข้อมูลจำนวนมากที่ถูกวาดและใช้งานโดยนักวิชาการนักสถิตินักวิจัยนักการตลาดและนักวิเคราะห์ล้วนเป็นตัวอย่างไม่ใช่ประชากร