Homoskedastic คืออะไร?
Homoskedastic (เช่นการสะกดคำว่า "homoscedastic") หมายถึงเงื่อนไขที่ความแปรปรวนของส่วนที่เหลือหรือคำผิดพลาดในรูปแบบการถดถอยเป็นค่าคงที่ นั่นคือคำผิดพลาดไม่ได้เปลี่ยนแปลงมากนักเนื่องจากค่าของตัวแปรตัวทำนายเปลี่ยนแปลง อย่างไรก็ตามการขาด homoskedasticity อาจแนะนำว่าตัวแบบการถดถอยอาจต้องรวมตัวแปรทำนายเพิ่มเติมเพื่ออธิบายประสิทธิภาพของตัวแปรตาม
ประเด็นที่สำคัญ
- Homoskedasticity เกิดขึ้นเมื่อความแปรปรวนของคำผิดพลาดในตัวแบบการถดถอยมีค่าคงที่ หากความแปรปรวนของคำข้อผิดพลาดเป็น homoskedastic รูปแบบที่ได้รับการกำหนดไว้อย่างดี หากมีความแปรปรวนมากเกินไปตัวแบบอาจไม่ชัดเจน การเพิ่มตัวแปรตัวทำนายเพิ่มเติมสามารถช่วยอธิบายประสิทธิภาพของตัวแปรตามได้โดยตรงความแตกต่างของ heteroskedasticity เกิดขึ้นเมื่อความแปรปรวนของคำผิดพลาดไม่คงที่
Homoskedastic ทำงานอย่างไร
Homoskedasticity เป็นหนึ่งในสมมติฐานของการสร้างแบบจำลองการถดถอยเชิงเส้น หากความแปรปรวนของข้อผิดพลาดรอบ ๆ เส้นถดถอยแตกต่างกันมากรูปแบบการถดถอยอาจถูกกำหนดไว้ไม่ดี ตรงกันข้ามของ homoskedasticity คือ heteroskedasticity เหมือนกับที่ตรงกันข้ามกับ "homogenous" คือ "heterogeneous" Heteroskedasticity (เช่นการสะกดคำว่า "heteroscedasticity") หมายถึงเงื่อนไขที่ความแปรปรวนของคำผิดพลาดในสมการถดถอยไม่คงที่
เมื่อพิจารณาความแปรปรวนนั้นเป็นความแตกต่างที่วัดได้ระหว่างผลลัพธ์ที่คาดการณ์กับผลลัพธ์ที่เกิดขึ้นจริงของสถานการณ์ที่กำหนดการกำหนด homoskedasticity สามารถช่วยกำหนดปัจจัยที่จำเป็นต้องปรับเพื่อความถูกต้อง
ข้อควรพิจารณาพิเศษ
แบบจำลองการถดถอยอย่างง่ายหรือสมการประกอบด้วยสี่คำ ทางด้านซ้ายเป็นตัวแปรตาม มันแสดงถึงปรากฏการณ์ที่แบบจำลองพยายามที่จะ "อธิบาย" ทางด้านขวาเป็นค่าคงที่ตัวแปรทำนายและส่วนที่เหลือหรือข้อผิดพลาดคำ คำผิดพลาดแสดงจำนวนของความแปรปรวนในตัวแปรตามที่ไม่ได้อธิบายโดยตัวแปรทำนาย
ตัวอย่างของ Homoskedastic
ตัวอย่างเช่นสมมติว่าคุณต้องการอธิบายคะแนนการทดสอบของนักเรียนโดยใช้ระยะเวลาที่นักเรียนใช้ในการเรียน ในกรณีนี้คะแนนการทดสอบจะเป็นตัวแปรตามและเวลาที่ใช้ในการศึกษาจะเป็นตัวแปรทำนาย
คำผิดพลาดจะแสดงจำนวนความแปรปรวนในคะแนนการทดสอบที่ไม่ได้อธิบายตามระยะเวลาที่ศึกษา หากความแปรปรวนนั้นเหมือนกันหรือ homoskedastic นั่นก็จะเป็นการแนะนำโมเดลที่อาจเป็นคำอธิบายที่เพียงพอสำหรับการทดสอบ - อธิบายในแง่ของเวลาที่ใช้ในการศึกษา
แต่ความแปรปรวนอาจแตกต่างกันไป พล็อตของข้อมูลคำผิดพลาดอาจแสดงเวลาการศึกษาจำนวนมากติดต่อใกล้ชิดมากกับคะแนนการทดสอบที่สูง แต่คะแนนการทดสอบเวลาการศึกษาต่ำที่แตกต่างกันอย่างกว้างขวางและรวมถึงบางคะแนนที่สูงมาก ดังนั้นความแปรปรวนของคะแนนจึงไม่สามารถอธิบายได้อย่างชัดเจนโดยตัวแปรทำนายหนึ่งตัว - ระยะเวลาที่ศึกษา ในกรณีนี้อาจมีปัจจัยอื่น ๆ ในการทำงานและโมเดลอาจต้องได้รับการปรับปรุงเพื่อระบุตัวตนหรือพวกเขา การสอบสวนเพิ่มเติมอาจเปิดเผยว่านักเรียนบางคนได้เห็นคำตอบของการทดสอบล่วงหน้าหรือว่าพวกเขาเคยทำแบบทดสอบที่คล้ายกันมาก่อนดังนั้นจึงไม่จำเป็นต้องเรียนสำหรับการทดสอบนี้โดยเฉพาะ
เพื่อปรับปรุงรูปแบบการถดถอยผู้วิจัยจะเพิ่มตัวแปรอธิบายเพิ่มเติมเพื่อระบุว่านักเรียนได้เห็นคำตอบก่อนการทดสอบหรือไม่ ตัวแบบการถดถอยจะมีตัวแปรอธิบายสองแบบคือเวลาเรียนและนักเรียนมีความรู้ก่อนคำตอบหรือไม่ ด้วยตัวแปรทั้งสองนี้จะมีการอธิบายความแปรปรวนของคะแนนการทดสอบมากขึ้นและความแปรปรวนของคำผิดพลาดอาจเป็นแบบ homoskedastic ซึ่งแสดงให้เห็นว่าแบบจำลองนั้นมีการกำหนดชัดเจน