การถดถอยเชิงเส้นแบบหลายค่าคืออะไร - MLR
การถดถอยเชิงเส้นหลายครั้ง (MLR) หรือที่รู้จักกันเพียงแค่การถดถอยหลายครั้งเป็นเทคนิคทางสถิติที่ใช้ตัวแปรอธิบายหลายอย่างเพื่อทำนายผลลัพธ์ของตัวแปรตอบกลับ เป้าหมายของการถดถอยเชิงเส้นหลายครั้ง (MLR) คือการสร้างแบบจำลองความสัมพันธ์เชิงเส้นระหว่างตัวแปรอธิบาย (อิสระ) และตัวแปรการตอบสนอง (ขึ้นอยู่กับ)
ในสาระสำคัญการถดถอยแบบหลายจุดเป็นส่วนขยายของการถดถอยแบบสี่เหลี่ยมจัตุรัสน้อยที่สุด (OLS) ที่เกี่ยวข้องกับตัวแปรอธิบายมากกว่าหนึ่งตัว
สูตรสำหรับการถดถอยเชิงเส้นแบบหลายค่าคือ
yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + ϵwhere, สำหรับ i = n การสังเกต: yi = ตัวแปรที่ขึ้นต่อกัน = ตัวแปรexpanatoryβ0 = y-intercept (ค่าคงที่ ภาคเรียนβp = ค่าสัมประสิทธิ์ความชันสำหรับตัวแปรอธิบายแต่ละตัว ϵ = เทอมข้อผิดพลาดของแบบจำลอง (หรือที่เรียกว่าส่วนที่เหลือ)
อธิบายการถดถอยเชิงเส้นหลายเส้น
การถดถอยเชิงเส้นอย่างง่ายเป็นฟังก์ชั่นที่ช่วยให้นักวิเคราะห์หรือนักสถิติสามารถคาดการณ์เกี่ยวกับตัวแปรหนึ่งตัวจากข้อมูลที่ทราบเกี่ยวกับตัวแปรอื่น การถดถอยเชิงเส้นสามารถใช้ได้เมื่อมีตัวแปรต่อเนื่องสองตัวนั่นคือตัวแปรอิสระและตัวแปรตาม ตัวแปรอิสระคือพารามิเตอร์ที่ใช้ในการคำนวณตัวแปรหรือผลลัพธ์ ตัวแบบการถดถอยหลายแบบขยายไปถึงตัวแปรอธิบายหลายอย่าง
ตัวแบบการถดถอยพหุคูณขึ้นอยู่กับสมมติฐานดังต่อไปนี้:
- มีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรตามและตัวแปรอิสระตัวแปรอิสระไม่ได้มีความสัมพันธ์กันมากเกินไปการสังเกตของ ฉัน ถูกเลือกอย่างอิสระและสุ่มจากประชากรควรแจกแจงปกติด้วยค่าเฉลี่ย 0 และความแปรปรวน σ
สัมประสิทธิ์การตัดสินใจ (R-squared) เป็นตัวชี้วัดทางสถิติที่ใช้ในการวัดความแปรปรวนของผลลัพธ์ที่สามารถอธิบายได้โดยการเปลี่ยนแปลงในตัวแปรอิสระ R 2 เพิ่มขึ้นเสมอเมื่อมีการเพิ่มตัวทำนายมากขึ้นในโมเดล MLR แม้ว่าตัวทำนายอาจไม่เกี่ยวข้องกับตัวแปรผลลัพธ์
R 2 ไม่สามารถใช้เพื่อระบุว่าตัวทำนายควรรวมอยู่ในรูปแบบใดและควรแยกออก R 2 สามารถอยู่ระหว่าง 0 ถึง 1 เท่านั้นโดยที่ 0 บ่งชี้ว่าผลลัพธ์ไม่สามารถคาดการณ์ได้โดยตัวแปรอิสระใด ๆ และ 1 บ่งชี้ว่าผลลัพธ์สามารถทำนายได้โดยไม่มีข้อผิดพลาดจากตัวแปรอิสระ
เมื่อตีความผลลัพธ์ของการถดถอยหลายครั้งสัมประสิทธิ์เบต้าจะใช้ได้ในขณะที่คงที่ตัวแปรอื่น ๆ ทั้งหมดให้คงที่ ("ทุกคนเท่าเทียมกัน") เอาต์พุตจากการถดถอยหลายครั้งสามารถแสดงในแนวนอนเป็นสมการหรือแนวตั้งในรูปแบบตาราง
ตัวอย่างการใช้การถดถอยเชิงเส้นหลายครั้ง
ตัวอย่างเช่นนักวิเคราะห์อาจต้องการทราบว่าการเคลื่อนไหวของตลาดมีผลต่อราคาของ Exxon Mobil (XOM) อย่างไร ในกรณีนี้สมการเชิงเส้นของเขาจะมีค่าของดัชนี S&P 500 เป็นตัวแปรอิสระหรือตัวทำนายและราคาของ XOM เป็นตัวแปรตาม
ในความเป็นจริงมีหลายปัจจัยที่ทำนายผลลัพธ์ของเหตุการณ์ ยกตัวอย่างเช่นการเคลื่อนไหวของราคาของเอ็กซอนโมบิลนั้นขึ้นอยู่กับประสิทธิภาพของตลาดโดยรวม ตัวทำนายอื่น ๆ เช่นราคาน้ำมันอัตราดอกเบี้ยและการเคลื่อนไหวของราคาน้ำมันล่วงหน้าอาจส่งผลต่อราคาของ XOM และราคาหุ้นของ บริษัท น้ำมันอื่น ๆ เพื่อให้เข้าใจถึงความสัมพันธ์ที่มีตัวแปรมากกว่าสองตัวจะใช้การถดถอยเชิงเส้นหลายเส้น
การถดถอยเชิงเส้นหลายครั้ง (MLR) ใช้เพื่อกำหนดความสัมพันธ์ทางคณิตศาสตร์ระหว่างตัวแปรสุ่มจำนวนหนึ่ง กล่าวอีกนัยหนึ่ง MLR ตรวจสอบว่ามีตัวแปรอิสระหลายตัวที่เกี่ยวข้องกับตัวแปรตาม เมื่อแต่ละปัจจัยอิสระได้รับการพิจารณาเพื่อทำนายตัวแปรตามแล้วข้อมูลเกี่ยวกับตัวแปรหลายตัวสามารถใช้ในการสร้างการทำนายที่แม่นยำในระดับของผลกระทบที่พวกเขามีต่อตัวแปรผลลัพธ์ โมเดลสร้างความสัมพันธ์ในรูปแบบของเส้นตรง (เชิงเส้น) ที่ใกล้เคียงที่สุดกับจุดข้อมูลทั้งหมด
อ้างถึงสมการ MLR ข้างต้นในตัวอย่างของเรา:
- y i = ตัวแปรตาม: ราคาของ XOMx i1 = อัตราดอกเบี้ย x i2 = น้ำมัน pricex i3 = ค่าของ S&P 500 indexx i4 = ราคาของฟิวเจอร์สน้ำมัน B 0 = ค่าตัดแกน y ที่เวลา zeroB 1 = สัมประสิทธิ์การถดถอยที่วัดการเปลี่ยนแปลงของหน่วยในการพึ่งพา ตัวแปรเมื่อ x i1 เปลี่ยนแปลง - การเปลี่ยนแปลงของราคา XOM เมื่ออัตราดอกเบี้ยเปลี่ยน B 2 = ค่าสัมประสิทธิ์ที่วัดการเปลี่ยนแปลงหน่วยในตัวแปรตามเมื่อ x i2 เปลี่ยนแปลง - การเปลี่ยนแปลงในราคา XOM เมื่อราคาน้ำมันเปลี่ยนแปลง
การประมาณกำลังสองน้อยที่สุดคือ B 0, B 1, B 2 … B p มักจะคำนวณโดยซอฟต์แวร์ทางสถิติ เนื่องจากตัวแปรจำนวนมากสามารถรวมอยู่ในตัวแบบการถดถอยซึ่งตัวแปรอิสระแต่ละตัวจะมีความแตกต่างกับตัวเลข —1, 2, 3, 4… p แบบจำลองการถดถอยหลายแบบช่วยให้นักวิเคราะห์สามารถทำนายผลลัพธ์ตามข้อมูลที่ให้ไว้ในตัวแปรอธิบายหลายตัว
ถึงกระนั้นโมเดลก็ยังไม่แม่นยำอย่างสมบูรณ์แบบเนื่องจากจุดข้อมูลแต่ละจุดอาจแตกต่างกันเล็กน้อยจากผลลัพธ์ที่ทำนายโดยตัวแบบ มูลค่าคงเหลือ E ซึ่งเป็นความแตกต่างระหว่างผลลัพธ์จริงและผลลัพธ์ที่คาดการณ์ไว้จะถูกรวมไว้ในแบบจำลองเพื่ออธิบายความแปรปรวนเล็กน้อยดังกล่าว
สมมติว่าเราใช้โมเดลการถดถอยราคา XOM ของเราผ่านซอฟต์แวร์การคำนวณสถิติที่ส่งคืนผลลัพธ์นี้:
นักวิเคราะห์จะตีความผลลัพธ์นี้เป็นค่าเฉลี่ยหากตัวแปรอื่น ๆ คงที่ราคา XOM จะเพิ่มขึ้น 7.8% หากราคาน้ำมันในตลาดเพิ่มขึ้น 1% ตัวแบบยังแสดงให้เห็นว่าราคาของ XOM จะลดลง 1.5% ตามอัตราดอกเบี้ยที่เพิ่มขึ้น 1% R 2 ระบุว่า 86.5% ของการเปลี่ยนแปลงของราคาหุ้นของเอ็กซอนโมบิลสามารถอธิบายได้โดยการเปลี่ยนแปลงของอัตราดอกเบี้ยราคาน้ำมันฟิวเจอร์สน้ำมันและดัชนี S&P 500
ประเด็นที่สำคัญ
- การถดถอยเชิงเส้นหลายเส้น (MLR) หรือที่รู้จักกันเพียงแค่การถดถอยแบบหลายครั้งเป็นเทคนิคทางสถิติที่ใช้ตัวแปรอธิบายหลายอย่างเพื่อทำนายผลลัพธ์ของตัวแปรตอบสนองการถดถอยหลายครั้งเป็นส่วนขยายของการถดถอยเชิงเส้น MLR ถูกใช้อย่างกว้างขวางในเศรษฐมิติและการอนุมานทางการเงิน
ความแตกต่างระหว่างการถดถอยเชิงเส้นและหลาย
การถดถอยเชิงเส้น (OLS) เปรียบเทียบการตอบสนองของตัวแปรตามที่กำหนดเนื่องจากการเปลี่ยนแปลงในตัวแปรอธิบายบางอย่าง อย่างไรก็ตามมันเป็นเรื่องยากที่จะอธิบายตัวแปรตามเพียงตัวแปรเดียว ในกรณีนี้นักวิเคราะห์ใช้การถดถอยหลายครั้งซึ่งพยายามอธิบายตัวแปรตามโดยใช้ตัวแปรอิสระมากกว่าหนึ่งตัว การถดถอยหลายแบบสามารถเป็นแบบเชิงเส้นและไม่เชิงเส้น
การถดถอยหลายครั้งขึ้นอยู่กับข้อสันนิษฐานว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรตามและตัวแปรอิสระ นอกจากนี้ยังไม่มีความสัมพันธ์ที่สำคัญระหว่างตัวแปรอิสระ