การถดถอยเชิงเส้นคืออะไร
การถดถอยเชิงเส้นเป็นพล็อตข้อมูลที่กราฟความสัมพันธ์เชิงเส้นระหว่างตัวแปรอิสระและตัวแปรตาม โดยทั่วไปแล้วจะใช้เพื่อแสดงความแข็งแกร่งของความสัมพันธ์และการกระจายของผลลัพธ์ - ทั้งหมดเพื่อจุดประสงค์ในการอธิบายพฤติกรรมของตัวแปรตาม
สมมติว่าเราต้องการทดสอบความแข็งแรงของความสัมพันธ์ระหว่างปริมาณไอศกรีมที่รับประทานกับความอ้วน เราจะนำตัวแปรอิสระจำนวนไอศครีมและเกี่ยวข้องกับตัวแปรตาม, โรคอ้วน, เพื่อดูว่ามีความสัมพันธ์หรือไม่ เมื่อพิจารณาการถดถอยคือการแสดงผลกราฟิกของความสัมพันธ์นี้ความแปรปรวนของข้อมูลที่ลดลงความสัมพันธ์ที่แข็งแกร่งยิ่งขึ้นและความกระชับที่เหมาะสมกับบรรทัดการถดถอย
ประเด็นที่สำคัญ
- ตัวแบบการถดถอยเชิงเส้นความสัมพันธ์ระหว่างตัวแปรที่ขึ้นกับและอิสระการวิเคราะห์การถดถอยสามารถทำได้ถ้าตัวแปรนั้นเป็นอิสระไม่มี heteroscedasticity และเงื่อนไขข้อผิดพลาดของตัวแปรนั้นไม่สัมพันธ์กันการสร้างสมการถดถอยเชิงเส้นใน Excel นั้นง่ายขึ้นด้วย ToolPak การวิเคราะห์ข้อมูล
ข้อควรพิจารณาที่สำคัญ
มีสมมติฐานที่สำคัญบางประการเกี่ยวกับชุดข้อมูลของคุณที่จะต้องเป็นจริงเพื่อดำเนินการวิเคราะห์การถดถอย:
- ตัวแปรจะต้องเป็นอิสระอย่างแท้จริง (ใช้การทดสอบ Chi-Square) ข้อมูลจะต้องมีความแปรปรวนข้อผิดพลาดที่แตกต่างกัน (ซึ่งเรียกว่า heteroskedasticity (เช่นการสะกดคำ heteroscedasticity)) ข้อผิดพลาดของแต่ละตัวแปรจะต้องไม่เกี่ยวข้องกัน ถ้าไม่นั่นหมายความว่าตัวแปรนั้นมีความสัมพันธ์กันตามลำดับ
ถ้าสามสิ่งนั้นฟังดูซับซ้อน แต่ผลของการพิจารณาข้อใดข้อหนึ่งที่ไม่เป็นความจริงก็คือการประเมินแบบลำเอียง โดยพื้นฐานแล้วคุณอาจบิดเบือนความสัมพันธ์ที่คุณวัด
การแสดงผลการถดถอยใน Excel
ขั้นตอนแรกในการเรียกใช้การวิเคราะห์การถดถอยใน Excel คือการตรวจสอบอีกครั้งว่าติดตั้ง ToolPak การวิเคราะห์ข้อมูลปลั๊กอินของ Excel ฟรี ปลั๊กอินนี้ทำให้การคำนวณช่วงของสถิติง่ายมาก ไม่ จำเป็นต้องสร้างแผนภูมิเส้นการถดถอยเชิงเส้น แต่ทำให้การสร้างตารางสถิติง่ายขึ้น หากต้องการตรวจสอบว่าติดตั้งไว้หรือไม่ให้เลือก "ข้อมูล" จากแถบเครื่องมือ หาก "การวิเคราะห์ข้อมูล" เป็นตัวเลือกคุณสมบัติจะถูกติดตั้งและพร้อมใช้งาน หากไม่ได้ติดตั้งคุณสามารถขอตัวเลือกนี้ได้โดยคลิกที่ปุ่ม Office แล้วเลือก "ตัวเลือกของ Excel"
การใช้ Data Analysis ToolPak การสร้างผลลัพธ์การถดถอยเพียงไม่กี่คลิก
ตัวแปรอิสระจะอยู่ในช่วง X
เมื่อได้รับผลตอบแทน S&P 500 เราต้องการทราบว่าเราสามารถประเมินความแข็งแกร่งและความสัมพันธ์ของผลตอบแทนของวีซ่า (V) ได้หรือไม่ สต็อก Visa (V) ส่งคืนข้อมูลจะเติมคอลัมน์ 1 เป็นตัวแปรตาม S&P 500 ส่งคืนข้อมูลที่เติมคอลัมน์ 2 เป็นตัวแปรอิสระ
- เลือก "ข้อมูล" จากแถบเครื่องมือ เมนู "ข้อมูล" จะปรากฏขึ้นเลือก "การวิเคราะห์ข้อมูล" กล่องโต้ตอบการวิเคราะห์ข้อมูล - เครื่องมือวิเคราะห์ปรากฏขึ้นจากเมนูเลือก "การถดถอย" และคลิก "ตกลง" ในกล่องโต้ตอบการถดถอยคลิกกล่อง "ช่วงสัญญาณเข้า Y" และเลือกสต็อคข้อมูลผันแปร (วีซ่า (V)) ผลตอบแทน) คลิกกล่อง "ช่วงสัญญาณเข้า X" และเลือกข้อมูลตัวแปรอิสระ (S&P 500 ผลตอบแทน) คลิก "ตกลง" เพื่อเรียกใช้ผลลัพธ์
ตีความผลลัพธ์
ใช้ข้อมูลนั้น (เหมือนกันจากบทความ R-squared ของเรา) เราได้รับตารางต่อไปนี้:
ค่า R 2 หรือที่เรียกว่าสัมประสิทธิ์การตัดสินใจวัดสัดส่วนของการเปลี่ยนแปลงในตัวแปรตามที่อธิบายโดยตัวแปรอิสระหรือแบบจำลองการถดถอยที่เหมาะสมกับข้อมูล ค่า R 2 อยู่ในช่วงตั้งแต่ 0 ถึง 1 และค่าที่สูงกว่าบ่งบอกถึงความพอดี ค่า p หรือค่าความน่าจะเป็นมีค่าตั้งแต่ 0 ถึง 1 และระบุว่าการทดสอบนั้นมีนัยสำคัญหรือไม่ ตรงกันข้ามกับค่า R 2 ค่า p ที่น้อยกว่านั้นเป็นที่น่าพอใจเนื่องจากมันบ่งบอกความสัมพันธ์ระหว่างตัวแปรที่ขึ้นกับและอิสระ
การสร้างแผนภูมิการถดถอยใน Excel
เราสามารถสร้างแผนภูมิการถดถอยใน Excel โดยเน้นข้อมูลและสร้างแผนภูมิเป็นพล็อตกระจาย ในการเพิ่มบรรทัดการถดถอยเลือก "เลย์เอาต์" จากเมนู "เครื่องมือแผนภูมิ" ในกล่องโต้ตอบเลือก "Trendline" และจากนั้น "Linear Trendline" ในการเพิ่มค่า R 2 ให้เลือก "More Trendline Options" จากเมนู "Trendline ในที่สุดเลือก" แสดงค่า R-squared บนกราฟ "ผลภาพจะแสดงถึงความแข็งแกร่งของความสัมพันธ์แม้ว่าจะไม่มีค่าใช้จ่าย รายละเอียดมากที่สุดเท่าที่ตารางข้างต้น