Multicollinearity คืออะไร?
Multicollinearity คือการเกิดสัมพันธภาพสูงระหว่างตัวแปรอิสระในตัวแบบการถดถอยพหุคูณ Multicollinearity สามารถนำไปสู่ผลลัพธ์ที่บิดเบือนหรือทำให้เข้าใจผิดเมื่อนักวิจัยหรือนักวิเคราะห์พยายามที่จะกำหนดว่าตัวแปรอิสระแต่ละตัวสามารถใช้งานได้อย่างมีประสิทธิภาพมากที่สุดในการทำนายหรือเข้าใจตัวแปรตามในรูปแบบสถิติ โดยทั่วไปความสัมพันธ์หลายระดับอาจนำไปสู่ช่วงความมั่นใจที่กว้างขึ้นและค่าความน่าจะเป็นที่เชื่อถือได้น้อยลงสำหรับตัวแปรอิสระ นั่นคือการอนุมานเชิงสถิติจากโมเดลที่มีความสัมพันธ์หลายระดับอาจไม่น่าเชื่อถือ
การทำความเข้าใจความหลากหลายทางหลายระดับ
นักวิเคราะห์ทางสถิติใช้แบบจำลองการถดถอยหลายแบบเพื่อทำนายค่าของตัวแปรตามที่ระบุตามค่าของตัวแปรอิสระสองตัวหรือมากกว่า ตัวแปรที่ขึ้นต่อกันบางครั้งเรียกว่าผลลัพธ์เป้าหมายหรือตัวแปรที่เป็นเกณฑ์ ตัวอย่างคือรูปแบบการถดถอยหลายตัวแปรที่พยายามคาดการณ์ผลตอบแทนจากหุ้นตามรายการเช่นอัตราส่วนราคาต่อกำไร, มูลค่าหลักทรัพย์ตามราคาตลาด, ผลการดำเนินงานในอดีตหรือข้อมูลอื่น ๆ การส่งคืนสต็อคเป็นตัวแปรตามและบิตข้อมูลการเงินต่างๆเป็นตัวแปรอิสระ
ประเด็นที่สำคัญ
- Multicollinearity เป็นแนวคิดทางสถิติที่ตัวแปรอิสระในแบบจำลองมีความสัมพันธ์กัน Multicollinearity ระหว่างตัวแปรอิสระจะส่งผลให้มีการอนุมานทางสถิติที่เชื่อถือได้น้อยกว่าการใช้ตัวแปรอิสระที่ไม่สัมพันธ์กันหรือซ้ำ ๆ กันเมื่อสร้างแบบจำลองการถดถอยหลายตัวที่ใช้สองตัวแปรขึ้นไป.
Multicollinearity ในตัวแบบการถดถอยแบบหลายครั้งบ่งชี้ว่าตัวแปรอิสระของ collinear เกี่ยวข้องกับแฟชั่นบางอย่างแม้ว่าความสัมพันธ์อาจจะใช่หรือไม่ก็ได้ ตัวอย่างเช่นผลการดำเนินงานในอดีตอาจเกี่ยวข้องกับมูลค่าหลักทรัพย์ตามราคาตลาดเนื่องจากหุ้นที่มีผลประกอบการดีในอดีตจะมีมูลค่าตลาดเพิ่มขึ้น กล่าวอีกนัยหนึ่งความหลากหลายทางชีวภาพสามารถเกิดขึ้นได้เมื่อตัวแปรอิสระสองตัวมีความสัมพันธ์กันสูง นอกจากนี้ยังสามารถเกิดขึ้นได้หากคำนวณตัวแปรอิสระจากตัวแปรอื่น ๆ ในชุดข้อมูลหรือหากตัวแปรอิสระสองตัวให้ผลลัพธ์ที่คล้ายกันและซ้ำ ๆ กัน
วิธีที่ใช้กันมากที่สุดวิธีหนึ่งในการขจัดปัญหาของความหลากหลายทางชีวภาพคือการระบุตัวแปรอิสระของ collinear ก่อนจากนั้นจึงลบทั้งหมดยกเว้น นอกจากนี้ยังเป็นไปได้ที่จะกำจัด multicollinearity โดยการรวมตัวแปร collinear สองตัวหรือมากกว่าไว้ในตัวแปรเดียว การวิเคราะห์ทางสถิติสามารถดำเนินการเพื่อศึกษาความสัมพันธ์ระหว่างตัวแปรตามที่ระบุและตัวแปรอิสระเพียงตัวเดียว
ตัวอย่างของ Multicollinearity
สำหรับการลงทุนความหลากหลายทางหลายทางเป็นการพิจารณาร่วมกันเมื่อทำการวิเคราะห์ทางเทคนิคเพื่อทำนายการเคลื่อนไหวของราคาในอนาคตที่เป็นไปได้ของหลักทรัพย์เช่นหุ้นหรือสินค้าโภคภัณฑ์ในอนาคต นักวิเคราะห์ตลาดต้องการหลีกเลี่ยงการใช้ตัวชี้วัดทางเทคนิคที่มี collinear ว่าพวกเขาอยู่บนพื้นฐานของข้อมูลที่คล้ายกันมากหรือที่เกี่ยวข้อง; พวกเขามีแนวโน้มที่จะเปิดเผยการคาดการณ์ที่คล้ายกันเกี่ยวกับตัวแปรตามการเคลื่อนไหวของราคา แต่การวิเคราะห์ตลาดจะต้องขึ้นอยู่กับตัวแปรอิสระที่แตกต่างกันอย่างชัดเจนเพื่อให้แน่ใจว่าพวกเขาวิเคราะห์ตลาดจากมุมมองการวิเคราะห์อิสระที่แตกต่างกัน
นักวิเคราะห์ทางเทคนิคที่โด่งดัง John Bollinger ซึ่งเป็นผู้สร้างตัวบ่งชี้ Bollinger Bands กล่าวว่า "กฎสำคัญสำหรับการใช้การวิเคราะห์ทางเทคนิคที่ประสบความสำเร็จต้องหลีกเลี่ยง multicollinearity ท่ามกลางตัวชี้วัด"
เพื่อแก้ไขปัญหานักวิเคราะห์หลีกเลี่ยงการใช้ตัวชี้วัดทางเทคนิคอย่างน้อยสองประเภทที่เหมือนกัน แต่พวกเขาวิเคราะห์ความปลอดภัยโดยใช้ตัวบ่งชี้ประเภทหนึ่งเช่นตัวบ่งชี้โมเมนตัมแล้วทำการวิเคราะห์แยกต่างหากโดยใช้ตัวบ่งชี้ประเภทอื่นเช่นตัวบ่งชี้แนวโน้ม
ตัวอย่างของปัญหาความหลากหลายทางชีวภาพที่อาจเกิดขึ้นกำลังทำการวิเคราะห์ทางเทคนิคโดยใช้ตัวบ่งชี้ที่คล้ายคลึงกันหลายตัวเท่านั้นเช่น stochastics, ดัชนีความแข็งแรงสัมพัทธ์ (RSI) และ Williams% R ซึ่งเป็นตัวชี้วัดโมเมนตัมทั้งหมดที่อาศัยอินพุตที่คล้ายกัน ผล. ในกรณีนี้จะเป็นการดีกว่าที่จะลบทั้งหมดยกเว้นตัวบ่งชี้ตัวใดตัวหนึ่งหรือหาวิธีที่จะรวมตัวบ่งชี้หลายตัวเป็นตัวบ่งชี้เดียวในขณะที่เพิ่มตัวบ่งชี้แนวโน้มที่ไม่น่าจะมีความสัมพันธ์สูงกับตัวบ่งชี้โมเมนตัม