ความสัมพันธ์ปลอมคืออะไร
ในสถิติความสัมพันธ์แบบลวงตาหรือความลวงตาหมายถึงการเชื่อมต่อระหว่างตัวแปรสองตัวที่ปรากฏสาเหตุ แต่ไม่ใช่ ความสัมพันธ์ที่หลอกลวงมักมีลักษณะของตัวแปรตัวหนึ่ง ความสัมพันธ์ปลอมนี้มักจะเกิดจากปัจจัยที่สามที่ไม่ชัดเจนในเวลาของการตรวจสอบบางครั้งเรียกว่าปัจจัยรบกวน
ประเด็นที่สำคัญ
- Spurious Correlation หรือ Spuriousness คือเมื่อมีสองปัจจัยที่เกี่ยวข้องอย่างไม่เป็นทางการ แต่ไม่ปรากฏการปรากฏตัวของความสัมพันธ์เชิงสาเหตุมักเกิดจากการเคลื่อนไหวที่คล้ายกันบนแผนภูมิซึ่งกลายเป็นเรื่องบังเอิญหรือเกิดจากปัจจัย มักจะเกิดจากขนาดตัวอย่างขนาดเล็กหรือจุดปลายโดยพลการ
วิธีสหสัมพันธ์ปลอม
เมื่อตัวแปรสุ่มสองตัวติดตามกันและกันอย่างใกล้ชิดบนกราฟมันเป็นเรื่องง่ายที่จะสงสัยความสัมพันธ์หรือความสัมพันธ์ระหว่างสองปัจจัยที่การเปลี่ยนแปลงส่งผลกระทบต่ออีก นอกเหนือจาก "สาเหตุ" หัวข้ออื่นการสังเกตนี้สามารถนำผู้อ่านของแผนภูมิที่จะเชื่อว่าการเคลื่อนไหวของตัวแปร A เชื่อมโยงกับการเคลื่อนไหวในตัวแปร B หรือในทางกลับกัน แต่บางครั้งเมื่อตรวจสอบเชิงสถิติอย่างใกล้ชิดความเคลื่อนไหวที่สอดคล้องกันนั้นเกิดขึ้นโดยบังเอิญหรือเกิดจากปัจจัยที่สามที่ส่งผลต่อสองคนแรก นี่คือความสัมพันธ์ปลอม งานวิจัยที่ทำกับกลุ่มตัวอย่างขนาดเล็กหรือจุดสิ้นสุดโดยพลการนั้นมีลักษณะเฉพาะที่ไวต่อการทำให้เป็นลวง
ตัวอย่างของความสัมพันธ์ปลอม
ไม่ยากเกินไปที่จะค้นหาความสัมพันธ์ที่น่าสนใจ หลายคนจะกลายเป็นว่าเก๊ สำหรับสายพันธุ์ตัวผู้ที่ Wall Street ความสัมพันธ์ปลอมแปลงที่เป็นที่นิยมสองรายการเกี่ยวข้องกับผู้หญิงและกีฬา กำเนิดในปี 1920 เป็นทฤษฎีความยาวกระโปรงซึ่งถือว่าความยาวกระโปรงและทิศทางการลงทุนในตลาดหุ้นมีความสัมพันธ์ หากความยาวกระโปรงยาวนั่นหมายความว่าตลาดหุ้นกำลังจะตก หากพวกเขาสั้นตลาดจะเพิ่มขึ้น ประมาณปลายเดือนมกราคมมีการพูดคุยเกี่ยวกับตัวบ่งชี้ที่เรียกว่าซูเปอร์โบว์ลซึ่งแสดงให้เห็นว่าการชนะโดยทีม AFC น่าจะหมายความว่าตลาดหุ้นจะลดลงในปีที่จะมาถึงในขณะที่ชัยชนะของทีมเงื่อนงำ ตลาด. ตั้งแต่ปีพ. ศ. 2509 ตัวบ่งชี้มีอัตราความแม่นยำ 80% มันเป็นบทสนทนาที่สนุกสนาน แต่อาจไม่ใช่สิ่งที่ผู้แนะนำทางการเงินที่จริงจังจะแนะนำเป็นกลยุทธ์การลงทุนสำหรับลูกค้า
นี่คือตัวอย่างเพิ่มเติมของสหสัมพันธ์ปลอม:
- การจมน้ำเพิ่มขึ้นเมื่อยอดขายไอศกรีมเพิ่มขึ้น ดูเหมือนว่าการขายไอศกรีมที่เพิ่มขึ้นทำให้เกิดการจมน้ำมากขึ้น แต่ในความเป็นจริงความร้อนที่เพิ่มขึ้นอาจทำให้ผู้คนจำนวนมากขึ้นไปว่ายน้ำและซื้อไอศกรีมเพิ่มขึ้นอัตราการฆาตกรรมของสหรัฐระหว่างปี 2549-2554 ลดลงในอัตราเดียวกับ Microsoft Internet Explorer การใช้งานผู้บริหารที่พูดว่าได้โปรดและขอบคุณมากขึ้นมักจะสนุกกับการแบ่งปันที่ดีกว่าคนที่สวมอุปกรณ์ในทีมของ Oakland Raiders มีแนวโน้มที่จะก่ออาชญากรรมมากกว่า
วิธีการระบุความสัมพันธ์ปลอม
นักสถิติและนักวิทยาศาสตร์คนอื่น ๆ ที่วิเคราะห์ข้อมูลจะต้องมองหาความสัมพันธ์ที่น่าเกรงขามตลอดเวลา มีวิธีการมากมายที่ใช้ ได้แก่:
- การทำให้แน่ใจว่าตัวอย่างตัวแทนที่เหมาะสมได้รับขนาดตัวอย่างที่เพียงพอการระวังจุดปลายทางโดยพลการควบคุมตัวแปรภายนอกให้มากที่สุดเท่าที่จะทำได้การใช้สมมติฐานว่างเปล่าและการตรวจสอบค่า p ที่แข็งแกร่ง