การทดสอบแบบสองทางคืออะไร
ในสถิติการทดสอบแบบสองด้านเป็นวิธีที่พื้นที่วิกฤตของการแจกแจงนั้นเป็นแบบสองด้านและการทดสอบว่าตัวอย่างนั้นมีค่ามากกว่าหรือน้อยกว่าค่าที่กำหนด มันถูกใช้ในการทดสอบและการทดสอบสมมติฐานว่างสำหรับนัยสำคัญทางสถิติ หากตัวอย่างที่กำลังทดสอบตกลงไปในพื้นที่วิกฤตจะยอมรับสมมติฐานทางเลือกแทนสมมติฐานว่าง การทดสอบแบบสองด้านได้รับชื่อจากการทดสอบพื้นที่ใต้ก้อยทั้งสองของการแจกแจงแบบปกติแม้ว่าการทดสอบนั้นสามารถใช้ในการแจกแจงแบบไม่ปกติอื่น ๆ ก็ตาม
ประเด็นที่สำคัญ
- ในสถิติการทดสอบแบบสองด้านเป็นวิธีการที่พื้นที่วิกฤตของการแจกแจงนั้นเป็นแบบสองด้านและการทดสอบว่าตัวอย่างนั้นมีค่ามากกว่าหรือน้อยกว่าช่วงค่าที่แน่นอนมันถูกใช้ในการทดสอบสมมติฐานและการทดสอบสมมติฐาน สำหรับนัยสำคัญทางสถิติหากตัวอย่างที่กำลังทดสอบตกอยู่ในพื้นที่วิกฤตจะยอมรับสมมติฐานทางเลือกแทนที่จะเป็นสมมติฐานว่างโดยใช้การทดสอบสองด้านแบบแผนเพื่อกำหนดความสำคัญในระดับ 5% ซึ่งหมายถึงแต่ละด้านของ การกระจายถูกตัดที่ 2.5%
โปรดระวังว่าการทดสอบทางสถิติเป็นแบบหนึ่งหรือสองด้านเนื่องจากจะมีอิทธิพลอย่างมากต่อการตีความแบบจำลอง
การทดสอบสองด้านเพื่อความสำคัญ Investopedia
การทดสอบแบบสองทางทำงานอย่างไร
แนวคิดพื้นฐานของสถิติเชิงอนุมานคือการทดสอบสมมติฐานซึ่งมีการดำเนินการเพื่อตรวจสอบว่าการอ้างสิทธิ์เป็นจริงหรือไม่กำหนดพารามิเตอร์ของประชากร การทดสอบที่ถูกตั้งโปรแกรมให้แสดงว่าค่าเฉลี่ยของกลุ่มตัวอย่างนั้นมีค่ามากกว่า และ ต่ำกว่าค่าเฉลี่ยของประชากรอย่างมากหรือไม่นั้นเรียกว่าการทดสอบแบบสองด้าน
การทดสอบแบบสองด้านถูกออกแบบมาเพื่อตรวจสอบทั้งสองด้านของช่วงข้อมูลที่ระบุตามที่กำหนดโดยการแจกแจงความน่าจะเป็นที่เกี่ยวข้อง การกระจายความน่าจะเป็นตัวแทนของความน่าจะเป็นของผลลัพธ์ที่ระบุตามมาตรฐานที่กำหนดไว้ สิ่งนี้ต้องมีการตั้งค่าขีด จำกัด ที่กำหนดค่าตัวแปรสูงสุดที่ยอมรับได้ (หรือสูงกว่า) และต่ำสุด (หรือต่ำกว่า) ที่อยู่ในช่วง จุดข้อมูลใด ๆ ที่มีอยู่เหนือขีด จำกัด สูงสุดหรือต่ำกว่าขีด จำกัด ล่างนั้นถือว่าอยู่นอกช่วงการยอมรับและในพื้นที่ที่เรียกว่าช่วงการปฏิเสธ
ไม่มีมาตรฐานโดยธรรมชาติเกี่ยวกับจำนวนของจุดข้อมูลที่ต้องมีอยู่ในช่วงการยอมรับ ในกรณีที่จำเป็นต้องมีความแม่นยำเช่นในการสร้างยาอาจมีการกำหนดอัตราการปฏิเสธ 0.001% หรือน้อยกว่า ในกรณีที่ความแม่นยำมีความสำคัญน้อยกว่าเช่นจำนวนรายการอาหารในถุงผลิตภัณฑ์อัตราการปฏิเสธ 5% อาจเหมาะสม
ตัวอย่างของการทดสอบแบบสองด้าน
เป็นตัวอย่างสมมุติว่าสมมุติว่านายหน้าซื้อขายหลักทรัพย์รายใหม่ (XYZ) อ้างว่าค่าธรรมเนียมนายหน้าซื้อขายหลักทรัพย์ของเขานั้นต่ำกว่าค่าธรรมเนียมนายหน้าซื้อขายหลักทรัพย์ปัจจุบันของคุณ (ABC) ข้อมูลจาก บริษัท วิจัยอิสระระบุว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของลูกค้าโบรกเกอร์เอบีซีทั้งหมดคือ $ 18 และ $ 6 ตามลำดับ
มีการสุ่มตัวอย่างลูกค้า ABC จำนวน 100 รายและมีการคำนวณค่านายหน้าด้วยอัตราใหม่ของนายหน้า XYZ หากค่าเฉลี่ยของตัวอย่างคือ $ 18.75 และค่าเบี่ยงเบนมาตรฐานตัวอย่างคือ $ 6 การอนุมานใด ๆ สามารถสร้างความแตกต่างในค่านายหน้าเฉลี่ยระหว่างโบรกเกอร์ ABC และ XYZ ได้หรือไม่
- H 0: สมมติฐานที่ไม่มีค่า: หมายถึง = 18H 1: สมมติฐานทางเลือก: หมายถึง <> 18 (นี่คือสิ่งที่เราต้องการพิสูจน์) ภูมิภาคการปฏิเสธ: Z <= - Z 2.5 และ Z> = Z 2.5 (สมมติว่ามีระดับนัยสำคัญ 5%, แยก 2.5 แต่ละด้านทั้งสอง).Z = (ค่าเฉลี่ยตัวอย่าง - ค่าเฉลี่ย) / (std-dev / sqrt (จำนวนตัวอย่าง)) = (18.75 - 18) / (6 / (sqrt (100)) = 1.25
ค่า Z ที่คำนวณได้นี้อยู่ระหว่างขีด จำกัด สองค่าที่กำหนดโดย: - Z 2.5 = -1.96 และ Z 2.5 = 1.96
สรุปได้ว่าไม่มีหลักฐานเพียงพอที่จะสรุปได้ว่ามีความแตกต่างระหว่างอัตราของโบรกเกอร์ที่มีอยู่กับโบรกเกอร์ใหม่ อีกทางหนึ่ง p-value = P (Z <-1.25) + P (Z> 1.25) = 2 * 0.1056 = 0.2112 = 21.12% ซึ่งมากกว่า 0.05 หรือ 5% นำไปสู่ข้อสรุปเดียวกัน
ข้อควรพิจารณาพิเศษ: การสุ่มตัวอย่างแบบสุ่ม
การทดสอบสองด้านสามารถใช้งานได้จริงในระหว่างกิจกรรมการผลิตบางอย่างใน บริษัท เช่นกับการผลิตและบรรจุภัณฑ์ของขนมที่โรงงานแห่งใดแห่งหนึ่ง หากสถานที่ผลิตกำหนด 50 ลูกอมต่อถุงเป็นเป้าหมายโดยมีการกระจายที่ยอมรับได้ของ 45 ถึง 55 ลูกอมถุงใด ๆ ที่พบที่มีจำนวนต่ำกว่า 45 หรือสูงกว่า 55 ถือว่าอยู่ในช่วงปฏิเสธ
เพื่อยืนยันว่ากลไกการบรรจุได้รับการปรับเทียบอย่างถูกต้องเพื่อให้ได้ผลลัพธ์ที่คาดหวังอาจมีการสุ่มตัวอย่างแบบสุ่มเพื่อยืนยันความถูกต้อง เพื่อให้กลไกการบรรจุภัณฑ์มีความถูกต้องจะต้องเฉลี่ย 50 ลูกอมต่อถุงที่มีการกระจายที่เหมาะสม นอกจากนี้จำนวนถุงที่อยู่ในช่วงการปฏิเสธจะต้องอยู่ในขีด จำกัด การแจกแจงความน่าจะเป็นที่ยอมรับว่าเป็นอัตราข้อผิดพลาด
หากค้นพบอัตราการปฏิเสธที่ไม่สามารถยอมรับได้หรือค่าเบี่ยงเบนเฉลี่ยมากเกินไปจากค่าเฉลี่ยที่ต้องการอาจจำเป็นต้องทำการปรับเปลี่ยนสิ่งอำนวยความสะดวกหรืออุปกรณ์ที่เกี่ยวข้องเพื่อแก้ไขข้อผิดพลาด การใช้วิธีการทดสอบแบบสองด้านเป็นประจำสามารถช่วยให้มั่นใจว่าการผลิตจะอยู่ในขอบเขตที่ จำกัด ในระยะยาว
การทดสอบแบบสองทางกับแบบสองด้าน
เมื่อมีการตั้งค่าการทดสอบสมมติฐานเพื่อแสดงให้เห็นว่าค่าเฉลี่ยตัวอย่างจะสูงกว่า หรือ ต่ำกว่าค่าเฉลี่ยประชากรนี่จะเรียกว่าเป็นการทดสอบแบบหางเดียว การทดสอบแบบด้านเดียวได้ชื่อมาจากการทดสอบพื้นที่ใต้ก้อย (ด้านข้าง) ของการแจกแจงแบบปกติ เมื่อใช้การทดสอบแบบหางเดียวนักวิเคราะห์กำลังทดสอบความเป็นไปได้ของความสัมพันธ์ในทิศทางเดียวที่น่าสนใจและไม่สนใจความเป็นไปได้ของความสัมพันธ์ในทิศทางอื่นอย่างสมบูรณ์
หากตัวอย่างที่กำลังทดสอบตกอยู่ในพื้นที่วิกฤติด้านเดียวระบบจะยอมรับสมมติฐานทางเลือกแทนสมมติฐานว่าง การทดสอบแบบหางเดียวยังเป็นที่รู้จักกันในชื่อการทดสอบสมมติฐานหรือการทดสอบทิศทาง