การเหนี่ยวนำย้อนกลับคืออะไร?
การเหนี่ยวนำย้อนหลังในทฤษฎีเกมเป็นกระบวนการวนซ้ำของการให้เหตุผลย้อนหลังในเวลาจากจุดสิ้นสุดของปัญหาหรือสถานการณ์เพื่อแก้ไขรูปแบบที่กว้างขวางและเกมต่อเนื่องที่ จำกัด และสรุปลำดับของการกระทำที่ดีที่สุด
อธิบายการเหนี่ยวนำย้อนหลัง
การอุปนัยแบบย้อนหลังถูกนำมาใช้แก้ปัญหาเกมตั้งแต่ John von Neumann และ Oskar Morgenstern ได้สร้างทฤษฎีเกมเป็นวิชาทางวิชาการเมื่อพวกเขาตีพิมพ์หนังสือ ทฤษฎีเกมและพฤติกรรมทางเศรษฐกิจ ในปี 2487
ในแต่ละขั้นตอนของเกมการเหนี่ยวนำย้อนหลังกำหนดกลยุทธ์ที่ดีที่สุดของผู้เล่นที่ทำให้การเคลื่อนไหวครั้งสุดท้ายในเกม จากนั้นการกระทำที่ดีที่สุดของผู้เล่นที่ย้ายไปยังคนสุดท้ายจะถูกกำหนดโดยทำการกระทำของผู้เล่นคนสุดท้ายตามที่กำหนด กระบวนการนี้จะดำเนินต่อไปข้างหลังจนกว่าจะมีการดำเนินการที่ดีที่สุดสำหรับทุกจุดในเวลา อย่างมีประสิทธิภาพใครจะกำหนดสมดุลของแนชของแต่ละเกมย่อยของเกมต้นฉบับ
อย่างไรก็ตามผลลัพธ์ที่อนุมานจากการเหนี่ยวนำย้อนหลังมักจะล้มเหลวในการทำนายการเล่นจริงของมนุษย์ จากการศึกษาทดลองแสดงให้เห็นว่าพฤติกรรม "เหตุผล" (ตามที่คาดการณ์ไว้ตามทฤษฎีเกม) นั้นแทบจะไม่มีการจัดแสดงในชีวิตจริง ผู้เล่นที่ไม่มีเหตุผลอาจลงเอยด้วยการได้รับผลตอบแทนสูงกว่าที่คาดการณ์ไว้โดยการเหนี่ยวนำย้อนหลังดังที่แสดงในเกมตะขาบ
ในเกมตะขาบผู้เล่นสองคนสลับกันได้รับโอกาสที่จะได้รับเงินมากขึ้นหรือส่งเงินกองกลางไปยังผู้เล่นคนอื่น การจ่ายเงินรางวัลจะถูกจัดเรียงเพื่อที่ว่าหากมีการส่งพ็อตไปยังฝ่ายตรงข้ามและฝ่ายตรงข้ามได้รับเงินกองกลางในรอบถัดไปหนึ่งคนจะได้รับน้อยกว่าคนที่ได้รับเงินกองกลางในรอบนี้ เกมดังกล่าวจะสิ้นสุดลงทันทีที่ผู้เล่นทำการซ่อนโดยผู้เล่นนั้นจะได้รับส่วนที่ใหญ่กว่าและผู้เล่นคนอื่นจะได้ส่วนที่เล็กกว่า
ตัวอย่างการเหนี่ยวนำย้อนหลัง
ตัวอย่างเช่นสมมติว่าผู้เล่น A ไปก่อนและต้องตัดสินใจว่าเขาควร "รับ" หรือ "ผ่าน" ที่เก็บซึ่งปัจจุบันมีจำนวน $ 2 หากเขารับ A และ B จะได้รับ $ 1 ต่อครั้ง แต่ถ้า A ผ่านการตัดสินใจที่จะรับหรือส่งในขณะนี้จะต้องดำเนินการโดยผู้เล่น B หาก B ใช้เวลาเธอจะได้รับ $ 3 (เช่น stash ก่อนหน้าของ $ 2 + $ 1) และ A ได้รับ $ 0 แต่ถ้า B ผ่านไปตอนนี้ A จะตัดสินใจว่าจะรับหรือผ่านและต่อไปเรื่อย ๆ หากผู้เล่นทั้งสองเลือกที่จะผ่านพวกเขาแต่ละคนจะได้รับผลตอบแทน $ 100 เมื่อสิ้นสุดเกม
ประเด็นของเกมคือถ้า A และ B ทั้งคู่ร่วมมือกันและดำเนินต่อไปจนกว่าจะจบเกมพวกเขาจะได้รับการจ่ายเงินสูงสุด $ 100 ต่อครั้ง แต่ถ้าพวกเขาไม่ไว้ใจผู้เล่นคนอื่นและคาดหวังว่าพวกเขาจะ "รับ" ในโอกาสแรกแนชดุลยภาพทำนายว่าผู้เล่นจะได้รับการเรียกร้องที่ต่ำที่สุด ($ 1 ในกรณีนี้)
สมดุลของแนชของเกมนี้ที่ไม่มีผู้เล่นคนใดมีแรงจูงใจที่จะเบี่ยงเบนจากกลยุทธ์ที่เขาเลือกหลังจากพิจารณาตัวเลือกของฝ่ายตรงข้ามแนะนำผู้เล่นคนแรกจะได้หม้อในรอบแรกของเกม อย่างไรก็ตามในความเป็นจริงผู้เล่นค่อนข้างน้อยทำเช่นนั้น เป็นผลให้พวกเขาได้รับผลตอบแทนที่สูงกว่าผลตอบแทนที่คาดการณ์โดยการวิเคราะห์ความสมดุล
การแก้เกมต่อเนื่องโดยใช้การเหนี่ยวนำย้อนหลัง
ด้านล่างนี้เป็นเกมเรียงลำดับอย่างง่ายระหว่างผู้เล่นสองคน ป้ายกำกับที่มีผู้เล่น 1 และผู้เล่น 2 อยู่ในนั้นคือชุดข้อมูลสำหรับผู้เล่นหนึ่งหรือสองคนตามลำดับ ตัวเลขในวงเล็บที่ด้านล่างของต้นไม้เป็นการจ่ายเงินในแต่ละจุด เกมดังกล่าวเรียงตามลำดับดังนั้นผู้เล่น 1 ทำการตัดสินใจครั้งแรก (ซ้ายหรือขวา) และผู้เล่น 2 ทำการตัดสินใจหลังจากผู้เล่น 1 (ขึ้นหรือลง)
รูปที่ 1
การเหนี่ยวนำย้อนหลังเช่นเดียวกับทฤษฎีเกมทั้งหมดใช้สมมุติฐานของความมีเหตุผลและการขยายให้ใหญ่สุดซึ่งหมายความว่าผู้เล่น 2 จะเพิ่มผลตอบแทนของเขาในทุกสถานการณ์ ในชุดข้อมูลเรามีสองทางเลือกสี่ตัวเลือก ด้วยการกำจัดตัวเลือกที่ผู้เล่น 2 จะไม่เลือกเราสามารถทำให้แผนภูมิของเราแคบลง ด้วยวิธีนี้เราจะทำเส้นที่หนาที่สุดเพื่อเพิ่มผลตอบแทนของผู้เล่นในชุดข้อมูลที่ได้รับ
รูปที่ 2
หลังจากการลดลงนี้ผู้เล่น 1 สามารถเพิ่มผลตอบแทนได้สูงสุดในขณะนี้ที่ทางเลือกของผู้เล่น 2 เป็นที่รู้จัก ผลที่ได้คือความสมดุลที่พบโดยการเหนี่ยวนำย้อนหลังของผู้เล่น 1 เลือก "ถูกต้อง" และผู้เล่น 2 เลือก "ขึ้น" ด้านล่างนี้เป็นวิธีแก้ปัญหาของเกมที่มีเส้นทางสมดุล
รูปที่ 3
ตัวอย่างเช่นหนึ่งสามารถตั้งค่าเกมที่คล้ายกับที่กล่าวข้างต้นโดยใช้ บริษัท เป็นผู้เล่น เกมนี้อาจรวมถึงสถานการณ์จำลองผลิตภัณฑ์ หาก บริษัท 1 ต้องการเผยแพร่ผลิตภัณฑ์ บริษัท 2 อาจตอบสนองอย่างไร บริษัท 2 จะเปิดตัวผลิตภัณฑ์คู่แข่งที่คล้ายกันหรือไม่ โดยการคาดการณ์ยอดขายของผลิตภัณฑ์ใหม่นี้ในสถานการณ์ที่แตกต่างกันเราสามารถตั้งค่าเกมเพื่อทำนายว่าเหตุการณ์จะเกิดขึ้นได้อย่างไร ด้านล่างนี้เป็นตัวอย่างของรูปแบบของเกมดังกล่าว
รูปที่ 4