สมดุลของแนชคืออะไร?
สมดุลของแนชเป็นแนวคิดในทฤษฎีเกมที่ผลลัพธ์ที่ดีที่สุดของเกมคือที่ไม่มีแรงจูงใจให้เบี่ยงเบนจากกลยุทธ์เริ่มต้นของพวกเขา โดยเฉพาะอย่างยิ่งความสมดุลของแนชเป็นแนวคิดของทฤษฎีเกมที่ผลลัพธ์ที่ดีที่สุดของเกมเป็นสิ่งที่ผู้เล่นไม่มีแรงจูงใจให้เบี่ยงเบนจากกลยุทธ์ที่เขาเลือกหลังจากพิจารณาตัวเลือกของคู่ต่อสู้
โดยรวมแล้วบุคคลจะไม่ได้รับผลประโยชน์ที่เพิ่มขึ้นจากการเปลี่ยนแปลงการกระทำสมมติว่าผู้เล่นคนอื่นยังคงอยู่ในกลยุทธ์ของพวกเขา เกมอาจมีสมดุลของแนชหลายตัวหรือไม่มีเลย
สมดุลของแนช
ทำความเข้าใจกับสมดุลของแนช
สมดุลของแนชนั้นตั้งชื่อตามนักประดิษฐ์จอห์นแนชนักคณิตศาสตร์ชาวอเมริกัน มันถือเป็นหนึ่งในแนวคิดที่สำคัญที่สุดของทฤษฎีเกมซึ่งพยายามที่จะกำหนดทางคณิตศาสตร์และตรรกะการกระทำที่ผู้เข้าร่วมเกมควรใช้เพื่อให้ได้ผลลัพธ์ที่ดีที่สุดสำหรับตัวเอง เหตุผลที่สมดุลของแนชถือเป็นแนวคิดที่สำคัญของทฤษฎีเกมเกี่ยวข้องกับการบังคับใช้ สมดุลของแนชสามารถรวมอยู่ในหลากหลายสาขาวิชาตั้งแต่เศรษฐศาสตร์ไปจนถึงสังคมศาสตร์
ประเด็นที่สำคัญ
- The Nash Equilibrium เป็นทฤษฎีบทการตัดสินใจภายในทฤษฎีเกมที่ระบุว่าผู้เล่นสามารถบรรลุผลตามที่ต้องการโดยไม่เบี่ยงเบนไปจากกลยุทธ์เริ่มต้นของพวกเขาใน Nash สมดุลกลยุทธ์ของผู้เล่นแต่ละคนจะเหมาะสมที่สุดเมื่อพิจารณาการตัดสินใจของผู้เล่นคนอื่น ผู้เล่นทุกคนชนะเพราะทุกคนได้รับผลลัพธ์ตามที่พวกเขาต้องการภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษเป็นตัวอย่างทฤษฎีเกมทั่วไปและเป็นเกมที่แสดงผลของ Nash Equilibrium อย่างเพียงพอ
หากต้องการค้นหาสมดุลของแนชอย่างรวดเร็วหรือดูว่ามีอยู่หรือไม่ให้เปิดเผยกลยุทธ์ของผู้เล่นแต่ละคนกับผู้เล่นอื่น หากไม่มีใครเปลี่ยนแปลงกลยุทธ์ของเขาดังนั้นความสมดุลของแนชจึงได้รับการพิสูจน์
ตัวอย่างของโลกแห่งความสมดุลของแนช
ลองนึกภาพเกมระหว่าง Tom และ Sam ในเกมง่ายๆนี้ผู้เล่นทั้งสองสามารถเลือกกลยุทธ์ A เพื่อรับ $ 1 หรือกลยุทธ์ B เพื่อเสีย $ 1 เหตุผลผู้เล่นทั้งสองเลือกกลยุทธ์ A และรับผลตอบแทน $ 1 หากคุณเปิดเผยกลยุทธ์ของแซมต่อทอมและในทางกลับกันคุณจะเห็นว่าไม่มีผู้เล่นคนไหนเบี่ยงเบนจากตัวเลือกเดิม การรู้จักการเคลื่อนไหวของผู้เล่นคนอื่นนั้นมีความหมายเพียงเล็กน้อยและจะไม่เปลี่ยนพฤติกรรมของผู้เล่นคนใดคนหนึ่ง ผลลัพธ์ A แทนความสมดุลของแนช
การพิจารณาเป็นพิเศษ: ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ
ภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษเป็นสถานการณ์ทั่วไปที่วิเคราะห์ในทฤษฎีเกมที่สามารถใช้สมดุลของแนช ในเกมนี้อาชญากรสองคนถูกจับและแต่ละคนถูกขังเดี่ยวโดยไม่มีการสื่อสารกับคนอื่น อัยการไม่มีหลักฐานที่จะตัดสินทั้งคู่ดังนั้นพวกเขาจึงเสนอโอกาสให้นักโทษแต่ละคนในการหักหลังคนอื่นโดยการเป็นพยานว่าอีกคนหนึ่งได้กระทำความผิดทางอาญาหรือให้ความร่วมมือโดยนิ่งเฉย
หากนักโทษทั้งคู่ทรยศต่อกันแต่ละคนรับใช้ในคุกห้าปี หากการทรยศต่อ B แต่ B ยังคงนิ่งเงียบนักโทษ A จะถูกปล่อยให้เป็นอิสระและนักโทษ B ทำหน้าที่ 10 ปีในคุกหรือในทางกลับกัน หากแต่ละคนยังคงนิ่งเงียบดังนั้นแต่ละคนจะอยู่ในคุกเพียงหนึ่งปี สมดุลของแนชในตัวอย่างนี้สำหรับผู้เล่นทั้งคู่ที่จะทรยศซึ่งกันและกัน แม้ว่าความร่วมมือซึ่งกันและกันจะนำไปสู่ผลลัพธ์ที่ดีกว่าหากนักโทษคนหนึ่งเลือกความร่วมมือซึ่งกันและกันและอื่น ๆ ไม่ได้ผลของนักโทษคนหนึ่งจะเลวร้ายยิ่งกว่า