ทฤษฎีเกม: เกินพื้นฐาน

ทฤษฎีเกม ตอนที่ 1 | game theory 101 (พฤศจิกายน 2024)

ทฤษฎีเกม ตอนที่ 1 | game theory 101 (พฤศจิกายน 2024)
ทฤษฎีเกม: เกินพื้นฐาน
Anonim

การใช้ทฤษฎีเกมสามารถนำเสนอสถานการณ์จริงในสถานการณ์เช่นการกำหนดราคาการแข่งขันและการเผยแพร่ผลิตภัณฑ์ (และอื่น ๆ อีกมากมาย) และผลลัพธ์ของพวกเขาจะได้รับการคาดการณ์ บริษัท ที่ใช้ (และยึดติดกับ) อุปกรณ์นี้เพื่อกำหนดสมดุลของแนชจะเห็นประโยชน์มหาศาลในกลยุทธ์การกำหนดงบประมาณของพวกเขา (สำหรับการทบทวนใหม่ให้ดูที่ พื้นฐานเกี่ยวกับทฤษฎีเกม .)

ใครคือคนเลี้ยว?
ขณะเล่นเกมตามลำดับโดยการเลี้ยวเกมพร้อมกันจะเล่นกับผู้เล่นแต่ละรายที่ตัดสินใจในเวลาเดียวกัน กับเกมพร้อมกันเราไม่ใช้วิธีการแนะนำทั่วไปของการเหนี่ยวนำย้อนหลัง ผู้เสนอทฤษฎีเกมมักจัดลำดับผลลัพธ์ต่าง ๆ ในสิ่งที่เรียกว่าเมทริกซ์ (แสดงด้านล่าง)

->
ผู้เล่นคนหนึ่ง / ผู้เล่น 2 คน ซ้าย ขวา
ขึ้น (1, 3) (4, 2)
ลง ( 3, 2) (3, 1)

เมตริกซ์นี้เรียกว่าเป็นรูปแบบปกติ ตัวเลือกของผู้เล่นจะแสดงในแกนแนวตั้งด้านซ้ายและตัวเลือกของผู้เล่นทั้งสองจะแสดงบนแกนแนวนอนด้านบน การจ่ายเงินสำหรับผู้เล่นแต่ละคนจะอยู่ในทางแยกที่ตรงกันและจะแสดงดังนี้ (ผู้เล่นคนหนึ่งผู้เล่นสองคน) สมดุลของแนช (Nash Equilibrium)

สมดุล Nash (Nash Equilibrium) สมดุล Nash (Nash Equilibrium)

สมดุล Nash เป็นผลมาถึงเมื่อสำเร็จแล้วหมายถึงไม่มีผู้เล่นใดสามารถเพิ่มผลตอบแทนโดยการเปลี่ยนแปลงการตัดสินใจเพียงฝ่ายเดียว นอกจากนี้ยังสามารถคิดว่าเป็น "ไม่เสียใจ" ในแง่ที่ว่าเมื่อมีการตัดสินใจผู้เล่นจะไม่มีความเสียใจกับการตัดสินใจที่จะพิจารณาผลที่ตามมา

สมดุลย์ Nash เกิดขึ้นเมื่อเวลาผ่านไปในกรณีส่วนใหญ่ อย่างไรก็ตามเมื่อ Nash Equilibrium ได้มาถึงแล้วจะไม่สามารถเบี่ยงเบนไปได้ หลังจากที่เราเรียนรู้วิธีหาสมดุลของแนชให้ดูที่วิธีการที่การเคลื่อนไหวฝ่ายเดียวจะมีผลต่อสถานการณ์ มันทำให้รู้สึกใด ๆ ? ไม่ควรและด้วยเหตุนี้ Nash Equilibrium จึงถูกอธิบายว่า "ไม่เสียใจ" การหา Nash Equilibria
ขั้นตอนที่หนึ่ง: กำหนดการตอบสนองที่ดีที่สุดของผู้เล่นต่อการกระทำของผู้เล่นสองคน

เมื่อตรวจสอบตัวเลือกที่อาจเพิ่มการจ่ายเงินของผู้เล่นเราต้องดูวิธีที่ผู้เล่นควรตอบสนองต่อตัวเลือกที่ผู้เล่นสองคนมี วิธีง่ายๆในการทำสิ่งนี้คือเพื่อปกปิดตัวเลือกของผู้เล่นสองคน พิจารณาเมทริกซ์ที่แสดงในตอนต้นของบทความนี้เมื่อเราใช้วิธีนี้ ผู้เล่นหนึ่งคน / ผู้เล่นสองคน ซ้าย
ขวา ขึ้น (1, -)
(4, -) ลง (3, -) > (3, -)

ผู้เล่นหนึ่งคนมีทางเลือกสองทางคือ "ขึ้น" หรือ "ลง" ผู้เล่นสองคนยังมีสองทางเลือกในการเล่น: "ซ้าย" หรือ "ขวา" ในขั้นตอนนี้ในการพิจารณาสมดุล Nash เราจะดูการตอบสนองต่อการกระทำของผู้เล่นสองคน หากผู้เล่นสองคนเลือกที่จะเล่น "ซ้าย" เราสามารถเล่น "ขึ้น" กับผลตอบแทนของหนึ่งหรือเล่น "ลง" กับผลตอบแทนของสาม เนื่องจากสามตัวใหญ่กว่าหนึ่งตัวเราจะกล้าแสดงตัวเลือก 3 ให้เล่น "ลง" ที่นี่

ถ้าผู้เล่นสองคนเลือกที่จะเล่น "ถูกต้อง" เราสามารถเลือกเล่น 'ขึ้น' เพื่อจ่ายเงินสี่หรือเล่น "ลง" สำหรับเพลย์ออฟสาม ตั้งแต่สี่ตัวใหญ่กว่าสามตัวเราก็กล้าที่จะแสดงตัวเลือกที่จะเล่น "ขึ้น" ที่นี่ ผลลัพธ์ที่เป็นตัวหนาแสดงไว้ด้านล่างในเมทริกซ์แบบเต็ม

ผู้เล่นหนึ่งคน / ผู้เล่นสองคน ซ้าย ขวา
ขึ้น (1, 3) ( 4 , 2)
ลง 3 , 2) (3, 1)

ขั้นตอนที่สอง: พิจารณาการตอบสนองที่ดีที่สุดของผู้เล่นสองคนต่อการกระทำของผู้เล่น
ในขณะที่เราเคยทำมาก่อนหน้านี้กับผู้เล่น 2 คนสำหรับผู้เล่นหนึ่งเราจะซ่อนผลตอบแทนของผู้เล่นเมื่อพิจารณาการตอบสนองที่ดีที่สุดสำหรับผู้เล่น 2 ( ตัวบ่งชี้ชั้นนำของการคลังด้านพฤติกรรม .)

ผู้เล่นคนหนึ่ง / ผู้เล่นสองคน ซ้าย ขวา
ขึ้น (-, 3 ) (-, 2)
ลง (-, 2) (-, 1)

เช่นเดียวกับการมองผู้เล่นคนหนึ่งผู้เล่นแต่ละคนมีทางเลือกสองทาง หากผู้เล่นคนหนึ่งเลือกที่จะเล่น "ขึ้น" เราสามารถเล่น "ซ้าย" ด้วยผลตอบแทนสามหรือ "ถูกต้อง" ด้วยการจ่ายเงินสอง ตั้งแต่สามตัวใหญ่กว่าสองตัวเราก็กล้าที่จะแสดงตัวเลือกที่สามให้เล่น "ซ้าย" ที่นี่ หากผู้เล่นคนหนึ่งเลือกที่จะเล่น "ลง" เราสามารถเล่น "ซ้าย" สำหรับผลตอบแทนของสองหรือ "ขวา" สำหรับผลตอบแทนของหนึ่ง เนื่องจากสองตัวใหญ่กว่าหนึ่งตัวเราจึงกล้าแสดงตัวเลือกทั้งสองเพื่อเล่น "ซ้าย" ที่นี่ ผลลัพธ์ที่เป็นตัวหนาแสดงไว้ด้านล่างในเมทริกซ์แบบเต็ม

ผู้เล่นหนึ่งคน / ผู้เล่นสองคน ซ้าย ขวา
ขึ้น (1, 3 ) (4, 2)
ลง 3, 2 ) (3, 1)

ขั้นตอนที่สาม: กำหนดผลลัพธ์ที่มีผลตอบแทนดีเยี่ยมทั้งคู่ ผลลัพธ์ที่เฉพาะเจาะจงคือสมดุลของแนช (Nash Equilibrium)
ขณะนี้เรารวมตัวเลือกที่เป็นตัวหนาสำหรับผู้เล่นทั้งสองคนเข้าสู่เมทริกซ์เต็มรูปแบบ

ผู้เล่นหนึ่งคน / ผู้เล่นสองคน ซ้าย ขวา
ขึ้น (1, 3 ) ( 4 , 2) > ลง
( 3 , 2 ) (3, 1) มองหาทางแยกที่ผลตอบแทนทั้งสองเป็นตัวหนา ในกรณีนี้เราพบจุดตัดของ (ลง, ซ้าย) พร้อมกับผลตอบแทนของ (3, 2) พอดีกับเกณฑ์ของเรา นี่แสดงถึงสมดุลของ Nash ของเรา

วิธีการหาสมดุลของแนชนี้มีความเหมาะสมสำหรับการหาสมดุลในเกมที่พร้อมกันเนื่องจากเรากำลังมองหาวิธีที่ผู้เล่นจะตอบสนองต่อการกระทำอื่น ๆ สถานการณ์เช่นนี้ของเกมพร้อมกันมักเล่นในธุรกิจเช่นสายการบิน ด้านล่างนี้เป็นตัวอย่างที่คล้ายคลึงกับเกมข้างต้นว่าราคาสายการบินสามารถเล่นได้อย่างไร การจ่ายเงินเป็นจำนวนหลายพันดอลลาร์ จำไว้ว่านี่คือการจ่ายเงินไม่ใช่ราคา วิธีที่เราใช้ก่อนหน้านี้ได้ถูกนำมาใช้เพื่อแสดงให้เห็นว่าสมดุลย์ Nash ปรากฏขึ้น

สายการบินหนึ่ง / สายการบินสอง

ราคาต่ำ ราคาสูง ราคาต่ำ
( 3, 000 , 3, 000 ) ( 4, 000 , 2, 000) ราคาสูง (2, 000,
4, 000 ) (3, 500, 3, 500) มองไปที่ทางเลือกของ A1 เราจะเห็นได้ว่าถ้า A2 เลือกที่จะเล่นในราคาต่ำเราเลือกระหว่างราคาต่ำสุดสำหรับ 3,000 บาทหรือราคาสูงสำหรับ 2,000 เราเลือก "ต่ำ" ตั้งแต่ 3,000> 2, 000เราทำสิ่งเดียวกันสำหรับ A2 เล่น High Price และดูว่าเราเล่น "ต่ำ" เพราะ 4,000> 3, 500 ตรงกันข้ามมองแค่ทางเลือกของ A2 เราจะเห็นได้ว่าถ้า A1 เลือกที่จะเล่นในราคาต่ำเราเลือกระหว่าง "ราคาต่ำ" สำหรับ 3, 000 และ "ราคาสูง" สำหรับ 2, 000 ตั้งแต่ 3, 000> 2, 000 เราเลือกตัวเลือก "ราคาต่ำ" ที่นี่ ถ้า A1 เล่นราคาสูงเราสามารถเรียกเก็บราคาต่ำ 4,000 บาทหรือสูงกว่าราคา 3, 500 ตั้งแต่ 4,000 บาท> 3,500 เราเลือกเล่น "ราคาต่ำ" ที่นี่ สมดุลของแนชคือทั้งสองสายการบินจะคิดราคาต่ำ (แสดงให้เห็นเมื่อทางเลือกสำหรับแต่ละฝ่ายมีการเน้น) ถ้าทั้งสองสายการบินคิดราคาสูงพวกเขาจะดีกว่าพวกเขาอยู่ที่สมดุลของแนช

ทำไมพวกเขาถึงไม่ยอมทำเช่นนี้? ก่อนอื่นก็ผิดกฎหมายที่จะสมรู้ร่วมคิด ประการที่สองหากเกิดขึ้นการกระทำเพียงฝ่ายเดียวในนามของสายการบินรายหนึ่งจะเรียกเก็บในราคาต่ำจะเป็นประโยชน์ซึ่งส่งผลให้สายการบินรายนี้สามารถทำเงินได้มากขึ้น ตรรกะนี้ยังแสดงให้เห็นว่า Nash สมดุลได้ถึงและทำไมมันไม่ได้เป็นประโยชน์ที่จะเบี่ยงเบนไปจากมันเมื่อมันมาถึง (อ่านต่อไปดูบทแนะนำของเราเกี่ยวกับ

Behavioral Finance

.) Equilibria แบบหลาย Nash และความสมดุลของ Nash เล่นได้ ทั่วไปในเกมอาจมีสมดุลมากกว่าหนึ่งข้อ อย่างไรก็ตามเรื่องนี้มักเกิดขึ้นในเกมที่มีองค์ประกอบที่ซับซ้อนกว่าสองทางเลือกโดยผู้เล่นสองคน ในเกมพร้อมกันที่ทำซ้ำในช่วงเวลาหนึ่งของความสมดุลหลายเหล่านี้จะถึงหลังจากการทดลองและข้อผิดพลาดบางอย่าง สถานการณ์สมมตินี้ของทางเลือกที่ต่างกันในช่วงเวลาก่อนที่จะถึงภาวะสมดุลเป็นเรื่องที่เล่นบ่อยที่สุดในโลกธุรกิจเมื่อ บริษัท สองแห่งกำลังกำหนดราคาสำหรับผลิตภัณฑ์ที่สามารถแลกเปลี่ยนกันได้มากเช่นตั๋วเครื่องบินหรือโซดาป๊อป

บรรทัดด้านล่าง ด้วยวิธีการขั้นสูงเหล่านี้สามารถจำลองสถานการณ์และแก้ปัญหาในโลกแห่งความเป็นจริงได้มากขึ้น ความสมดุลของ Nash ที่เราพูดถึงคือโซลูชันที่พบมากที่สุดสำหรับเกมแบบจำลองในโลกแห่งความเป็นจริง ความรู้เกี่ยวกับทฤษฎีเกมสามารถช่วยให้คุณสร้างกลยุทธ์ได้ไม่ว่าจะเป็นการเล่นเพื่อนเล่น tic-tac-toe หรือการแข่งขันเพื่อผลกำไรที่ใหญ่ที่สุด