กลยุทธ์ยุทธศาสตร์เกมขั้นสูงสำหรับการตัดสินใจ

กลยุทธ์ยุทธศาสตร์เกมขั้นสูงสำหรับการตัดสินใจ

สารบัญ:

Anonim

ทฤษฎีเกม, การศึกษาเกี่ยวกับการตัดสินใจเชิงกลยุทธ์, นำมารวมกันในสาขาต่างๆเช่นคณิตศาสตร์จิตวิทยาและปรัชญา ทฤษฎีเกมถูกคิดค้นขึ้นโดย John von Neumann และ Oskar Morgenstern ในปีพ. ศ. 2487 และมีมานานแล้ว ความสำคัญของทฤษฎีเกมกับการวิเคราะห์และการตัดสินใจที่ทันสมัยสามารถวัดได้จากข้อเท็จจริงที่ว่าตั้งแต่ปี 1970 นักเศรษฐศาสตร์และนักวิทยาศาสตร์ชั้นนำจำนวน 12 คนได้รับรางวัลโนเบลสาขาวิทยาศาสตร์ทางเศรษฐศาสตร์สำหรับการมีส่วนร่วมในทฤษฎีเกม

ทฤษฎีเกมถูกใช้ในหลายสาขาเช่นธุรกิจการเงินเศรษฐศาสตร์รัฐศาสตร์และจิตวิทยา การทำความเข้าใจกลยุทธ์ทฤษฎีเกมทั้งที่ได้รับความนิยมและบางส่วนของแนวความคิดที่ไม่ค่อยมีคนรู้จักเป็นสิ่งสำคัญเพื่อยกระดับเหตุผลและทักษะในการตัดสินใจของคนในโลกที่ซับซ้อน

ภาวะที่กลืนไม่เข้าคายไม่ออกของผู้ต้องขัง - โดยสรุป

กลยุทธ์ทางทฤษฎีเกมที่ได้รับความนิยมและใช้กันมากที่สุดอย่างหนึ่งคือภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษ แนวคิดนี้เป็นการสำรวจกลยุทธ์การตัดสินใจของบุคคลสองคนโดยการกระทำด้วยความสนใจที่ดีที่สุดของตนเองโดยสิ้นเชิงจะทำให้ผลลัพธ์ที่เลวร้ายยิ่งกว่ากรณีที่พวกเขาให้ความร่วมมือกับผู้อื่นในตอนแรก

ในสถานการณ์ที่ผู้ต้องขังขึ้นเขียงผู้ต้องสงสัยสองคนที่ถูกจับกุมในข้อหาอาชญากรรมจะถูกแยกออกจากห้องและไม่สามารถติดต่อกันได้ พนักงานอัยการแจ้งข้อมูลแต่ละฉบับว่าถ้าเขา (เรียกเขาว่าผู้ต้องหา 1) สารภาพและให้ปากคำกับอีกฝ่ายหนึ่งเขาสามารถออกไปได้ฟรี แต่ถ้าเขาไม่ให้ความร่วมมือและสงสัย 2 ผู้ต้องหา 1 จะถูกจำคุก 3 ปีในคุก ถ้าทั้งสองคนสารภาพว่าพวกเขาจะได้รับโทษจำคุก 2 ปีและหากไม่มีการสารภาพพวกเขาจะถูกจำคุก 1 ปี

ในขณะที่ความร่วมมือเป็นยุทธศาสตร์ที่ดีที่สุดสำหรับผู้ต้องสงสัยทั้งสองคนเมื่อเผชิญหน้ากับภาวะที่กลืนไม่เข้าคายไม่ออกดังกล่าวผลการวิจัยแสดงให้เห็นว่าคนส่วนใหญ่ชอบที่จะสารภาพและเป็นพยานต่อบุคคลอื่นแทนที่จะเงียบและมีโอกาส ว่าอีกฝ่ายข่มขวัญ

กลวิธีในการเล่นเกม (Game Theory Strategies)

ปัญหาเรื่องภาวะซึมเศร้าของผู้ต้องขังถือเป็นรากฐานสำหรับกลยุทธ์ทางทฤษฎีเกมขั้นสูงซึ่งเป็นที่นิยม ได้แก่

Matching Pennies

: นี่เป็นเกมที่ไม่มีผลรวมถึงผู้เล่นสองคน ผู้เล่น A และผู้เล่น B) พร้อมกันวางเงินบนโต๊ะด้วยผลตอบแทนขึ้นอยู่กับว่า pennies ตรงกับ ถ้า pennies ทั้งสองเป็นหัวหรือหางผู้เล่น A ชนะและเก็บเงินของ Player B หากไม่ตรงกันผู้เล่น B จะชนะและเก็บเงินของ Player A

การหยุดชะงัก : สถานการณ์ในภาวะที่กลืนไม่เข้าคายไม่ออกทางสังคมเช่นภาวะที่กลืนไม่เข้าคายไม่ออกของ Prisoner ในกรณีที่ผู้เล่นสองรายสามารถร่วมมือหรือชำรุดบกพร่อง (i.อี ไม่ร่วมมือ) ใน Deadlock ถ้าผู้เล่น A และ Player B ร่วมมือกันพวกเขาแต่ละคนจะได้รับผลตอบแทน 1 และหากทั้งคู่มีข้อบกพร่องพวกเขาจะได้รับผลตอบแทน 2 คะแนน แต่ถ้าผู้เล่น A และผู้เล่น B ชำรุด A จะได้รับผลตอบแทน ตัวเลขที่สองในเซลล์ (a) ถึง (d) หมายถึงผลตอบแทนของผู้เล่น A และตัวเลขที่สองคือ Player B:

Deadlock Payoff Matrix < ผู้เล่น B ผู้เล่น

ความบกพร่อง

ผู้เล่น A

ร่วมมือ

(ก) 1, 1

(b) 0, 3

ข้อบกพร่อง

(c) 3 , 0

(d) 2, 2

การหยุดชะงักแตกต่างจากการขึ้นเขียงของผู้ต้องขังในการที่การกระทำที่ก่อให้เกิดผลประโยชน์ร่วมกันมากที่สุด (เช่นข้อบกพร่องทั้งสอง) เป็นยุทธศาสตร์ที่โดดเด่น กลยุทธ์ที่สำคัญสำหรับผู้เล่นหมายถึงผู้เล่นที่ให้ผลตอบแทนสูงที่สุดของกลยุทธ์ที่มีอยู่โดยไม่คำนึงถึงกลยุทธ์ที่ใช้โดยผู้เล่นรายอื่น

ตัวอย่างที่อ้างถึงกันทั่วไปเกี่ยวกับ Deadlock คือพลังนิวเคลียร์สองแห่งที่พยายามจะบรรลุข้อตกลงเพื่อกำจัดคลังแสงนิวเคลียร์ของพวกเขา ในกรณีนี้ความร่วมมือหมายถึงการยึดมั่นในข้อตกลงนี้ในขณะที่การละเลยหมายถึงการยกเลิกอย่างไม่เป็นไปตามข้อตกลงและการเก็บรักษาคลังแสงนิวเคลียร์ ผลลัพธ์ที่ดีที่สุดสำหรับทั้งสองประเทศคือการไม่ยอมรับข้อตกลงและคงไว้ซึ่งตัวเลือกนิวเคลียร์ในขณะที่ประเทศอื่น ๆ ลดคลังแสงของตนเนื่องจากจะทำให้ข้อได้เปรียบที่ซ่อนอยู่อย่างมหาศาลในช่วงหลังสงครามโลกครั้งที่สองเกิดขึ้นได้ ตัวเลือกที่ดีที่สุดเป็นอันดับสองคือความบกพร่องหรือความร่วมมือเนื่องจากสถานะนี้มีสถานะเป็นพลังนิวเคลียร์

Cournot Competition

: โมเดลนี้ยังเป็นแนวคิดที่คล้ายคลึงกับภาวะที่กลืนไม่เข้าคายไม่ออกของนักโทษและได้รับการตั้งชื่อตามนักคณิตศาสตร์ชาวฝรั่งเศส Augustin Cournot ผู้ซึ่งนำมาใช้ในปี ค.ศ. 1838 การประยุกต์ใช้แบบจำลอง Cournot ในรูปแบบ duopoly หรือสองส่วนใหญ่ ผู้ผลิตในตลาด

ตัวอย่างเช่นสมมติว่าทั้งสอง บริษัท A และ B ผลิตผลิตภัณฑ์ที่เหมือนกันและสามารถผลิตได้ปริมาณสูงหรือต่ำ หากทั้งสองฝ่ายร่วมมือกันและตกลงที่จะผลิตในระดับต่ำอุปทานที่มีอยู่อย่าง จำกัด จะแปลเป็นราคาที่สูงสำหรับผลิตภัณฑ์ในตลาดและผลกำไรที่สำคัญสำหรับทั้งสอง บริษัท ในทางตรงกันข้ามหากมีข้อบกพร่องและผลิตผลในระดับสูงตลาดจะล้นมือและส่งผลให้ราคาผลิตภัณฑ์ต่ำและส่งผลให้กำไรลดลง แต่หากมีการร่วมมือกัน (เช่นผลิตในระดับต่ำ) และข้อบกพร่องอื่น ๆ (เช่นผลิตในระดับที่แอบแฝงอยู่ในระดับสูง) อดีตคนเดิมจะหยุดพักแม้ในขณะที่คนหลังมีรายได้สูงกว่าหากทั้งสองฝ่ายให้ความร่วมมือ

เมทริกซ์ผลตอบแทนของ บริษัท A และ B แสดงไว้ (ตัวเลขแสดงถึงกำไรเป็นล้านดอลลาร์) ดังนั้นหาก A ร่วมมือและผลิตในระดับต่ำในขณะที่ข้อผิดพลาด B และผลิตในระดับสูงผลตอบแทนที่ได้แสดงไว้ในเซลล์ (b) - break-even สำหรับ บริษัท A และ 7 ล้านเหรียญในกำไรของ บริษัท B. Cournot Payoff Matrix บริษัท B

ร่วมมือ

ข้อบกพร่อง

บริษัท

ความร่วมมือ

(a) 4, 4

(b) 0, 7

ความบกพร่อง

(c. ) 7, 0

(d) 2, 2

การประสานงาน

: ในการประสานงานผู้เล่นจะได้รับผลตอบแทนที่สูงขึ้นเมื่อเลือกเส้นทางเดียวกัน

เป็นตัวอย่างให้พิจารณาเทคโนโลยียักษ์สองตัวที่กำลังตัดสินใจเลือกที่จะนำเทคโนโลยีใหม่ ๆ ที่มีอยู่ในชิปหน่วยความจำซึ่งอาจสร้างผลกำไรได้หลายร้อยล้านดอลลาร์หรือใช้เทคโนโลยีรุ่นเก่าที่ได้รับการแก้ไขซึ่งจะทำให้พวกเขามีรายได้น้อยลง หากมีเพียง บริษัท เดียวที่ตัดสินใจที่จะก้าวไปข้างหน้ากับเทคโนโลยีใหม่ ๆ การยอมรับของตลาดโดยผู้บริโภคจะลดลงอย่างมากและส่งผลให้ บริษัท มีรายได้น้อยกว่าหากทั้งสอง บริษัท ตัดสินใจในแนวทางเดียวกัน เมทริกซ์ผลตอบแทนจะแสดงด้านล่าง (ตัวเลขแสดงถึงกำไรเป็นล้านดอลลาร์)

ดังนั้นหากทั้งสอง บริษัท ตัดสินใจที่จะแนะนำเทคโนโลยีใหม่พวกเขาจะได้รับรายได้ 600 ล้านเหรียญในขณะที่การนำเทคโนโลยีรุ่นเก่ามาปรับปรุงใหม่จะมีรายได้ถึง 300 ล้านดอลลาร์ต่อเซลล์ดังแสดงในเซลล์ (ง) แต่ถ้า บริษัท A ตัดสินใจเลือกใช้เทคโนโลยีใหม่เพียงอย่างเดียวก็จะมีรายได้เพียง 150 ล้านเหรียญแม้ว่า บริษัท B จะมีรายได้ถึง 0 เหรียญ (น่าจะเป็นเพราะผู้บริโภคอาจไม่เต็มใจที่จะจ่ายเงินให้กับเทคโนโลยีเก่าที่ล้าสมัย) ในกรณีนี้จะทำให้ทั้งสอง บริษัท ทำงานร่วมกันมากกว่าที่จะเป็นของตนเอง

บริษัท เทคโนโลยี บริษัท

เทคโนโลยีใหม่

(ก) 600, 600

(b) 0, 150 < เทคโนโลยีเก่า

(c) 150, 0

(d) 300, 300

เกม Centipede

: นี่คือเกมแบบฟอร์มที่กว้างขวางซึ่งผู้เล่นสองรายได้รับโอกาสให้ได้รับรางวัลใหญ่ ส่วนแบ่งของเงินสะสมที่เพิ่มขึ้นอย่างช้าๆ เกม Centipede เป็นลำดับเนื่องจากผู้เล่นทำการย้ายของพวกเขาหนึ่งหลังจากที่อื่นมากกว่าพร้อมกัน; ผู้เล่นแต่ละคนยังรู้กลยุทธ์ที่เลือกโดยผู้เล่นที่เล่นก่อนหน้าพวกเขา เกมสรุปเร็วที่สุดเท่าที่ผู้เล่นจะมีส่วนร่วมกับผู้เล่นที่ได้รับส่วนใหญ่และผู้เล่นคนอื่น ๆ ได้รับส่วนเล็ก ๆ

ตัวอย่างเช่นถ้า Player A และ Player B กำลังเล่นเกม Centipede ให้สมมติว่า Player A ไปก่อนและต้องตัดสินใจว่าเขาควร "Take" หรือ "Pass" ที่สะสมซึ่งขณะนี้มีมูลค่า $ 2 ถ้าเขาใช้เวลา A และ B จะได้รับ $ 1 แต้ม แต่ถ้าผ่านไปการตัดสินใจของ "Take or Pass" จะต้องดำเนินการโดยผู้เล่น B. ถ้า B ใช้เวลาเธอจะได้รับ $ 3 (คือส่วนที่ผ่านมาของ $ 2 + $ 1 ) และ A ได้รับ $ 0 แต่ถ้าผ่าน B ตอนนี้ได้รับการตัดสินใจว่าจะใช้หรือผ่านและอื่น ๆ หากผู้เล่นทั้งสองเลือกที่จะผ่านทุกครั้งพวกเขาจะได้รับผลตอบแทน 100 เหรียญเมื่อจบเกม

ประเด็นของเกมก็คือถ้าทั้ง A และ B ร่วมมือกันและ "ผ่าน" ไปจนถึงตอนท้ายของเกมพวกเขาจะได้รับผลตอบแทนสูงสุดที่ 100 เหรียญแต่ละเกม แต่ถ้าพวกเขาไม่ไว้ใจผู้เล่นคนอื่น ๆ และคาดหวังว่าพวกเขาจะ "ใช้เวลา" ในโอกาสแรกความสมดุลของแนชจะคาดการณ์ว่าผู้เล่นจะได้รับการเรียกร้องต่ำสุด ($ 1 ในกรณีนี้) การทดลองได้แสดงให้เห็นว่าพฤติกรรมแบบ "เหตุผล" (ตามที่คาดการณ์ไว้ตามทฤษฎีเกม) ไม่ค่อยมีในชีวิตจริง นี่ไม่ใช่ความแปลกใจอย่างสังหรณ์ใจที่ให้ขนาดเล็กของผลตอบแทนขั้นต้นในความสัมพันธ์กับครั้งสุดท้าย พฤติกรรมที่คล้ายคลึงกันโดยกลุ่มทดลองยังได้รับการจัดแสดงในภาวะที่กลืนไม่เข้าคายไม่ออกของนักท่องเที่ยว

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักท่องเที่ยว

: นี่คือเกมรวมที่ไม่ใช่ศูนย์ซึ่งผู้เล่นทั้งสองพยายามที่จะเพิ่มผลตอบแทนสูงสุดโดยไม่คำนึงถึงอีกฝ่าย โดยนักเศรษฐศาสตร์ Kaushik Basu ในปี 1994 ในภาวะที่กลืนไม่เข้าคายไม่ออกของนักท่องเที่ยวสายการบินยินยอมที่จะจ่ายค่าชดเชยสำหรับนักท่องเที่ยวสองรายเพื่อชดเชยค่าเสียหายให้กับสินค้าที่เหมือนกัน อย่างไรก็ตามทั้งสองเดินทางแยกต่างหากเพื่อคำนวณมูลค่าของรายการโดยต้องมีค่าอย่างน้อย 2 ดอลลาร์และสูงสุดไม่เกิน 100 ดอลลาร์ ถ้าทั้งสองคนเขียนค่าเดียวกันสายการบินจะคืนเงินจำนวนดังกล่าวให้กับแต่ละคน แต่ถ้าค่าต่างกันสายการบินจะจ่ายเงินให้กับพวกเขาด้วยมูลค่าที่ต่ำกว่าด้วยโบนัส 2 เหรียญสำหรับนักเดินทางที่เขียนค่าต่ำกว่านี้และค่าปรับ 2 เหรียญสำหรับนักเดินทางที่เขียนค่าที่สูงขึ้น

ระดับสมดุลของแนชขึ้นอยู่กับการเหนี่ยวนำย้อนหลังคือ $ 2 ในสถานการณ์นี้ แต่เช่นเดียวกับในเกม Centipede การทดลองในห้องปฏิบัติการแสดงให้เห็นอย่างสม่ำเสมอว่าผู้เข้าร่วมส่วนใหญ่ - อย่างไร้เดียงสาหรืออย่างอื่น - เลือกตัวเลขที่สูงกว่า $ 2

ภาวะที่กลืนไม่เข้าคายไม่ออกของนักท่องเที่ยวสามารถนำไปใช้ในการวิเคราะห์สถานการณ์ต่างๆในชีวิตได้หลากหลาย ตัวอย่างของการเหนี่ยวนำย้อนหลังสามารถช่วยอธิบายได้ว่า บริษัท สองแห่งที่ร่วมแข่งขันฆาตกรสามารถที่จะปรับราคาผลิตภัณฑ์แกร่งขึ้นเพื่อให้ได้ส่วนแบ่งการตลาดซึ่งอาจส่งผลให้เกิดการสูญเสียมากขึ้นในกระบวนการนี้

ยุทธวิธีเกมกลยุทธ์เพิ่มเติม การต่อสู้เพศ

: นี่เป็นอีกรูปแบบหนึ่งของเกมประสานงานที่อธิบายไว้ก่อนหน้านี้ แต่มีความไม่สมดุลบางส่วน มันเป็นหลักที่เกี่ยวข้องกับคู่พยายามที่จะประสานงานตอนเย็นของพวกเขาออก ในขณะที่พวกเขาได้ตกลงที่จะพบกันที่เกมบอล (การตั้งค่าของผู้ชาย) หรือที่เล่น (การตั้งค่าของผู้หญิง) พวกเขาลืมสิ่งที่พวกเขาตัดสินใจและเพื่อเพิ่มปัญหาไม่สามารถสื่อสารกับคนอื่นได้ พวกเขาควรไปที่ไหน? เมทริกซ์ผลตอบแทนแสดงตามที่แสดงไว้ - ตัวเลขในเซลล์แสดงถึงระดับความพึงพอใจของเหตุการณ์สำหรับผู้หญิงและผู้ชายตามลำดับ ตัวอย่างเช่นเซลล์ (a) หมายถึงผลตอบแทน (ในแง่ของระดับความสุข) สำหรับผู้หญิงและผู้ชายตามลำดับในการเล่น (เธอชอบมันมากเกินกว่าที่เขาทำ) เซลล์ (d) เป็นผลตอบแทนถ้าทั้งสองทำให้เกมบอล (เขาสนุกกับมันมากกว่าที่เธอทำ) เซลล์ (c) แสดงถึงความไม่พอใจหากทั้งสองไปไม่เพียง แต่ไปยังตำแหน่งที่ไม่ถูกต้องเท่านั้น แต่ยังรวมไปถึงเหตุการณ์ที่พวกเขาชอบอย่างน้อย - ผู้หญิงเล่นเกมบอลและชายในการเล่น

เล่น

เกมบอล หญิง

เล่น

(a) 6, 3

(b) 2, 2

การต่อสู้ของเพศชาย > เกมบอล (c) 0, 0

(d) 3, 6

เกมเผด็จการ

: นี่เป็นเกมง่ายๆที่ Player A ต้องตัดสินใจว่าจะแบ่งรางวัลเงินสดกับ Player B ผู้ซึ่งไม่มีข้อมูลในการตัดสินใจของผู้เล่น A แม้ว่าจะไม่ใช่กลยุทธ์ทฤษฎีเกม 999 ต่อ se 999 จะให้ข้อมูลเชิงลึกที่น่าสนใจในพฤติกรรมของผู้คน การทดลองเผยให้เห็นว่าประมาณ 50% เก็บเงินทั้งหมดไว้กับตัวเอง แบ่งเป็น 5% โดยเท่าเทียมกันและอีก 45% ให้ผู้เข้าร่วมรายอื่นมีส่วนร่วมน้อยลง เกมเผด็จการมีความเกี่ยวข้องกับเกมขาดคำซึ่งผู้เล่น A จะได้รับเงินจำนวนหนึ่งซึ่งเป็นส่วนหนึ่งของผู้เล่น B ซึ่งสามารถยอมรับหรือปฏิเสธจำนวนเงินที่กำหนดได้จับได้ว่าถ้าผู้เล่นคนที่สองปฏิเสธจำนวนที่เสนอทั้ง A และ B ไม่มีอะไร ผู้เผด็จการและเกมขาดคำสั่งถือเป็นบทเรียนที่สำคัญสำหรับประเด็นต่างๆเช่นการกุศลและการทำบุญ

สันติภาพ - สงคราม

: รูปแบบของภาวะที่กลืนไม่เข้าคายไม่ออกของผู้ต้องหาซึ่งการตัดสินใจ "ความร่วมมือหรือความบกพร่อง" ถูกแทนที่ด้วย "สันติภาพหรือสงคราม" "การเปรียบเทียบอาจเป็นสอง บริษัท ที่เข้าร่วมสงครามราคา หากทั้งสองคนละเว้นจากการตัดราคาพวกเขามีความมั่งคั่ง (เซลล์) แต่สงครามราคาจะลดผลตอบแทนอย่างมาก (เซลล์ d) อย่างไรก็ตามถ้า A มีส่วนร่วมในการตัดราคา (B) แต่ B ไม่ได้ A จะมีผลตอบแทนที่สูงขึ้นเป็น 4 เนื่องจากอาจมีส่วนแบ่งการตลาดมากและปริมาณที่สูงขึ้นนี้จะชดเชยกับราคาผลิตภัณฑ์ที่ลดลง

สันติภาพ

สงคราม

บริษัท

สันติภาพ

(a) 3, 3

(b) 0, 4

สงครามสันติภาพ > สงคราม (c) 4, 0 (d) 1, 1 ภาวะที่กลืนไม่เข้าคายไม่ออกของอาสาสมัคร

: ในภาวะที่กลืนไม่เข้าคายไม่ออกของอาสาสมัครใครบางคนต้องทำงานบ้านหรือทำงานเพื่อประโยชน์ร่วมกัน ผลที่เลวร้ายที่สุดที่เป็นไปได้คือตระหนักว่าไม่มีใครเป็นอาสาสมัคร ตัวอย่างเช่นพิจารณา บริษัท ที่มีการทุจริตในการบัญชีอยู่เฉื่อย แต่ผู้บริหารระดับสูงไม่ได้ตระหนักถึงเรื่องนี้ พนักงานบางคนในแผนกบัญชีตระหนักถึงการฉ้อโกง แต่ลังเลที่จะบอกผู้บริหารระดับสูงเพราะจะส่งผลให้พนักงานที่เกี่ยวข้องในการฉ้อโกงถูกไล่ออกและอาจถูกดำเนินคดีมากที่สุด การถูกระบุว่าเป็น "whistleblower" อาจมีผลกระทบบางอย่างลงเส้น แต่ถ้าไม่มีใครเป็นอาสาสมัครการฉ้อฉลขนาดใหญ่อาจส่งผลให้ บริษัท ล้มละลายในที่สุดและการสูญเสียงานของทุกคน ทฤษฎีด้านล่าง

ทฤษฎีเกมสามารถใช้เป็นเครื่องมือในการตัดสินใจได้อย่างมีประสิทธิภาพไม่ว่าจะเป็นในด้านเศรษฐกิจธุรกิจหรือการตั้งค่าส่วนบุคคล