Prisoner’s Dilemma là gì?

39

Tình huống khó xử của tù nhân là gì?

Tình huống khó xử của người tù là một nghịch lý trong phân tích quyết định, trong đó hai cá nhân hành động vì lợi ích cá nhân của họ không tạo ra kết quả tối ưu.

Tóm tắt ý kiến chính

  • Tình huống tiến thoái lưỡng nan của tù nhân là tình huống mà những người ra quyết định cá nhân luôn có động cơ để lựa chọn theo cách tạo ra kết quả kém tối ưu cho các cá nhân trong một nhóm.
  • Tình trạng khó xử của tù nhân xảy ra trong nhiều khía cạnh của nền kinh tế.
  • Người ta đã phát triển nhiều phương pháp khắc phục tình trạng khó xử của tù nhân để chọn kết quả tập thể tốt hơn mặc dù có vẻ như không có lợi cho cá nhân.
1:46

Tình trạng khó xử của tù nhân

Hiểu được tình thế tiến thoái lưỡng nan của tù nhân

Tình thế tiến thoái lưỡng nan của tù nhân điển hình được thiết lập theo cách mà cả hai bên đều chọn cách bảo vệ mình bằng cái giá của người tham gia còn lại. Kết quả là, cả hai người tham gia đều thấy mình ở trạng thái tồi tệ hơn so với khi họ đã hợp tác với nhau trong quá trình ra quyết định. Tình thế tiến thoái lưỡng nan của người tù là một trong những khái niệm nổi tiếng nhất trong lý thuyết trò chơi hiện đại.

Tình huống tiến thoái lưỡng nan của người tù đưa ra một tình huống mà hai bên, tách biệt và không thể giao tiếp, mỗi bên phải lựa chọn hợp tác với nhau hay không. Phần thưởng cao nhất cho mỗi bên xảy ra khi cả hai bên chọn hợp tác.

Tình huống khó xử của tù nhân kinh điển diễn ra như thế này:

  • Hai thành viên của một băng nhóm cướp ngân hàng, Dave và Henry, đã bị bắt và đang bị thẩm vấn trong các phòng riêng biệt.
  • Các nhà chức trách không có nhân chứng nào khác, và chỉ có thể chứng minh vụ án chống lại họ nếu họ có thể thuyết phục ít nhất một trong những tên cướp phản bội đồng phạm của mình và làm chứng tội ác.
  • Mỗi tên cướp ngân hàng phải đối mặt với sự lựa chọn hợp tác với đồng phạm của mình và giữ im lặng hoặc đào tẩu khỏi băng nhóm và làm chứng cho việc truy tố.
  • Nếu cả hai hợp tác và giữ im lặng, thì nhà chức trách sẽ chỉ có thể kết tội họ với tội danh nhẹ hơn, dẫn đến một năm tù cho mỗi người (1 năm cho Dave + 1 năm cho Henry = 2 năm tổng thời gian tù).
  • Nếu một người làm chứng và người kia không làm chứng, thì người làm chứng sẽ được miễn phí và người kia sẽ nhận được năm năm (0 năm đối với người có khuyết điểm + 5 đối với người bị kết án = tổng cộng 5 năm).
  • Tuy nhiên, nếu cả hai làm chứng chống lại nhau, mỗi người sẽ phải nhận hai năm tù vì chịu một phần trách nhiệm trong vụ cướp (2 năm cho Dave + 2 năm cho Henry = 4 năm tổng thời gian ngồi tù).

Trong trường hợp này, mỗi tên cướp luôn có động cơ để đào tẩu, bất chấp lựa chọn của kẻ kia. Theo quan điểm của Dave, nếu Henry giữ im lặng, thì Dave có thể hợp tác với Henry và chịu một năm tù, hoặc đào ngũ và ra đi tự do. Rõ ràng, anh ta sẽ tốt hơn nếu phản bội Henry và những người còn lại trong băng đảng trong trường hợp này. Mặt khác, nếu Henry từ chối và làm chứng chống lại Dave, thì lựa chọn của Dave sẽ trở thành im lặng và thực hiện 5 năm hoặc nói chuyện và ngồi tù 2 năm. Một lần nữa, rõ ràng là anh ấy muốn làm hai năm hơn năm.

Trong cả hai trường hợp, cho dù Henry hợp tác với Dave hay phản đối công tố, Dave sẽ tốt hơn nếu anh ta tự nhận lỗi và làm chứng. Bây giờ, vì Henry phải đối mặt với cùng một loạt lựa chọn nên anh ấy cũng sẽ luôn tốt hơn trong việc đào tẩu.

Nghịch lý trong tình thế tiến thoái lưỡng nan của người tù là thế này: cả hai tên cướp có thể giảm thiểu tổng thời gian ngồi tù mà cả hai sẽ phải làm chỉ khi cả hai cùng hợp tác và giữ im lặng (tổng cộng 2 năm), nhưng những ưu đãi mà mỗi người phải đối mặt riêng biệt sẽ luôn luôn khiến mỗi người phải đào tẩu và kết thúc tổng thời gian ngồi tù tối đa giữa hai người là 4 năm.

Ví dụ về tình thế tiến thoái lưỡng nan của tù nhân

Nền kinh tế tràn ngập những ví dụ về tình huống khó xử của tù nhân có thể dẫn đến kết quả có lợi hoặc có hại cho nền kinh tế và xã hội nói chung. Chủ đề chung là thế này: một tình huống mà những khuyến khích mà mỗi người ra quyết định cá nhân phải đối mặt sẽ khiến họ hành xử theo cách khiến tất cả họ trở nên tồi tệ hơn, trong khi mỗi cá nhân tránh những lựa chọn có thể làm cho tất cả họ tốt hơn nếu tất cả đều có thể một số bằng cách nào đó hợp tác lựa chọn.

Một ví dụ như vậy là bi kịch của những người bình thường. Có thể lợi ích chung của mọi người là bảo tồn và tái đầu tư vào việc truyền bá nguồn tài nguyên thiên nhiên chung để có thể tiếp tục tiêu thụ nó, nhưng thay vào đó, mỗi cá nhân luôn có động cơ tiêu thụ càng nhiều càng tốt, điều này sau đó làm cạn kiệt tài nguyên. Tìm cách hợp tác rõ ràng sẽ làm cho mọi người ở đây tốt hơn.

Mặt khác, hành vi của các-ten cũng có thể được coi là một tình huống khó xử của tù nhân. Tất cả các thành viên của một tập đoàn có thể làm giàu tập thể bằng cách hạn chế sản lượng để giữ mức giá mà mỗi thành viên nhận được đủ cao để thu được tiền thuê kinh tế từ người tiêu dùng, nhưng mỗi thành viên của tập đoàn đều có động cơ gian lận trong tập đoàn và tăng sản lượng để thu được tiền thuê từ các thành viên cartel khác. Về mặt phúc lợi của toàn xã hội mà tập đoàn hoạt động, đây là một ví dụ về việc một tù nhân tiến thoái lưỡng nan khi phá bỏ tập đoàn đôi khi có thể thực sự khiến xã hội nói chung trở nên tốt đẹp hơn.

Thoát khỏi tình thế tiến thoái lưỡng nan của tù nhân

Theo thời gian, người ta đã tìm ra nhiều giải pháp khác nhau cho những tình huống khó xử của tù nhân nhằm khắc phục những khuyến khích cá nhân có lợi cho lợi ích chung.

Đầu tiên, trong thế giới thực, hầu hết các tương tác kinh tế và con người khác đều lặp lại nhiều lần. Tình huống tiến thoái lưỡng nan của một tù nhân thực sự thường chỉ diễn ra một lần hoặc nếu không thì nó được xếp vào tình huống khó xử của tù nhân lặp đi lặp lại. Trong tình huống tiến thoái lưỡng nan của một tù nhân lặp đi lặp lại, người chơi có thể chọn các chiến lược thưởng cho sự hợp tác hoặc trừng phạt việc đào tẩu theo thời gian. Bằng cách tiếp xúc nhiều lần với những cá nhân giống nhau, chúng ta thậm chí có thể cố tình chuyển từ tình thế tiến thoái lưỡng nan của tù nhân một lần sang tình thế khó xử của tù nhân lặp đi lặp lại.

Thứ hai, người ta đã phát triển các chiến lược thể chế chính thức để thay đổi các động lực mà cá nhân người ra quyết định phải đối mặt. Hành động tập thể để thực thi hành vi hợp tác thông qua danh tiếng, quy tắc, luật pháp, dân chủ hoặc một quyết định tập thể khác, và hình phạt xã hội rõ ràng đối với hành vi đào tẩu làm biến đổi tình thế khó xử của nhiều tù nhân sang các kết quả hợp tác có lợi hơn cho tập thể.

Cuối cùng, một số người và nhóm người đã phát triển các thành kiến về tâm lý và hành vi theo thời gian như tin tưởng cao hơn vào nhau, định hướng tương lai dài hạn trong các tương tác lặp đi lặp lại và thiên hướng có đi có lại tích cực của hành vi hợp tác hoặc có đi có lại tiêu cực của hành vi từ chối. Những khuynh hướng này có thể phát triển thông qua một loại chọn lọc tự nhiên trong một xã hội theo thời gian hoặc lựa chọn nhóm giữa các xã hội cạnh tranh khác nhau. Trên thực tế, chúng dẫn dắt các nhóm cá nhân lựa chọn một cách “phi lý trí” những kết quả thực sự có lợi nhất cho tất cả họ cùng nhau.

Tổng hợp lại, ba yếu tố này (tình trạng khó xử của tù nhân lặp đi lặp lại, các thể chế chính thức phá vỡ tình thế khó xử của tù nhân và thành kiến hành vi làm suy yếu sự lựa chọn “hợp lý” của cá nhân trong tình huống khó xử của tù nhân) giúp giải quyết nhiều tình huống khó xử của tù nhân mà nếu không chúng ta phải đối mặt.

Bi kịch của Commons là gì?

Bi kịch của các điểm chung là một vấn đề lý thuyết trong kinh tế học đề xuất rằng mọi cá nhân đều có động cơ để tiêu thụ một nguồn tài nguyên, nhưng lại gây thiệt hại cho mọi cá nhân khác – không có cách nào loại trừ bất kỳ ai tiêu thụ. Nói chung, nguồn lực quan tâm dễ dàng có sẵn cho tất cả các cá nhân mà không có rào cản (tức là “điểm chung”). Theo giả thuyết, điều này dẫn đến tiêu thụ quá mức và cuối cùng là cạn kiệt nguồn tài nguyên chung, gây bất lợi cho mọi người. Về cơ bản, nó nêu bật khái niệm về các cá nhân bỏ bê hạnh phúc của xã hội để theo đuổi lợi ích cá nhân. Tính chính xác và ứng dụng của nó đang được tranh luận.

Một số cách để chống lại tình thế tiến thoái lưỡng nan của tù nhân là gì?

Các giải pháp cho tình trạng khó xử của tù nhân tập trung vào việc vượt qua các động cơ cá nhân để có lợi cho lợi ích chung. Trong thế giới thực, hầu hết các tương tác kinh tế và con người khác được lặp lại nhiều lần. Điều này cho phép các bên lựa chọn chiến lược thưởng cho sự hợp tác hoặc trừng phạt việc đào tẩu theo thời gian.

Một giải pháp khác dựa vào việc phát triển các chiến lược thể chế chính thức để thay đổi các động lực mà các nhà ra quyết định cá nhân phải đối mặt. Cuối cùng, những thành kiến về hành vi có thể sẽ phát triển theo thời gian làm suy yếu sự lựa chọn “hợp lý” của cá nhân trong tình huống khó xử của tù nhân và khiến các nhóm cá nhân “phi lý trí” lựa chọn những kết quả thực sự có lợi nhất cho tất cả họ cùng nhau.

Tình huống Tiến thoái lưỡng nan của Tù nhân có Hữu ích cho Xã hội không?

Tình trạng tiến thoái lưỡng nan của người tù đôi khi thực sự có thể làm cho xã hội nói chung trở nên tốt đẹp hơn. Một ví dụ điển hình là hoạt động của một cartel dầu. Tất cả các thành viên cartel có thể làm giàu tập thể bằng cách hạn chế sản lượng để giữ giá dầu ở mức mà mỗi thành viên đều tối đa hóa doanh thu nhận được từ người tiêu dùng, nhưng mỗi thành viên cartel riêng lẻ có động cơ gian lận trong cartel và tăng sản lượng để cũng thu được doanh thu từ các thành viên cartel khác. Kết quả cuối cùng không phải là kết quả tối ưu mà các-ten mong muốn mà là kết quả có lợi cho người tiêu dùng khi giá dầu thấp hơn.

Nguồn tham khảo: investmentopedia