Lý thuyết trò chơi cân bằng Nash

Lý thuyết trò chơi cân bằng Nash

Lý thuyết trò chơi cân bằng Nash

Nguồn: “What is the Nash equilibrium and why does it matter?“, The Economist, 06/09/2016

Biên dịch: Thu Hương

Các nhà kinh tế học có thể giải thích những điều diễn ra trong quá khứ và đôi lúc còn có thể dự đoán chính xác về tương lai. Tuy nhiên, không nhiều học thuyết có tính ứng dụng trong thực tiễn cao như điểm cân bằng Nash – học thuyết kinh tế được đặt tên theo nhà nghiên cứu đã phát hiện ra nó và cũng nhờ đó mà đạt giải Nobel kinh tế năm 1994.

Khái niệm đơn giản này còn giúp các nhà kinh tế học tìm ra nguyên lý xác định giá cả của các công ty, giải thích các Chính phủ nên thiết kế những cuộc đấu giá như thế nào để được hưởng lợi nhiều nhất và giải thích cả nguyên nhân tại sao đôi lúc trong 1 nhóm sẽ đưa ra những quyết định tự chuốc lấy thất bại. Vậy thì điểm cân bằng Nash là gì và tại sao đây là một trong những khái niệm kinh tế có ý nghĩa quan trọng và thay đổi cả thế giới?

Lý thuyết trò chơi cân bằng Nash

 Sơ đồ thể hiện thế tiến thoái lưỡng nan của người tù nhân trên đây là một trong những hình minh họa nổi tiếng nhất về điểm cân bằng Nash. Giả sử có hai người tù đang ở trong 2 buồng giam riêng biệt và cùng nhận được những lời gợi ý giống nhau từ điều tra viên. Nếu họ cùng thú tội đã giết người, mỗi người sẽ bị phạt 10 năm tù giam. Nếu một trong hai người im lặng trong khi người khác thú tội, kẻ chỉ điểm sẽ được thả trong khi người kia lãnh án tù chung thân. Nếu cả hai không nói gì, cả hai đều lãnh án nhưng sẽ chỉ ở trong xà lim 1 năm mà thôi.

Rõ ràng lựa chọn tốt nhất là cả hai người im lặng. Nhưng một nhà kinh tế học với khái niệm điểm cân bằng Nash ở trong đầu sẽ dự đoán ngược lại: trường hợp hay xảy ra nhất là cả hai đều thú tội.

Ở điểm cân bằng Nash, mỗi thành viên của nhóm đều đưa ra quyết định có lợi cho bản thân mình nhất và dựa trên suy đoán về những điều người khác sẽ làm. Trong trường hợp 2 tù nhân, giữ im lặng không bao giờ là một lựa chọn tốt dù cho người còn lại chọn gì. Tù nhân A sẽ suy nghĩ rằng nếu tù nhân B nói ra thì mình cũng phải nói vì như vậy sẽ tránh được án chung thân; còn nếu tù nhân B im lặng thì mình sẽ được trả tự do. Như vậy nói ra mới là cách tốt nhất.

Áp dụng trong thế giới thực, các nhà kinh tế học sử dụng điểm cân bằng Nash để dự đoán các công ty sẽ phản ứng như thế nào trước mức giá của đối thủ cạnh tranh. Hai công ty lớn cùng đặt ra chiến lược cạnh tranh về giá có thể sẽ dồn nén khách hàng nhiều hơn so với bình thường nếu mỗi công ty phải đối mặt với hàng nghìn đối thủ cạnh tranh.

Điểm cân bằng Nash cũng giúp các nhà kinh tế học hiểu rằng tại sao một quyết định có ích cho từng cá nhân lại có thể trở nên tồi tệ cho cả nhóm. Mọi người đều sẽ giàu có hơn nếu như có thể tự kiềm chế ở mức hợp lý, có chừng mực. Tuy nhiên vì suy nghĩ đến những điều người khác sẽ làm, họ chọn cách hoang phí. Đây chính là nguyên nhân dẫn đến tình trạng đánh bắt cạn kiệt nguồn thủy sản hay thải quá nhiều khí thải vào không khí.

Ngày nay, khái niệm điểm cân bằng Nash đóng vai trò quan trọng đối với kinh tế học vi mô hiện đại hay kinh tế học hành vi vì nó trao cho các nhà kinh tế học khả năng chọn ra người thắng cuộc và người thua cuộc.

Lý thuyết trò chơi (Game theory)

Nguồn: CafeF

John F. Nash Jr. nổi tiếng vì những tiến bộ trong lý thuyết trò chơi, vốn chủ yếu là việc nghiên cứu cách thức xây dựng một chiến lược thắng lợi trong trò chơi của cuộc sống — đặc biệt khi không biết được những gì đối thủ mình đang làm và những lựa chọn thì không phải lúc nào cũng đầy hứa hẹn.

Lý thuyết trò chơi cân bằng Nash

John F. Nash Jr. tại một buổi lễ vào tuần trước tại Oslo, Na Uy, nơi ông đã được trao giải thưởng Abel Prize. CreditBerit Roald/ NTB SCANPIX

Tiến sĩ Nash không phát minh ra lý thuyết trò chơi; nhà toán học John von Neumann là người tiên phong thiết lập lãnh vực này trong nửa đầu thế kỷ 20. Nhưng Tiến sĩ Nash đã mở rộng phân tích xa hơn, kiểu trò chơi tổng bằng không, “tôi thắng bạn thua” thành những tình huống phức tạp hơn, trong đó mọi người chơi đều có thể thắng, hoặc mọi người chơi đều có thể thua.

Khái niệm trung tâm là cân bằng Nash, được định nghĩa đại thể là một trạng thái ổn định, trong đó không có người chơi nào có thể đạt được lợi thế qua việc đơn phương thay đổi chiến lược, giả định rằng những người chơi khác không thay đổi những gì họ đang làm.

Bộ phim “A Beautiful Mind (Trí tuệ hoàn hảo)”, dựa trên cuộc đời của tiến sĩ Nash, nỗ lực giải thích lý thuyết trò chơi trong một màn mà Russell Crowe, đóng vai Tiến sĩ Nash, ở trong một quán bar với ba người bạn, và mọi người đều bị mê mẩn bởi một cô gái tóc vàng xinh đẹp, bước vào quán với bốn người bạn tóc nâu khác.

Trong khi bạn bè ông bông đùa về việc ai trong số họ sẽ tán tỉnh được cô gái tóc vàng, thì Tiến sĩ Nash lại kết luận rằng họ phải làm điều ngược lại: Hãy quên cô ta đi. “Nếu tất cả chúng ta đều quan tâm đến cô gái tóc vàng,” ông nói, “chúng ta sẽ cản trở lẫn nhau và không một ai trong chúng ta sẽ tán được cô ấy. Vì vậy, chúng ta sẽ chuyển qua tán tỉnh bạn bè của cô ấy, nhưng tất cả các cô ấy sẽ lạnh nhạt với chúng ta bởi vì không ai thích mình là sự lựa chọn thứ hai. Nhưng điều gì sẽ xảy ra nếu không ai quan tâm đến cô gái tóc vàng? Chúng ta không cản trở lẫn nhau và chúng ta cũng không xúc phạm các cô gái khác. Đó là cách duy nhất để giành chiến thắng”.

Trong khi một điều như trên không bao giờ xảy ra trong cuộc sống thực minh họa cho một số mưu đồ được các nhà lý thuyết trò chơi xem xét, thì trường hợp trên không phải là một ví dụ về cân bằng Nash.

Một ví dụ đơn giản hơn là cái được gọi là Thế lưỡng nan của tù nhân. Hai nghi phạm trong một vụ án phạm tội bị bắt giữ và được đề nghị một thỏa thuận: “Nếu bạn khai ra và làm chứng chống lại tòng phạm, thì chúng tôi sẽ thả bạn và quy tội cho bạn kia — 10 năm tù giam”.

Nếu cả hai đều giữ im lặng, thì các công tố viên không thể chứng minh được những cáo buộc nặng hơn và cả hai sẽ bị kết án một năm tù giam về một hành vi phạm tội không nghiêm trọng bằng. Nếu cả hai cùng khai, thì các công tố viên sẽ không cần đến bằng chứng của họ, và cả hai sẽ bị kết án tám năm tù giam.

Thoạt nhìn, giữ im lặng dường như là chiến lược tốt nhất. Nếu cả hai đều làm như vậy, thì cả hai sẽ có cơ hội được giảm tội khá nhẹ.

Nhưng tính toán của cân bằng Nash cho thấy cả hai có nhiều khả năng sẽ thú tội.

Kiểu vấn đề này được gọi là trò chơi bất hợp tác, có nghĩa là hai tù nhân không thể truyền đạt được ý định cho nhau. Khi không biết được những gì mà tù nhân khác làm, thì từng người phải đối mặt với lựa chọn sau: Nếu thú tội, thì có thể được tự do hoặc bị kết án tám năm tù giam. Nếu giữ im lặng, thì bị kết án một năm hoặc 10 năm tù giam.

Với suy nghĩ đó, thì thú tội là lựa chọn tốt hơn. Và nếu biết rằng tù nhân khác có cùng động lực để thú tội, thì lựa chọn giữ im lặng sẽ ít có khả năng xảy ra.

Ngoài ra, thay đổi chiến lược sang thành giữ im lặng sẽ là một một bước đi xấu — ở tù lâu hơn — trừ khi tù nhân khác bằng cách nào đó cũng làm điều tương tự. Nếu không truyền thông được với nhau, đó sẽ là một phỏng đoán mang tính rủi ro cao, và do đó, chiến lược này biểu trưng một cân bằng Nash.

Tuy nhiên, trường hợp ở quán bar thì không phải vậy. Với bốn người đàn ông theo đuổi bốn cô gái tóc nâu, thì thay vì làm vậy bất kì người đàn ông nào cũng có thể bị cám dỗ để theo đuổi cô gái tóc vàng, một kết quả đáng mong muốn hơn nếu bạn bè của người ấy cũng không thay đổi chiến lược.

…………………………

Xem thêm chi tiết bài viết

Theo KENNETH CHANG (Huỳnh Thiện Quốc Việt dịch)
Nguồn: phantichkinhte123.com, ngày 28/05/2015

Tham khảo thêm:
>>Cân bằng Nash