Lý thuyết trò chơi cơ bản

Lý thuyết trò chơi của Tiền điện tử là gì? Bài viết cung cấp một số khái niệm cơ bản về Lý thuyết trò chơi.

Lý thuyết trò chơi của Tiền điện tử là gì? Để nói về một trong những phát minh vĩ đại nhất của thế kỉ 21, chắc chắn không thể không nhắc đến sự ra đời của Bitcoin , cryptocurrency hay tiền điện tử.

Vậy thì, điều gì đã khiến cho công nghệ chuỗi khối (blockchain technology) trở thành một bước ngoặt thực sự trong cuộc sống của chúng ta? Trước tiên, hãy cùng nhau nhìn vào thế giới thực và xem cách Tiền pháp định (fiat currency) được duy trì và lưu trữ như thế nào. Bất kể bạn là ai, tiền của bạn cũng sẽ đều được lưu giữ ở một địa điểm tập trung nhất định, ví dụ: ngân hàng. Vấn đề nảy sinh với mô hình lưu trữ tiền tệ này đó là bạn thực chất chỉ đang đưa tiền của mình cho một thực thể khác, và do đó, sẽ không thể tránh khỏi việc tồn tại rủi ro rằng tiền của bạn có thể bị thay đổi vì vô vàn lý do khác nhau. Một mô hình chuỗi khối (blockchain) giải quyết được vấn đề này bằng đặc điểm phân tán và nói không với tham nhũng nội bộ của mình. Blockchain được xây dựng nên nhờ sự kết hợp giữa hai thứ: Mã hóa (Cryptography) và Lý thuyết Trò chơi (Game Theory).

Cấu trúc thị trường là cái quái gì vậy?

Trước khi đi vào tìm hiểu khái niệm chính của Lý thuyết trò chơi, chúng ta hãy cùng nhau xem qua những khái niệm cơ bản của kinh tế học vi mô. Cách sắp xếp và những đặc điểm nền tảng của bất kì loại thị trường nào, được gọi là cấu trúc thị trường. Các cấu trúc thị trường được phân biệt dựa trên nhiều yếu tố, ví dụ như số lượng người sản xuất, quyền quản lý về giá cả và mức rào cản nhập ngành. Dựa trên những yếu tố này, chúng ta có thể phân chia ra bốn kiểu cấu trúc thị trường chính:

  • Thị trường cạnh tranh hoàn hảo
  • Thị trường độc quyền
  • Thị trường cạnh tranh độc quyền
  • Thị trường độc quyền nhóm bán

Thị trường cạnh tranh hoàn hảo

Thị trường cạnh tranh hoàn hảo là một thị trường kinh doanh, nơi mà ai cũng có thể dễ dàng tham gia vào và những người kinh doanh nhỏ lẻ không nắm bất cứ quyền lực quyết định nào đối với giá cả sản phẩm. Hãy nghĩ về thị trường mua bán chuối. Thật đơn giản cho bất cứ ai có mong muốn tham gia vào loại thị trường này – tất cả những gì họ phải làm chỉ là trồng chuối. Hơn nữa, họ cũng không thể tự tiện thay đổi giá chuối của mình theo ý muốn. Nếu một bà bán một nải chuối với giá 50k, thì người mua hoàn toàn có thể dễ dàng chọn mua 1 nải chuối khác từ một người bán khác với giá rẻ hơn là 20k.

Thị trường độc quyền

Thị trường độc quyền, hiểu đơn giản, là một loại thị trường đối lập với Thị trường cạnh tranh hoàn hảo. Đây là loại thị trường nơi mà mọi thứ được thống trị và nắm giữ bởi duy nhất một tập đoàn, do đó, mức rào cản nhập ngành trong loại thị trường này là cực kì cao, gần như không ai có thể xâm nhập được. Quá dễ hiểu, đố bạn nào mua được điện mà không phải của EVN đấy.

Thị trường cạnh tranh độc quyền

Đây là loại thị trường nơi có rất nhiều người bán và mức rào cản nhập ngành cực kì thấp. Những sản phẩm trong kiểu thị trường này hầu hết đều giống nhau nhưng không quá đồng nhất. Hãy nghĩ về các cửa hàng pizza như một ví dụ. Ở thời điểm hiện tại, cả 2 thương hiệu Dominoes và Pizza Hut đều đang sản xuất cùng một mặt hàng như nhau với chỉ những điểm khác biệt rất nhỏ. Hiển nhiên rằng một bên có thể tăng giá của mình lên một chút dựa trên nhiều lý do như sự yêu thích đến từ khách hàng. Tuy nhiên, nếu Dominoes tăng giá lên quá cao, thì khách hàng của họ đơn giản sẽ chuyển sang dùng của Pizza Hut. Tương tự, nếu đồng thời giá của cả Dominoes và Pizza Hut cùng tăng cao, thì do mức rào cản nhập ngành thấp của loại thị trường này, một hãng pizza khác sẽ dễ dàng bước chân vào cuộc chơi và thu hút mọi khách hàng.

Thị trường độc quyền nhóm bán

Thị trường độc quyền nhóm bán là dạng thị trường bị chi phối, nắm giữ bởi chỉ một vài thị trường nhất định và có mức rào cản nhập ngành cao. Một ví dụ điển hình nhất của loại thị trường độc quyền nhóm bán này chính là thị trường kinh doanh điện thoại thông minh (smartphone market). Thị trường điện thoại thông minh hiện nay đang bị chi phối bởi một số nhỏ nhóm các công ty như Samsung, Apple, và Huawei. Cũng giống như thị trường cạnh tranh độc quyền, sản phẩm của các công ty này nhìn chung là gần như nhau nhưng không thực sự đồng nhất. Trong khi loại thị trường này có thể cho các công ty một chút quyền kiểm soát về mặt giá cả, họ lại thường không có nhiều khả năng để xoay sở. Ví dụ, nếu như ngày mai hãng Apple quyết định tăng giá chiếc Iphone của mình lên 4000 đô la, thì trừ những người hâm mộ số 1 của Apple, hầu hết người sử dụng sẽ có xu hướng chuyển sang dùng một chiếc điện thoại Android. Dĩ nhiên, các công ty luôn luôn có thể ngồi lại và cùng nhau quyết định để tăng giá sản phẩm sao cho hợp lí vì lợi ích chung, tuy nhiên điều này được gọi là “cấu kết” và ở một vài quốc gia có thể bị coi là phạm pháp, trong đó bao gồm Mĩ.

Như vậy, khi các công ty không thể cạnh tranh bằng việc thay đổi giá bán, làm thế nào để họ vượt qua các đối thủ khác? Câu trả lời ở đây là “cạnh tranh phi giá cả”, tức là cạnh tranh không thông qua việc thay đổi giá kinh doanh. Họ làm điều đó bằng cách nào? Thay vì điều chỉnh giá bán, họ thay đổi bao bì, thiết kế và phong cách của sản phẩm, đồng thời đem đến cho người sử dụng những trải nghiệm độc nhất chỉ mình có. Tuy nhiên, hình thức phổ biến và dễ nhận ra nhất của loại cạnh tranh phi giá cả này đó chính là quảng cáo.

Quảng cáo là một trong những cách hữu hiệu nhất để các công ty thể hiện chất lượng độc nhất của các sản phẩm mình làm ra, đồng thời cũng là một cách giới thiệu sản phẩm mới. Song bằng cách này cũng không thể giúp các công ty tránh được những vấn đề mới phát sinh. Liệu rằng có bao nhiêu quảng cáo mà bạn xem thực sự ở lại trong trí nhớ của bạn? Trong một bối cảnh nơi mà bạn bị bao vây bởi vô vàn quảng cáo mỗi ngày, câu hỏi đặt ra là bạn sẽ nhớ được bao nhiêu trong số đó? Nếu như bạn là một người kinh doanh trong thị trường độc quyền nhóm bán và bạn chỉ liên tục đầu tư vào việc quảng cáo một cách không suy nghĩ, khả năng là bạn chỉ đang tự tiêu tốn một khoản tiền không hề nhỏ của mình.

Như vậy, một hệ quả tất yếu là để bù lại số tiền đã bỏ ra đó, bạn sẽ lại phải luôn luôn tăng giá sản phẩm của mình. Nhưng nếu viễn cảnh đó xảy ra, khách hàng của bạn lại có thể dễ dàng chọn mua hàng từ các bên đối thủ thay vì mua của bạn. Vậy, bạn sẽ giải quyết như thế nào trong trường hợp này? Làm thê nào để quảng cáo sản phẩm mà không làm giảm đi số lượng khách hàng của mình? Câu trả lời là bạn sẽ phải quyết định dựa trên hành động mà các bên đối thủ của bạn có thể làm. Để hiện thực hóa điều đó, chúng ta sẽ sử dụng một thứ gọi là Lý thuyết Trò chơi (Game Theory).

Thế nào là Lý thuyết Trò chơi?

Lý thuyết Trò chơi là ngành nghiên cứu về cách đưa ra các quyết định chiến lược. Đây là phương pháp mà các công ty thường sử dụng để đưa ra các quyết định của mình, đồng thời với việc cân nhắc cả các quyết định mà những bên đối thủ của mình có thể làm. Lý thuyết Trò chơi được tìm ra lần đầu tiên bởi John Van Neumann và Osker Morgenstern vào năm 1944. Nó đã được coi là một trong những bước ngoặt lớn trong việc nghiên cứu về thị trường độc quyền nhóm bán. Từ đó, Lý thuyết trò chơi đã được nhiều công ty lựa chọn áp dụng và trở nên phổ biến rộng rãi trong nhiều công nghệ và ngành nghề khác nhau.

Mô hình Lý thuyết Trò chơi bao gồm ít nhất 3 yếu tố:

  • Người chơi: là những người đưa ra quyết định. Ví dụ: những nhà quản trị công ty
  • Chiến lược: Những quyết định mà người chơi muốn thực hiện để phát triển công ty.
  • Phần thưởng: Kết quả cuối cùng của chiến lược đó.

Trong Lý thuyết Trò chơi, có 2 loại trò chơi được áp dụng:

  • Trò chơi có tổng bằng 0 (Zero sum game): Là loại trò chơi mà người chơi này nhận phần thưởng từ sự mất mát của người chơi khác.
  • Trò chơi có tổng không bằng 0 (Non zero sum game): Là loại trò chơi mà người chơi này nhận phần thưởng không đến từ sự mất mát của người chơi khác.

Vậy làm thế nào để một công ty có thể áp dụng được lý thuyết trò chơi? Hãy cùng nhau quay lại những gì mà trước đó chúng ta đã thảo luận, liệu một công ty có hay không nên chỉ quảng cáo về một khía cạnh nhất định cho sản phẩm của mình? Giả sử rằng chúng ta có 2 công ty: A và B.

Công ty BCông ty B
Quảng cáoKhông quảng cáo
Công ty AQuảng cáo( 4 , 3 )( 5 , 1 )
Công ty AKhông quảng cáo( 2 , 5 )( 3 , 2 )

Bảng dữ liệu mà bạn thấy ở trên được gọi là “Ma trận thưởng phạt”.  Chúng được đọc như sau:

  • Nếu Công ty A và B cùng quyết định quảng cáo, thì tỉ lệ thành công mà mỗi Công ty đạt được lần lượt sẽ là 4 và 3.
  • Nếu Công ty A không quảng cáo và Công ty B quảng cáo, khi đó tỉ lệ thành công mỗi Công ty đạt được lần lượt là 2 và 5
  • Nếu Công ty A quảng cáo và Công ty B không quảng cáo, tỉ lệ lúc này là 5 và 1.
  • Nếu cả 2 công ty cùng không quảng cáo, tỉ lệ lúc này là 3 và 2

Vậy, công ty A và B nên đưa ra quyết định như thế nào để có lợi nhất cho cả 2 bên? Để trả lời câu hỏi này, chúng ta cần nhìn vào từng trường hợp đem lại nhiều lợi ích nhất cho cả Công ty A và B.

Đầu tiên, hãy nhìn vào Công ty B.

  • Trường hợp 1: Nếu Công ty A quảng cáo
    Khi đó, Công ty B sẽ nhận được tỉ lệ thành công là 3 nếu họ quảng cáo và 1 nếu họ không quảng cáo. Như vậy, dĩ nhiên trong trường hợp này công ty B sẽ chọn quảng cáo bởi nó đem lại lợi nhuận cao hơn.
  • Trường hợp 2: Nếu Công ty A không quảng cáo
    Khi đó, Công ty B sẽ nhận được tỉ lệ thành công là 5 nếu họ quảng cáo và 2 nếu họ không quảng cáo. Như vậy, một lần nữa, nếu quyết định quảng cáo thì lợi nhuận mà Công ty B nhận được sẽ nhiều hơn.
  • Kết luận: Không kể đến quyết định của Công ty A, Công ty B nên quảng cáo.

Bây giờ, hãy cùng nhìn vào Công ty A

  • Trường hợp 1: Nếu Công ty B quảng cáo
    Khi đó, Công ty A sẽ nhận được tỉ lệ thành công là 4 nếu họ quảng cáo và 2 nếu họ không quảng cáo. Như vậy, dĩ nhiên trong trường hợp này công ty A sẽ chọn quảng cáo bởi nó đem lại lợi nhuận cao hơn.
  • Trường hợp 2: Nếu Công ty B không quảng cáo
    Khi đó, Công ty A sẽ nhận được tỉ lệ thành công là 5 nếu họ quảng cáo và 3 nếu họ không quảng cáo. Như vậy, một lần nữa, nếu quyết định quảng cáo thì lợi nhuận mà Công ty A nhận được sẽ nhiều hơn.
  • Kết luận: Không kể đến quyết định của Công ty B, Công ty A cũng nên quảng cáo.

Như vậy, trong ví dụ này, quyết định có lợi nhất cho cả Công ty A và Công ty B đều là quảng cáo, điều đó có nghĩa là:

Đối với cả 2 công ty, quảng cáo được coi là chiến lược áp đảo của họ. Một chiến lược áp đảo chính là giải pháp tối ưu nhất dành cho một người chơi, bất kể đổi thủ của họ có làm gì đi chăng nữa. Như ở trong ví dụ này, điểm có tỉ lệ (4,3) được gọi là Điểm cân bằng Nash.

Thế nào là Điểm cân bằng Nash?

Điểm cân bằng Nash là một giải pháp cho một trò chơi, đó là nơi mà mỗi người chơi đều lựa chọn được chiến lược tối ưu nhất của mình trong số những chiến lược được phe đối thủ lựa chọn và trong trường hợp đó, họ không có cách nào khác ngoài chủ động thay đổi chiến lược của mình. Khái niệm này được đưa ra  bởi John F Nash – nhà toán học được thủ vai bởi Russell Crowe trong bộ phim “A Beautiful Mind”. Phát hiện này có ý nghĩa to lớn trong một hệ thống máy tính phân tán như blockchain. Trên thực tế, blockchain là hệ thống hoàn toàn “không ăn gian” (cheat-free) bởi toàn bộ cách thức của nó nằm trong một Điểm cân bằng Nash. Chúng ta sẽ tiếp tục tìm hiểu về khái niệm này trong những phần sau, và bây giờ hãy cùng nhau xem Điểm cân bằng Nash trong thực tế được áp dụng vào một trong những lý thuyết trò chơi nổi tiếng nhất như thế nào nhé!

Song đề tù nhân

Nếu như bạn đã từng có cơ hội tìm hiểu về Lý thuyết trò chơi, khả năng cao là bạn sẽ biết đến tình huống tiến thoái lưỡng nan kinh điển này – một trong những ví dụ điển hình nhất minh họa cho Điểm cân bằng Nash. Giả sử Rob và Ben là 2 tội phạm bị bắt trong khi ăn trộm ở một quán rượu. Qua việc điều tra, cảnh sát biết được rằng cả 2 người họ đã từng có tiền án phạm tội nặng nề hơn việc ăn trộm, ví dụ như cướp ngân hàng. Trong lúc tra hỏi, cảnh sát đã đặt ra cho cả 2 người một lời đề nghị như thế này:

  • Lựa chọn 1: Nếu cả 2 quyết định giữ im lặng và không tố cáo người còn lại, thì mỗi người sẽ phải chịu án 4 năm tù.
  • Lựa chọn 2: Nếu 1 trong 2 người tố cáo người còn lại, thì người tố cáo sẽ được thả về và người kia phải chịu án 7 năm tù.
  • Lựa chọn 3: Nếu cả 2 cùng quyết định thú tội, thì mỗi người sẽ phải chịu án 2 năm tù.

Và nếu như đặt tình huống trên vào một “Ma trận thưởng phạt”, thì đây là những gì chúng ta có:

Rob không thú nhậnRob thú nhận
Ben không thú nhận( 2 , 2 )( 7 , 0 )
Ben thú nhận( 0 , 7 )( 4 , 4 )

Những con số màu đỏ tượng trưng cho tỉ lệ thành công mà Ben nhận được, và những con số màu xanh là của Rob.

Bây giờ, hãy cùng nhau phân tích ma trận này.

Hiển nhiên rằng cả Rob và Ben đều là những tên tội phạm máu mặt và sẽ không dễ dàng tố cáo lẫn nhau, bởi kể cả “kẻ trộm cũng có danh dự”. Tuy nhiên, những nhà tâm lý học hành vi và lý thuyết trò chơi lại vẽ ra cho chúng ta một viễn cảnh khác, trái ngược với bức tranh màu hồng mà mọi người thường nhắc đến.

Nếu như cả 2 cùng thú tội, thì theo ma trận thưởng phạt, kết quả thu được sẽ là (4,4). Tức là khi đó mỗi người sẽ phải chịu 4 năm tù giam. Tuy nhiên, đây là một trường hợp không mấy chắc chắn, bởi cả 2 đều biết là họ có những sự lựa chọn khác tốt hơn 4 năm tù. Nếu họ chọn tố cáo người còn lại, họ sẽ không phải chịu ngồi tù. Do vậy, đây là một trường hợp ít khi xảy ra.

Đó là lý do tại sao, đối lập với những gì văn hóa đại chúng thường nói, trong một tình huống như thế này, Điểm cân bằng Nash xảy ra khi cả 2 người tù nhân cùng lựa chọn tố cáo người còn lại. Đó chính là cách mà cả Rob và Ben đi đến quyết định tối ưu nhất cho bản thân mình, cân nhắc về chiến thuật của người kia.

Nhưng điều này lại đem đến cho chúng ta một vấn đề nan giải khác.

Câu hỏi đặt ra là, nếu như tồn tại một trường hợp, khi mà giải pháp tối ưu nhất cho cả 2 người chơi lại nằm trong tình huống có thể gây hại cho xã hội thì sao? Hãy nghĩ về việc giả sử như Rob và Ben đang lên kế hoạch cho một vụ cướp ngân hàng. Dưới đây là ma trận của tỉ lệ thành công mà cả 2 đạt được trong những tình huống khác nhau:

Rob không tham giaRob tham gia
Ben không tham gia( 3 , 3 )( 0 , 6 )
Ben tham gia( 6 , 0 )( 7 , 7 )

Như bạn có thể thấy, trong tình huống giả định này, lựa chọn tốt và tối ưu nhất cho cả Rob và Ben là quyết định cướp ngân hàng. Song, mặc cho việc này có thể đem đến lợi ích tốt nhất cho cả 2 người, đó lại không phải là môt lựa chọn tốt cho xã hội.

Đây chính là điểm mấu chốt nơi khái niệm “Sự trừng phạt” ra đời.

Thế nào là sự trừng phạt?

Thế giới mà chúng ta đang sống không phải lúc nào cũng là một nơi tốt đẹp và công bằng. Mặc dù là nam giới, nhưng mình cũng nghĩ rằng phần lớn đàn ông sẽ trở nên đồi bại nếu không được quản lý chặt chẽ. Và trong thực tế, mỗi người nhìn chung đều có rất nhiều cơ hội khiến họ trở nên hư hỏng, bỏ ngoài tai những suy xét cho số đông và xã hội. Vậy nên, thứ chúng ta vẫn đang làm để giữ cho thế giới được kiểm soát đúng cách, đó là thi hành công cụ của sự trừng phạt.

Vậy, giả sử như với ví dụ ở trên, chúng ta có một phương thức trừng phạt được áp dụng như sau:

“Đối với mỗi -0.5 lợi ích bị lấy đi từ xã hội, hình phạt đối với người phạm tội sẽ là -7”.

Nói theo cách khác, bất cứ hành động nào được coi là “xấu” đối với xã hội sẽ đều phải trả giá bằng việc lợi ích của bản thân bị giảm đi 7, đổi lại cho -0,5 lợi ích xã hội bị đánh mất. Giờ, bạn có thể đặt ra câu hỏi rằng tại sao xã hội lại phải làm những điều như thế? Trong khi có rất nhiều những lợi ích mà một xã hội đang  bị mất đi, ví dụ như tiền bạc, thời gian,… và trong khi đó thì những người phạm tội cũng đang phải chịu những sự trừng phạt nặng nề rồi.

Nhưng, sự thật của vấn đề này là chúng ta, với tư cách của một xã hội, luôn luôn bao gồm những điều trên vào cuộc sống hàng ngày của mình. Việc cho thêm những nhân tố trừng phạt vào cuộc chơi sẽ giúp giảm thiểu hậu quả từ những hành động “xấu” và thay đổi ma trận thưởng phạt như thế này:

Rob không tham giaRob tham gia
Ben không tham gia( 3 , 3 )( 0 , -1 )
Ben tham gia( -1 , 0 )( 0 , 0 )

Bạn có thấy được cách mà nhân tố 7 điểm trừng phạt làm giảm đi hậu quả từ những hành động “xấu” như thế nào không?

Như có thể thấy được từ ma trận trên, bằng cách đưa thêm nhân tố trừng phạt, Điểm cân bằng Nash thay đổi từ khả năng có thể gây hại lớn đến xã hội, tới chỗ không để lại bất cứ hậu quả xấu nào. Như vậy nó thay đổi từ việc Ben và Rob thực hiện vụ cướp ngân hàng, đến chỗ Ben và Rob thực hiện vụ cướp ngân hàng và phải đối mặt với hậu quả của việc bị trừng phạt bởi hành động đó.

Vậy, quay lại với câu hỏi, điều gì thúc đẩy một xã hội để đưa ra những luật lệ trừng phạt? Tại sao họ lại muốn lãng phí những tiện ích đang có của mình? Người ta trả lời câu hỏi này bằng cách đưa ra hình phạt bắt buộc. Hoặc, nói theo một cách khác, nếu ai đó trong một xã hội không tuân thủ theo những quy tắc trừng phạt, thì bản thân họ, vô hình chung, sẽ trở thành một kẻ tội phạm và bị buộc phải chịu những sự trừng phạt khác.

Làm thế nào mà những điều này áp dụng được trong một xã hội văn minh? Hãy nghĩ đến một lực lượng cảnh sát được trả lương bởi tiền thuế lấy từ người dân. Trong trường hợp này, chúng ta có một lực lượng chuyên dụng để thực thi các hình phạt và cách mà xã hội tham gia vào nó là trả các khoản thuế. Nếu bạn là một công dân và bạn không đóng thuế, đồng nghĩa với việc bạn sẽ phải chịu hình phạt.

Một ví dụ thú vị nữa về việc “trừng phạt những gì không thể bị trừng phạt” đó là hình thức khai trừ xã hội, hay còn gọi là tẩy chay. Hãy nghĩ về xã hội nơi một người, giả sử anh ta tên là Max, phạm một tội nào đó. Ngay lập tức anh ta trở thành kẻ bị ruồng bỏ của xã hội đó. Đây là tình huống nơi tất cả mọi người trong một xã hội cùng nhau tham gia vào hành động trừng phạt. Và giả sử như có một ai đó có mối quan hệ với Max, thì người đó, bằng sự liên quan, cũng sẽ nghiễm nhiên bị coi là “người xấu” và phải chịu sự tẩy chay của cả cộng đồng.

Tuy vậy, cũng không phải khôn ngoan khi nói rằng, chính khái niệm này là lý do tại sao tất cả chúng ta đến thời điểm này vẫn còn sống.

Khái niệm về Điểm cân bằng Nash và Sự trừng phạt, thực chất, có ý nghĩa quan trọng đối với blockchain và đóng vai trò đảm bảo những thợ mỏ Bitcoin (miners) thực hiện đúng công việc của mình. Chúng ta sẽ cùng nhau tìm hiểu điều này trong một lúc nữa. Nhưng trước khi làm việc đó, hãy cố gắng cùng nhau xem qua một vài cơ chế lý thuyết trò chơi cơ bản, đừng vội vì khi bạn có đủ kiến thức, bạn sẽ hiểu tại sao Bitcoin lại cuốn hút đến như vậy.

Điểm hội tụ (The Schelling (Focal) Point):

Nhà kinh tế học lỗi lạc Thomas Schelling đã tiến hành một thử nghiệm trên một nhóm học sinh và hỏi họ một câu hỏi đơn giản: “Nếu ngày mai bạn sẽ phải đi đi gặp mặt một người lạ tại Thành phố New York. Bạn sẽ hẹn gặp họ ở đâu và khi nào?”. Kết quả của cuộc thử nghiệm này là hầu hết các học sinh đều có chung một câu trả lời, “vào buổi chiều và ở Nhà ga Grand Central”. Điều này xảy ra bởi Nhà ga Grand Central là một điểm trung tâm đối với người dân thành phố New York. Điểm trung tâm hay còn được biết đến với cái tên “Điểm hội tụ”.

Như vậy, định nghĩa Điểm hội tụ có thể hiểu đơn giản là câu trả lời chung mà mọi người có xu hướng cùng sử dụng, ngay cả khi họ không cần giao tiếp, vì họ cảm thấy thứ đó đặc biệt, có sự kết nối hoặc quen thuộc đối với mình.

Hãy cùng nhau mô tả khái niệm này bằng một trò chơi. Giả sử, chúng ta có 2 người tù nhân được giam giữ ở 2 căn phòng khác nhau và họ được đưa cho một chuỗi các con số bất kì. Họ được yêu cầu phải chọn một con số mà mình đoán là người tù nhân còn lại sẽ chọn, dĩ nhiên là không hề có sự giao tiếp nào giữa cả hai. Nếu như họ đoán sai thì họ sẽ bị xử chết (như một cách đặt cược).

Những con số mà họ được đưa cho là:

  • 7816239, 676716313, 100000000 và 871823719.

Bạn nghĩ 2 người tù nhân sẽ chọn con số nào? – 100000000.

Tại sao? Vì đó là con số duy nhất khác biệt và nổi bật so với những số còn lại – đặc điểm khiến cho nó trở thành một Điểm hội tụ. Trong suốt chiều dài lịch sử của mình, con người đã vô tình gặp gỡ ở những nơi như quán bar, nhà thờ, các trung tâm văn hóa, v.v.. bởi đối với một cộng đồng, những nơi đó chính là các Điểm hội tụ quen thuộc nhất ( The Focal Point ).

Mình đoán là bạn đã thua.

Một ví dụ nữa cũng vô cùng nổi tiếng về Điểm hội tụ trong đời sống đó là  1 trò chơi, mà mình hy vọng rằng bạn chưa từng chơi trong cuộc đời của mình, gọi là “Trò chơi con gà” (Chicken game). Đây là cách mà trò chơi này hoạt động. Có 2 người cùng nhau lái xe ngược chiều. Nếu họ xảy ra va chạm đụng đầu nhau, họ cùng chết. Tuy nhiên, người đầu tiên bẻ lái và tránh được chiếc xe của người kia sắp lao tới được gọi là một “con gà”.

Trong trò chơi này, sẽ có 2 trường hợp có thể xảy ra và dẫn đến vụ tai nạn:

  • Trường hợp 1: Cả 2 người cùng đâm trực diện vào nhau.
  • Trường hợp 2: Một người rẽ trái và người còn lại rẽ phải.

Thomas Schelling đưa ra lời giải cho trò chơi này, sử dụng lý thuyết của Điểm hội tụ. Ông cho rằng, giải pháp tốt nhất là cả hai người lái xe không được nhìn vào mắt của người đối diện (đó là, cắt đứt việc giao tiếp với người lái còn lại) mà phải tập trung vào bản năng của chính mình. Hãy nhớ lại xem lần cuối khi bạn lái chiếc xe máy của mình và chuẩn bị va chạm giao thông với ai đó, bạn sẽ lựa chọn quẹo về bên nào? Khả năng phần lớn là bên phải vì đó là phần đường đáng nhé bạn phải đi ( với oto thì có lẽ sẽ khác hơn 1 chút). Nhưng đó chính là lời giải, vì khi bạn lựa chọn đúng Điểm hội tụ ( và đối phương cũng vậy) tức là cả 2 sẽ đều làm theo bản năng là quẹo cùng 1 bên – nhưng vì 2 người đi ngược chiều nên sẽ không xảy ra va chạm.

Điểm cân bằng kích hoạt Grim 

Để hiểu được lý thuyết của Điểm cân bằng kích hoạt Grim (Grim Trigger) hoạt động như thế nào, chúng ta cần nhìn vào một tình huống cụ thể. Chúng ta hãy tưởng tượng một xã hội nơi chế độ quân chủ vẫn còn tồn tại và người ta tin rằng vị vua được quyền cai trị cao hơn những người khác vì một quyền thiêng liêng được trao từ tay các vị thần. Tuy nhiên, trong một xã hội như vậy, nếu nhà vua bị giết, thì sau đó sự thiêng liêng này cũng tuyệt nhiên biến mất bởi mọi người sẽ hiểu rằng rằng nhà vua không phải là một đấng thiêng liêng. Điều mà viễn cảnh này sẽ làm là nó sẽ mở ra cuộc chiến đẫm máu không hồi kết!

Giờ đây, mọi người dân đều thấy rằng nhà vua không phải là một đấng bất tử, điều đó sẽ dẫn đến một vòng tròn những cuộc cách mạnh đẫm máu không hồi kết, nơi không một ai có thể ngăn được những vị vua tiếp theo khỏi việc bị ám sát. Cách duy nhất để ngăn chặn vòng tròn tội lỗi này, đó là KHÔNG giết vị vua ngay từ ban đầu và duy trì khái niệm “quyền thiêng liêng” của nhà vua. Đây được gọi là Điểm cân bằng kích hoạt Grim. Hãy nghĩ về nó như là một trạng thái mà trong đó, nếu bạn đi lệch hướng thậm chí chỉ một chút, bạn cũng sẽ có thể gây ra một chu kỳ vô tận của sự trừng phạt đệ quy.

Vấn đề phối hợp

Hãy xem xét ma trận sau đây:

AB
A( 2 , 2 )( 0 , 0 )
B( 0 , 0 )( 4 , 4 )

Bây giờ, khi nhìn vào ma trận này, bạn sẽ thấy có 2 điểm cân bằng Nash: (A,A) và (B,B), sự chênh lệch từ cả 2 trạng thái đều không mang lại lợi ích cho chúng. Ý tưởng của trò chơi này, là làm thế nào để bạn thuyết phục người chơi đi từ (A,A) sang (B,B)? Nếu như chỉ có một nhóm nhỏ người chơi thì giải pháp xem chừng là khá dễ dàng, bạn có thể phối hợp họ qua điện thoại hoặc emails. Nhưng, viễn cảnh này sẽ thay đổi khi chúng ta nói về một nhóm người chơi lớn và đông đảo hơn rất nhiều.

Sự khác biệt căn bản giữa câu chuyện tình huống khó xử của người tù nhân với vấn đề phối hợp, đó là trong tình huống của người tù nhân, cả hai người chơi đều phải chọn điểm (B,B) vì đó là sự lựa chọn đem lại nhiều lợi ích hơn, mặc cho điểm (A,A) mới là sự lựa chọn tốt hơn về mặt đạo đức. Trong vấn đề phối hợp, câu chuyện dường như không phải là về tính đạo đức của việc nhận được lợi ích, đó là về động lực khuyến khích người chơi đi từ quyết định này sang một quyết định khác. Vậy, điều gì khiến cho một nhóm người đông đảo thay đổi cách mà họ làm mọi thứ?

Một trò chơi phối hợp được coi là thất bại khi chỉ có một nhóm nhỏ trong tập thể thay đổi quyết định của mình trong khi phần lớn thì không, và ngược lại, được coi là thành công khi đa số của nhóm lớn quyết định thay đổi. Hãy cùng xem xét điều đó qua ví dụ dưới đây.

Giả sử như chúng ta muốn thay đổi Tiếng Việt đang sử dụng sang một loại Tiếng Việt cải tiến mới, ví dụ:

  • Câu ban đầu: “Cho tôi xin số điện thoại của bạn được không?”
  • Câu mới: “Co tôi sin zố diện woại kủa pạn dượk xôq?”

Nếu như chỉ có một mình bạn sử dụng thứ Tiếng Việt  mới này, kết quả là nó sẽ trở thành một thảm họa bởi đa số những người còn lại không thể hiểu được bạn đang muốn nói cái gì, từ đó bạn sẽ bị loại bỏ ra khỏi những cuộc trò chuyện (vì bạn bị ghét hoặ trở thành trò đùa của mọi người well…) , đồng nghĩa với việc lợi ích mà bạn nhận được là vô cùng thấp, dẫn đến việc bạn sẽ không còn động lực để cố sử dụng loại Tiếng Việt mới nữa.

Tuy nhiên, nếu như phần lớn những người trong xã hội chuyển sang dùng loại Tiếng việt cải tiến này và chỉ dùng nó mà thôi, khi đó bạn sẽ phải tự thay đổi ngôn ngữ của mình nếu như bạn muốn được hoà nhập. Lúc này, động lực thay đổi của bạn được tăng lên rất cao.

Bạn nghĩ lý do tại sao bây giờ gần như không còn một ai sử dụng Tiếng Anh ye olde nữa? Bởi nếu như bạn nói như vậy trong một xã hội, bạn sẽ bị xa lánh và tất cả mọi người sẽ nghĩ rằng “thou art a knave sirrah!”

Khái niệm về Duy lý hạn chế (Bounded Rationality)

Hãy tưởng tượng tình huống như sau, Sarah đi đến tiệm tạp hóa mỗi ngày để mua một quả táo. Cô ấy làm việc này đều đặn mỗi ngày như một nghi thức. Tuy nhiên, mỗi ngày cô đều phải đối mặt với một tình huống đó là mỗi khi ở trong tiệm tạp hóa, người bán hàng sẽ đều rời đi trong khoảng 5 phút và cửa hàng không hề có camera an ninh. Sarah có thể dễ dàng trộm một quả táo mà không ai có thể biết được. Mặc dù thế, cô chưa bao giờ ăn trộm.

Điều Sarah làm trong tình huống trên được gọi là “Duy lý hạn chế”. Duy lý hạn chế được hiểu đơn giản là khi đưa ra bất cứ sự lựa chọn nào, con người sẽ luôn có xu hướng đi theo những con đường đơn giản và quen thuộc đối với mình. Dù cho con đường này có thể không phải là thứ phù hợp nhất đối với họ và không đem lại cho họ lợi ích cao nhất, họ vẫn sẽ luôn lựa chọn đi theo con đường đơn giản nhất. Lý do mà Sarah chọn con đường đạo đức chỉ đơn giản là do cô đi theo thói quen hàng ngày của mình thay vì ăn trộm và bỏ trốn với không hậu quả nào để lại – như những gì ở tình huống thứ hai mà chúng ta đã chỉ ra, nhìn chung thì nó phức tạp hơn thói quen hàng ngày đơn giản của Sarah.


Đến thời điểm hiện tại, chúng ta đã cùng nhau đi qua một vài khái niệm cơ bản và 1 số mô hình lý thuyết trò chơi. Hãy cùng chờ đón xem sự liên quan của chúng trong hệ thống tiền ảo (cryptocurrency) và cách chúng phối hợp với nhau để giữ cho hệ thống hoạt động một cách trơn tru ở bài viết sau nhé!

Nếu bạn chỉ đơn giản không quan tâm đến Tiền điện tử, cryptocurrency và blockchain, nhưng cảm thấy chủ đề này thật hấp dẫn, vậy hãy dành thử thời gian chơi thêm 1 game ngắn sau đấy nhé: https://nghiatt90.github.io/trust-vn/

Default image
jūlian.eth
Articles: 24
https://www.pixelhere.com/et/event.php?advertiser=212168&cid=INSERT_CLICK_ID&id=645772&udid=UDID&variable=INSERT_USER_ID_OR_EMAIL_HERE&value=INSERT_PRICE_VALUE&tid=UNIQUE_TRANSACTION_ID

Physical Address

304 North Cardinal St.
Dorchester Center, MA 02124