health is wealth
2020: Sự trỗi dậy của máy móc
của James Grosjean Hãy đếm tôi trong số những máy bay không người lái Netflix yêu thích The Queen's Gambit (2020), nhưng tôi luôn là một người đam mê cờ vua. Trong những năm học đại học, có lẽ tôi đã ăn một nghìn chiếc bánh sừng bò sô cô la trong khi xem Murray […]

của James Grosjean Hãy đếm tôi trong số những máy bay không người lái Netflix yêu thích The Queen's Gambit (2020), nhưng tôi luôn là một người đam mê cờ vua. Trong những năm học đại học, có lẽ tôi đã ăn một nghìn chiếc bánh sừng bò sô cô la trong khi xem Murray Turnbull (hay còn gọi là “Bậc thầy cờ vua”) kỳ quặc, lộng lẫy đánh bại tất cả những kẻ đến ở quảng trường thành phố - “$ 2, hoàn lại tiền nếu bạn thắng hoặc hòa”. Đó là vinh dự của tôi khi chụp được một bức ảnh của Karpov vĩ đại được đóng khung bởi kính màu của Đài tưởng niệm khi ông thực hiện một cuộc mô phỏng 40 ván trong khuôn viên trường. Tôi là một phần của báo chí sinh viên khi Kasparov đưa ra tuyên bố gây tranh cãi khi đó của anh ấy rằng một máy tính sẽ là nhà vô địch vĩ đại trước khi phụ nữ. Để dành cuộc tranh luận về sự sai lầm có thể xảy ra của Kasparov cho một diễn đàn khác và một ngày khác, tôi coi tuyên bố của anh ấy chỉ đơn thuần là một phép chiếu dựa trên quan sát thực nghiệm của cộng đồng cờ vua. Sự tham gia của phụ nữ luôn ở mức thấp và không tăng lên một cách có ý nghĩa, trong khi máy tính đã mạnh và ngày càng mạnh hơn. Máy móc sẽ mở ra một sự bình đẳng mới - nơi mọi giới tính đều bị nghiền nát như kiến. Định lý Zermelo cho chúng ta biết rằng một trò chơi có đầy đủ thông tin (cả hai người chơi đều có thể nhìn thấy tất cả các quân trên bàn cờ), tức là hữu hạn (trò chơi SẼ kết thúc sau một số nước đi), có một giải pháp và nếu cả hai bên đều chơi điều này giải pháp tối ưu, thì trò chơi nào cũng có kết quả như nhau. Cờ vua phức tạp đến mức chúng tôi không chắc kết quả sẽ như thế nào, nhưng chúng tôi nghĩ rằng Trắng sẽ thắng mọi lúc mọi nơi, trong trường hợp đó không có phản ứng nào của Đen có thể thay đổi kết quả. Trò chơi Connect Four cũng thuộc Định lý Zermelo, và phân tích đã xác định rằng trong trò chơi đó, cô gái lén lút luôn thắng nếu cô ấy đi trước và chơi một cách tối ưu. Nếu bạn là một AP thích QGambit và đang đói với nhiều nội dung hơn trong trận đại dịch không bao giờ kết thúc này, thì nhiệm vụ tiếp theo của bạn là xem AlphaGo, một bộ phim tài liệu về sự trỗi dậy của máy tính trong trò chơi cờ vây cổ đại, phức tạp hơn cờ vua. Không đùa đâu, bộ phim này là một thứ giật gân đối với những người quan tâm đến lĩnh vực này và đánh giá cao bộ phim tình cảm mãnh liệt dành cho nhà vô địch của nhân loại, Lee Sedol - bộ phim hay nhất từng làm. Bộ phim ghi lại nỗi đau khổ, lòng dũng cảm, sự sáng chói, sau đó là sự khiêm tốn của Sedol, khi anh nhận ra rằng trận đấu với cỗ máy này không chỉ là một trò chơi, mà là sự xuất hiện của một trật tự thế giới mới. Không phải là một lập trình viên, Sedol không đánh giá cao những gì anh ta sẽ đối đầu, nhưng với tư cách là một chuyên gia trong nghề của mình, trên bàn cờ, anh ta có thể cảm nhận được sức nặng không ngừng, không thể xuyên thủng của đối thủ. Sau khi bạn thưởng thức AlphaGo, tôi khuyên bạn (thực ra, Google khuyên bạn nên xem một số trận đấu poker giữa Dan Negreanu thời học đường cũ và người nhái máy tính hiện đại Doug Polk. Người chơi giỏi nhất trên trái đất là cỗ máy, vì vậy một con người thông minh như Polk sẽ mô phỏng chiến lược của cỗ máy. Thích nghi hoặc chết. Tôi đã từng có một cuộc trao đổi ngắn với Howard Lederer. Tôi hỏi anh ấy về các chương trình trên các trang web poker. Anh ấy bác bỏ vấn đề bằng cách nói: “Poker không giống như cờ vua. Poker là một trò chơi không đầy đủ thông tin. Máy tính không tốt ở điều đó. " Tôi không thể biết liệu anh ta là một kẻ ngốc ngây thơ hay một kẻ lừa đảo cho Full Tilt Poker. Dù thế nào, tôi cũng không muốn tiếp tục cuộc trò chuyện đó 15 năm trước. Nhưng bây giờ chúng ta đang ở đây, vào năm 2021, và đã đến lúc tiếp tục cuộc trò chuyện đó, bằng cách bác bỏ lỗi ngụy biện đầu tiên về máy tính GTO (tối ưu về lý thuyết trò chơi), và tất cả những ngụy biện chồng chéo khác mà khủng long poker và những người hiểu biết về poker tự xưng là tuyệt vọng bám vào: Sai lầm # 1: Máy tính không giỏi trong trò chơi cung cấp thông tin không đầy đủ. Đây chỉ là sự thiếu hiểu biết. Đúng là Định lý Zermelo không áp dụng cho các trò chơi như poker. Đối với poker, có những định lý KHÁC về cơ bản nói rằng có một giải pháp cho trò chơi và một giải pháp máy tính nói chung sẽ liên quan đến "chiến lược hỗn hợp" có nghĩa là có một số thành phần ngẫu nhiên cho chiến lược (chẳng hạn như gọi Kéo với xác suất 1/3 ). Máy tính khá tốt, tốt hơn con người, trong việc tính toán kỳ vọng so với các kết quả xác suất, đặc biệt khi phân bố xác suất được biết chính xác, giống như chúng trong trò chơi bài. Ví dụ, máy tính biết chính xác xác suất để rút ra một cú Xả qua cửa hậu là bao nhiêu và tỷ lệ cược ăn nó cần để biện minh cho việc đuổi theo. Mặc dù poker liên quan đến thông tin không đầy đủ, poker không giới hạn là một trò chơi đơn giản hơn cờ vây, mặc dù cờ vây bao gồm thông tin đầy đủ (thông tin kiến ​​thức chung). Sai lầm # 2: Tính ưu việt của máy tính đến từ việc có thể nhớ mọi ván bài tôi đã chơi và điều chỉnh cho phù hợp. Trong khi “bot khám phá” thực sự sẽ phân tích lượt chơi trong quá khứ của bạn và điều chỉnh những điểm yếu nhận thấy được, thì một bot GTO tiêu chuẩn (chúng ta thường gọi là “bot Nash”) tương đương với BS trong trò xì dách. Chiến lược GTO không thay đổi, bất kể bạn đã chơi các ván bài trước như thế nào. Nó không cần thông tin đó, và không quan tâm. Sai lầm # 3: Giải pháp GTO chỉ “đúng” nếu đấu với một bot GTO khác, vì đó là điều được giả định khi bot được phát triển — bot “học” bằng cách đấu với chính nó. Điều này là sai. “Bot chơi với chính nó để học poker” là một sự mô tả sai của quá trình phát triển. Các phương tiện truyền thông thích quảng cáo chiêu trò nhấp chuột của mình để làm cho mọi kết quả trong tính toán giống như một bước đột phá thế hệ, gọi HAL và Skynet. Một bot GTO không biết gì về poker. Tìm ra chiến lược GTO là một bài tập về tính toán, được thực hiện nhờ bộ nhớ khổng lồ và tốc độ CPU có sẵn trong các máy tính ngày nay và sự phát triển của một thuật toán hiệu quả để thực hiện tính toán (“giảm thiểu đáng tiếc”). Chúng tôi chưa bao giờ mô tả thuật toán là “máy học” hoặc “AI” –chúng tôi thường gọi nó là “leo đồi” hoặc “tối đa hóa” hoặc “tối ưu hóa”. Ở mỗi bước của thuật toán lặp lại, máy tính có chiến lược hiện tại đang được phát triển cho từng chỗ ngồi trong bàn và chiến lược hiện tại này có thể được mô tả phổ biến là “chính nó”, như trong: “PokerSnowie đấu với chính nó”. Nhưng nó thực sự chỉ là một bước lặp lại trên con đường leo dốc để hội tụ ở đỉnh cao — một chiến lược tối ưu cho poker. Sự tối ưu đó không giả định bất kỳ đối thủ cụ thể nào. Có những cách khác mà chúng tôi có thể tính toán giải pháp (mặc dù có thể không nhanh bằng) và nó sẽ hợp lệ. Chiến lược GTO này là “The Book” cho poker, và nó sẽ không bao giờ gặp bất lợi, bất kể đối thủ của nó là gì. Không có chiến lược nào có thể chống lại nó. Sai lầm # 4: Bot GTO cho rằng tôi sẽ chơi theo một cách nhất định, nhưng tôi sẽ đánh lừa nó bằng cách chơi 72 chiếc off-suit của tôi ở vị trí. Sai lầm. Bot GTO không giả định bất cứ điều gì về cách bạn chơi. Nó không quan tâm. Nó là bất khả chiến bại trước BẤT KỲ chiến lược đối lập nào. Hãy tưởng tượng bạn có một trận đấu sắp tới chống lại Floyd Mayweather, và bạn nói, “Floyd hy vọng tôi sẽ thể hiện trong tình trạng thể chất hoàn hảo. Anh ấy cho rằng tôi sẽ tập luyện chăm chỉ trong sáu tháng tới. Tôi sẽ lừa anh ấy — tôi sẽ chỉ xem Netflix và ăn bánh rán trong sáu tháng tới. ” Floyd không biết bạn sẽ tập luyện bao nhiêu. Anh ấy biết rằng nếu bản thân anh ấy thể hiện với phong độ hoàn hảo, thì không đối thủ nào có thể vượt qua được anh ấy. Có hợp lý không khi nói, “Con bot cho rằng tôi sẽ chơi tốt. Tôi sẽ lừa bot bằng cách chơi bài xì phé! ” Vâng, bạn chắc chắn đã cho họ xem! Sai lầm # 5: Tôi đã tìm thấy một điểm yếu - khi tôi có như vậy và như vậy, từ vị trí như vậy và như vậy, thì bot sẽ làm X, nhưng nó làm Y. Sai. Bot không có điểm yếu. Bạn đang xem xét một cách cầm tay cụ thể và một kết quả cụ thể, nhưng dựa trên khả năng xảy ra trong trường hợp đó và tất cả các cách cầm tay bạn có thể nắm theo quan điểm của bot, cách chơi của nó là đúng và bạn có thể không tìm thấy một cái lỗ ở đó. Rất nguy hiểm nếu nhìn một vở kịch cô lập. Bot thực hiện các bước di chuyển để cân bằng phạm vi của nó, để bạn không thể đục khoét trong các tình huống khác hoặc nếu các thẻ khác nhau xuất hiện trên sông. Nếu bạn không nhìn thấy nó, thì lỗi là ở tư duy chơi poker của chính bạn, không phải của bot. Sai lầm # 6: Nếu tôi chơi nó một thời gian, tôi sẽ tìm ra cách nó chơi và tìm ra điểm yếu. Sai lầm. Không có điểm yếu. Trên thực tế, chúng tôi có thể xuất bản chiến lược của bot và nó sẽ không tạo ra bất kỳ sự khác biệt nào. Nếu tôi nói với bạn rằng tôi sẽ chơi Kéo, Đá và Giấy với xác suất 1/3 trên mỗi ván, thì việc bạn biết chiến lược của tôi khiến bạn không có khả năng đạt được lợi thế. Không có gót chân Achilles. Sai lầm # 7: Các bot Giới hạn Cảnh báo được đưa vào các sòng bạc rất dễ bị đánh bại, vì vậy có lẽ các bot GTO cũng vậy. Đây không phải là một so sánh có ý nghĩa. Một số bot sòng bạc được hướng dẫn không chơi trò chơi A của họ, vì nó quá mạnh so với người bình thường. Nếu sòng bạc đặt bot chơi trò chơi B của họ, chẳng hạn như đạt được lợi thế 5% so với hầu hết người chơi, thì một người thực sự giỏi có thể kiếm tiền từ bot GTSO đó (bot tối ưu theo lý thuyết trò chơi). Nhưng đó là một vấn đề khác. Tôi không quan tâm bạn là ai: Nếu bạn chơi đối đầu với PokerSnowie, bạn sẽ thua. Fallacy # 8: Các bot GTO có thể đánh bại những người chơi yếu, nhưng các bot này sẽ gặp khó khăn trước những đối thủ hàng đầu như Phil Ivey hoặc Dan Negreanu. Sai lầm. Một điểm hay của GTO bot là không quan trọng đối thủ là ai. Tốt nhất, ai đó có thể chơi ngay cả với bot. Một vòng bot GTO sẽ giống như một cái bồn, với dòng tiền chảy theo chiều kim đồng hồ đuổi theo nút, và chảy ra giữa bàn do cái cào. Một vấn đề thực tế mà những người chơi chuyên nghiệp trong thế giới thực thường gặp phải là quyết định khi nào kỹ năng của họ đủ để đạt được mức tiền cược cao hơn hiện có, nơi những người chơi có lẽ mạnh hơn. Nhưng giờ đây, một người chơi bắt chước chiến lược GTO có thể ngồi xuống bất kỳ bàn nào trên thế giới, với bất kỳ số tiền đặt cược nào và không phải lo lắng về việc trở thành cá. Tốt nhất, trò chơi sẽ là đồng đều (bên ngoài trò chơi cào) và trên thực tế, chiến lược GTO mang lại lợi thế đáng kể so với bất kỳ ai bạn sẽ gặp trong tự nhiên. Sai lầm # 9: Dan Negreanu là một người chơi poker chuyên nghiệp lâu năm với N vòng tay, vì vậy anh ta sẽ nghiền nát những tay máy tính như Doug Polk, những người không hiểu sắc thái của poker thực sự. Nếu một người như Polk chỉ ghi nhớ "các biểu đồ" và bắt chước chiến lược GTO, anh ta không cần phải hiểu một điều chết tiệt. Anh ấy không cần biết từ “sắc thái” nghĩa là gì. Kinh nghiệm chơi bài poker của những người chuyên nghiệp như Negreanu là điều giúp họ tìm ra cách chơi tốt nhất trong các tình huống phức tạp. Kinh nghiệm đó giờ đã lỗi thời khi các máy tính chỉ tính toán lượt chơi phù hợp. Có lẽ vào năm 1950, kinh nghiệm của một người chơi đã giúp anh ta xác định rằng đánh 14 v T tốt hơn là đứng. Một khi Four Horsemen tính toán biểu đồ BS, trải nghiệm blackjack đó trở nên không còn phù hợp. Sách kết xuất trải nghiệm không cần thiết. Bây giờ Doug Polk không phải là một bot GTO. Anh ấy là một chuyên gia hàng đầu sử dụng các chiến lược GTO. Vì vậy, cú đánh duy nhất của Negreanu để đánh bại Polk là nếu Polk mô phỏng GTO không chính xác, và nếu lỗ hổng đủ lớn để Negreanu tìm ra và khai thác. Tôi nghi ngờ điều đó. Một cú đánh xa khác sẽ là nếu họ chơi trực tiếp, và nếu Polk có thông báo vật lý rằng hãy cung cấp thông tin về các thẻ lỗ của anh ta, và nếu Negreanu có thể đọc anh ta theo cách đó. Hoặc nếu Polk gặp vấn đề về độ nghiêng và bắt đầu lạc khỏi GTO nếu anh ta có một lượt bài không tốt. Không có khả năng. Hoặc, có lẽ trò chơi đủ ngắn để Negreanu gặp may trong một mẫu nhỏ. Sau khi đấu với AlphaGo, Lee Sedol đã nâng cao trò chơi của mình và bắt đầu đè bẹp tất cả mọi người (không phải là anh ta chưa chơi), nhưng sau đó rút lui khỏi cuộc chơi! Anh ta thừa nhận rằng anh ta đã được xuất sắc nhất (thật là một khái niệm!), Và rằng không một con người nào có thể thách thức lại người chơi giỏi nhất trên trái đất, AlphaGo. Chúng ta sẽ xem liệu Negreanu có hiển linh tương tự không. Một tweet gần đây khiến tôi tự hỏi, bởi vì Negreanu dường như đang đặt câu hỏi về một trò chơi bot, và cho rằng có một ranh giới mong manh giữa thiên tài và sự không ngoan. Tôi nghĩ anh ấy vẫn hy vọng rằng có một lỗ hổng trong chiến lược GTO. Không có. Lần cuối tôi nghe nói, Negreanu đang bắt kịp cuộc thi, và có một số dấu hiệu cho thấy một lý do là, để ghi nhận công lao của anh ấy, Negreanu đang luyện tập với PokerSnowie và thích nghi! Nếu Negreanu có thể nhanh chóng học được chiến lược GTO, thì anh ấy có thể san bằng sân chơi, đó sẽ là một thành tích to lớn. Cách duy nhất một con khủng long có thể tồn tại là tiến hóa. Chúng ta sẽ thấy vào năm 2021. [Next time, I’ll discuss some of the limitations and weaknesses of the poker bots, unless we thrash them out in the Comments below.]
777ww คาสิโน wm คาสิโน คาสิโน ปอยเปต คาสิโน ออนไลน์ ได้เงินจริง สมัคร คาสิโน

Leave a Reply

Your email address will not be published. Required fields are marked *