Android

Sức mạnh của bot openai đánh bại dendi

ЧЕМУ МОЖНО НАУЧИТЬСЯ У OPEN AI?

ЧЕМУ МОЖНО НАУЧИТЬСЯ У OPEN AI?

Mục lục:

Anonim

Tuần trước, lịch sử đã được tạo ra trong vương quốc của Dota 2 và AI. Tại The International, Dendi, một trong những người chơi giỏi nhất của trò chơi, đã bị đánh đập không thương tiếc trong 1v1, bởi một bot, hai lần liên tiếp. Bot trong câu hỏi được thực hiện bởi OpenAI, một công ty khởi nghiệp của Elon Musk.

Bây giờ bạn có thể có một số câu hỏi. Dota là gì? OpenAI là gì? Và tại sao điều này thậm chí còn quan trọng? Để bắt đầu, Dota là một game MOBA miễn phí, trong đó bạn điều khiển các Anh hùng và mục tiêu của bạn là tiêu diệt các đối thủ Cổ đại. Nhiều người hâm mộ Dota có thể vi phạm đến câu cuối cùng vì có quá nhiều điều với Dota sau đó tôi đã tóm tắt.

Trò chơi rất phức tạp với một đường cong học tập rất dốc với nó. Tôi đã bắt đầu một nhiệm vụ để học Dota một thời gian trước đây và tôi phải mất một tuần chỉ để xem một video Cách làm cơ bản, nơi họ giải thích chiến lược của trò chơi, vũ khí, phép thuật, anh hùng làm gì và cách khai thác creep. Và điều này làm cho toàn bộ trận chiến AI vs Dendi trở nên quan trọng bởi vì nó minh họa cho việc AI và ML đã trở nên tiên tiến như thế nào. Vì vậy, hãy xem những gì cung cấp năng lượng cho bot và chúng ta cần phải sợ hãi về cuộc nổi dậy của AI.

Sự trỗi dậy của hành tinh AI

AI trở thành Skynet là một vấn đề gây tranh cãi. Elon Musk tin rằng nếu không được kiểm tra, một kịch bản giống như Skynet có thể sẽ xảy ra. Mặt khác, Mark Zuckerberg nói rằng AI là vô hại và sẽ không gây ra Kịch bản Ngày tận thế. Elon Musk bắt đầu OpenAI với mục tiêu này.

Để ngăn chặn việc lạm dụng AI và nghiên cứu về AI sẽ không chống lại chúng ta. Và tôi đứng về phía anh ấy.

Nhưng đó không phải là những gì chúng ta đang ở đây để thảo luận. Chủ đề chính là để biết những gì cung cấp năng lượng cho bot được tạo bởi OpenAI. Để hiểu về nó, tôi đã đọc một số tài liệu nghiên cứu và blog về chủ đề này và cũng đã liên lạc với người bạn của tôi Anmol Sharma, một nhà nghiên cứu về AI & ML.

Học tăng cường

Đây là tên của công nghệ đằng sau bot Dota của OpenAI. Nhưng trước khi đi sâu vào nó, chúng ta cần hiểu AI nói chung, hay cụ thể là AI trong Trò chơi điện tử hoạt động như thế nào. AI là một thuật ngữ rất quan trọng và chứa nhiều chủ đề như Machine Learning, Deep Learning và Neural Networks để đặt tên cho một số ít. Để định nghĩa một cách thô thiển về AI, chúng ta có thể nói đó là khả năng máy tính học hỏi thông tin và đưa ra quyết định dựa trên việc học. Càng học nhiều, tính chính xác của quyết định càng tăng.

Nó khác với Bot bình thường như thế nào?

Bots trong các trò chơi video nói chung có thể trông giống như chúng thông minh nhưng nó không phải là một dạng AI thực sự. Hầu như tất cả các bot trong trò chơi này đều được lập trình dựa trên tập hợp If.. This..Then..Thật đó. Họ chỉ làm theo các tuyên bố và thực hiện các hành động dựa trên các điều kiện được viết trong tuyên bố.

Ở trên tôi đã chỉ ra một ví dụ rất đơn giản. Báo cáo trong các trò chơi thực tế phức tạp hơn nhiều với các điều kiện trong các điều kiện. Những tuyên bố này càng được xác định rõ ràng và chi tiết, bot sẽ càng thông minh.

Phần thưởng và hình phạt

Trong biệt ngữ AI, cái mà chúng ta gọi là bot được gọi là Đại lý. Mục tiêu là làm cho tác nhân học bất cứ điều gì chúng ta muốn nó học. Tác nhân học thông qua phương pháp tương tự như con chó của bạn học, thông qua phần thưởng và hình phạt. Bất cứ khi nào tác nhân mắc lỗi, nó sẽ bị phạt và bất cứ khi nào nó đoán đúng hoặc đưa ra câu trả lời đúng, nó sẽ được thưởng. Thông qua hệ thống này, nhân viên học cách liên kết các hành động không nên làm để tránh bị phạt và thực hiện hành động (hoặc hành động tương tự) mang lại phần thưởng.

Nếu bạn nghĩ kỹ về nó, nó giống như đưa ra quyết định dựa trên các điều kiện nhất định, giống như các thuật toán thực hiện nó. Như tôi đã trình bày ở trên, một bot trò chơi, xuất hiện trong một thùng thuốc nổ, sẽ thực hiện các hành động theo thuật toán. Các thuật toán trong AI, rõ ràng là rất phức tạp hơn thế này, điều này làm cho toàn bộ hệ thống trở nên thông minh.

Đến với bot OpenAI của chúng tôi, theo các nhà phát triển, nó đã học được toàn bộ trò chơi trong thời gian 2 tuần. Trong toàn bộ thời gian 2 tuần, nó đã trực tuyến 24 × 7 và chơi với một bản sao của chính nó. Đó là một cột mốc đáng chú ý khi xem xét sự phức tạp của trò chơi và thực tế là nó có thể đánh bại Dendi.

Tại sao xe không có tài xế vẫn không có ở đây?

Đây là một trong những câu hỏi đầu tiên xuất hiện trong đầu tôi khi tôi nghe về toàn bộ sự kiện này. Nếu một bot có thể học một trò chơi như vậy và rèn luyện bản thân để đánh bại những người chơi hàng đầu, tại sao chúng ta vẫn điều khiển bánh xe. Và đây cũng chính là câu hỏi mà tôi đã bắn vào người bạn của mình, ông Anmol Sharma, người cũng đã nghiên cứu về những chiếc xe không người lái. Đó là những gì anh ấy đã nói.

Trong một trò chơi, được phát triển bởi một con người, số lượng biến số ít hơn. Thêm vào đó, nếu tác nhân (bot) phạm lỗi, hình phạt tồi tệ nhất là thua vòng. Trong thế giới thực, một sai lầm là cái chết.

Mặc dù Dota là một trò chơi phức tạp, nhưng sự kết hợp có thể của các chiêu thức, phép thuật và chiến thuật, mặc dù vẫn còn rất lớn, nhưng vẫn còn hạn chế. Và sai lầm được cho phép mà không có bất kỳ hình phạt thực sự. Nhưng trong trường hợp Đại lý xe không có tài xế, những sai lầm có thể dẫn đến tai nạn nguy hiểm và thậm chí tử vong.

Trong thế giới thực, số lượng biến số mà tác nhân phải theo dõi là vô tận và các tình huống phát sinh do các biến này, giống như một chiếc xe khác đột nhiên chuyển làn, người đi bộ nhảy trước xe, cũng là vô tận. Thêm vào đó, như Jeremy Clarkson nói, họ sẽ phải đưa ra quyết định về đạo đức và đạo đức khi sắp sửa xảy ra tai nạn ngay lập tức (mặc dù lý thuyết của ông không có giá trị).

Tương lai

Chúng ta đã biết về robot do con người điều khiển thực hiện các ca phẫu thuật nội tại. Bước nhảy vọt tiếp theo là robot điều khiển bằng AI thực hiện nó. Và đây chỉ là trong lĩnh vực y tế. AI chắc chắn sẽ là công nghệ mới thống trị trong thập kỷ tới trên nhiều lĩnh vực. Nhưng, AI cũng có thể bị lạm dụng cho các mục đích bất chính như tấn công DDoS, Ransomware Bots và hack các PC hoặc hệ thống khác của các tập đoàn.

Liên quan đến Dota và các trò chơi khác, chúng ta có thể hy vọng sẽ thấy các bot thông minh như vậy được tạo ra cho các trò chơi khác, người mà người chơi có thể đào tạo để thực hiện tốt hơn nữa. Và tôi có đề cập đến OpenAI sẽ thực hiện 5v5 tại Quốc tế năm tới không? Vì vậy, tôi sẵn sàng cải thiện các kỹ năng Dota của mình để ít nhất đánh bại các bot ngu ngốc được xây dựng. Rapier thần thánh ở đây tôi đến!