Nhóm nghiên cứu tại Wayve – một công ty được thành lập bởi các nhà phát triển đến từ Khoa Kỹ sư thuộc Đại học Cambridge đã công bố chi tiết thuật toán “học tăng cường” (đi kèm với một tài xế con người đóng vai trò dự phòng) giúp chiếc xe tự hành trên một làn đường duy nhất trong thời gian từ 15-20 phút.
“Học tăng cường” đối với AI đã được chứng minh là mang lại hiệu quả rất cao trước đó, với việc DeepMind Technologies biểu diễn AI có thể học chơi các game như cờ vây hay cờ vua, và OpenAI trình làng AI có thể chơi số trận Dota 2 mỗi ngày tương đương với 180 ngày của người chơi thông thường.
Nhóm nghiên cứu đã đăng một đoạn video lên kênh YouTube của họ nhằm cho mọi người thấy quá trình học này, qua đó chỉ ra rằng đây là “ví dụ đầu tiên của “học tăng cường” được thực hiện trên một chiếc xe tự hành”.
Đoạn video còn miêu tả một mô hình gọi là “mạng thần kinh xoắn ốc sâu” có nhiệm vụ tiếp nhận một hình ảnh đơn lẻ được xử lý bằng GPU tích hợp trên xe. Không như các phương tiện tự lái khác, chiếc Renault đã được chỉnh sửa của Wayve không đòi hỏi phải được trang bị “các mô hình khổng lồ, các cảm biến ấn tượng, và nguồn dữ liệu vô tận”, mà nó tuân theo triết lý của công ty là sử dụng “một quá trình huấn luyện thông minh chú trọng học nhanh và hiệu quả”.Đồng sáng lập của Wayve là Amar Shah cho biết: “Chúng tôi muốn trang bị cho các phương tiện những bộ não tốt hơn, chứ không phải nhiều phần cứng hơn”.
Wayve kì vọng mở rộng quy mô của công nghệ này để thực hiện được nhiều tác vụ lái xe phức tạp hơn, không chỉ là đi đúng làn đường, với kỳ vọng hệ thống này cuối cùng sẽ có thể “xử lý khi gặp đèn giao thông hay đi qua các vòng xoay, giao lộ”.