Lê Việt Quốc nổi danh Top 35 nhà sáng chế trẻ dưới 35 tuổi của Mỹ
Trong số này không thể không kể đến cái tên Lê Việt Quốc khi năm 2014, anh đã lọt vào danh sách 35 nhà sáng chế trẻ dưới 35 tuổi của Học viện Công nghệ Massachuset (MIT), Mỹ.
Vừa qua, anh đã cùng 100 nhà khoa học, tri thức trẻ người Việt ở khắp năm Châu trở về Việt Nam tham dự sự kiện “kết nối mạng lưới sáng tạo Việt Nam năm 2018” với mong muốn đóng góp công sức ở lĩnh vực chuyên môn của mình cho quê hương, đất nước.
Phát biểu tại Hội thảo Trí tuệ nhân tạo Việt Nam 2018 (AI4VietNam 2018) do Bộ Khoa học và Công nghệ (KH&CN) chủ trì tổ chức ngày 21/8, tại Hà Nội, TS. Lê Viết Quốc đến từ Google Brain, Mỹ cho rằng, trong số các công nghệ AI hiện nay, đột phá lớn nhất là công nghệ nhận diện hình ảnh, nhận diện giọng nói, và tự hình thành ngôn ngữ tự nhiên. Trong đó, riêng công nghệ nhận diện hình ảnh đã có tốc độ tăng trưởng kỳ diệu, khi vượt qua khả năng nhận diện của con người vào năm 2016.
Theo Tiến sĩ Quốc, Việt Nam nên đầu tư mạnh vào 3 mảng chính đó là đào tạo nguồn nhân lực, xây dựng nguồn dữ liệu mở, và tạo ra mối liên kết giữa các trường đại học Việt Nam với nguồn trí thức, cộng đồng thế giới.
TS Lê Việt Quốc trình bày tại hội thảo Trí tuệ nhân tạo tại Việt Nam diễn ra hôm 21/8 vừa qua |
Nhìn dáng hình mảnh dẻ, trầm tĩnh đằng sau cặp kính cận, Lê Việt Quốc hoàn toàn không có vẻ gì là người đang dẫn đầu một cuộc cách mạng trong lĩnh vực trí tuệ nhân tạo (AI) ở Google.
Năm năm 2011, Lê Việt Quốc đã đồng sáng lập Google Brain, cùng với bằng tiến sĩ của mình, cố vấn Andre, thành viên Google Jeff Dean và nhà nghiên cứu Google Greg Corrado. Mục tiêu của họ là khám phá việc học sâu trong bối cảnh dữ liệu khổng lồ của Google. Trước đó, Lê Việt Quốc đã thực hiện một số công việc tiên phong tại Stanford về học tập sâu không giám sát.
Vào năm 2012, anh đã xuất bản một bài báo (giới thiệu tại ICML) bắt đầu quan tâm đến việc học sâu: Anh đã phát triển một mô hình mạng nơron sâu có thể nhận ra mèo dựa trên 10 triệu hình ảnh kỹ thuật số từ Youtube, cũng như hơn 3.000 đối tượng trong tập dữ liệu ImageNet. Hệ thống khổng lồ bao gồm 16.000 máy móc và 1 tỷ khớp, lớn hơn gấp 100 lần so với bất kỳ ai từng thử. Bài báo của Le được AlexNet theo dõi vào cuối năm 2012 và toàn bộ lĩnh vực học sâu bắt đầu thu hút sự chú ý.
Mặc dù cách tiếp cận học tập không giám sát sau đó được chứng minh là không thực tế trong ứng dụng thương mại, anh nói trong một cuộc phỏng vấn năm 2015 rằng “Thật là tuyệt vời nếu chúng ta có một thuật toán có thể học như vậy – học giống như người – vì đó là một cách học thực tế hơn, chúng ta có nhiều dữ liệu không dán nhãn hơn là những dữ liệu được dán nhãn”.
Sau khi chính thức gia nhập Google với tư cách là một nhà khoa học nghiên cứu sau khi tốt nghiệp vào năm 2013, Lê Việt Quốc sớm đạt được những đột phá ấn tượng trong dịch máy, một trong những lĩnh vực nghiên cứu tích cực nhất trong cộng đồng học máy.
Theo đó, chỉ sau một năm ra nhập chính thức Google năm 2014, anh đề xuất trình tự chuỗi (seq2seq) học với nhà nghiên cứu Google Ilya Sutskever và Oriol Vinyals. Nó là một khung công cụ giải mã bộ mã hóa có mục đích chung giúp đào tạo các mô hình để chuyển đổi các chuỗi, ví dụ như các câu giữa các ngôn ngữ khác nhau.
Việc học seq2seq đòi hỏi ít sự lựa chọn thiết kế kỹ thuật hơn và cho phép hệ thống dịch của Google hoạt động hiệu quả và chính xác trên các tập dữ liệu rất lớn. Nó chủ yếu được sử dụng cho các hệ thống dịch máy và được chứng minh là có thể áp dụng trong một phạm vi rộng hơn các nhiệm vụ, bao gồm tóm tắt văn bản, đối thoại AI và hỏi đáp.
Năm 2016, Google đã công bố hệ thống dịch máy Neural, sử dụng AI để tạo ra các bản dịch tốt hơn và tự nhiên hơn. Cũng trong năm này, Lê Việt Quốc và một đồng nghiệp khác của Google, Barret Zoph đã đề xuất tìm kiếm một kiến trúc thần kinh. Một năm sau, Le và Zoph đưa nghiên cứu của họ lên cấp độ tiếp theo bằng cách đề xuất NASNet-A, một kiến trúc có thể chuyển giao cho các tập dữ liệu hình ảnh có quy mô lớn. Những nghiên cứu này của Lê Việt Quốc đặt nền móng cho AutoML, một bộ sản phẩm của Google được thiết kế cho các nhà phát triển có chuyên môn về học máy hạn chế.
Ở giai đoạn đầu, AutoML hiện đang giải quyết các vấn đề thực tế: một nhà khoa học dữ liệu đã sử dụng AutoML để xây dựng một mô hình xác định nhà hàng dựa trên hình ảnh mì, với độ chính xác gần như 95%; một nhà phát triển người Nhật đã sử dụng AutoML để xây dựng một mô hình có thể phân loại hình ảnh với tên thương hiệu. Google đã ra mắt AutoML Vision vào đầu năm nay.
Trong 6 năm qua, Lê Việt Quốc luôn đã ở vị trí hàng đầu trong phát triển học sâu. Nhà khoa học nghiên cứu của Google này hiện đang sẵn sàng để nghiên cứu học sâu ở cấp độ cao hơn.