Sáng kiến về Xã hội Siêu thông minh – Xã hội 5.0 đã bắt đầu xuất hiện tại Nhật Bản trong vài năm gần đây. Thời Đại AI xin giới thiệu quan điểm của TS. Kazuo Yano (Hitachi) – một trong những nhà tiên phong Trí tuệ nhân tạo (AI) tại Nhật về tác động của AI tới sự hình thành Xã hội Siêu thông minh, và sự ưu việt của Leap learning so với Supervised learning.

Trí tuệ nhân tạo là cơ chế tạo sự đa dạng

Những chính phủ công nhận tầm quan trọng của một Xã hội Siêu thông minh (Super Smart Society) hiện đã và đang thúc đẩy các sáng kiến ​​để đạt được Xã hội 5.0[1]. Từ quan điểm R&D, quan trọng nhất là cần xem đây là cách tốt nhất để đạt được “sự đa dạng” và “thay đổi” mà xã hội yêu cầu. Khi xã hội trở nên phức tạp và đa dạng hơn, khó có thể có một quy tắc áp dụng được cho tất cả mọi người như trong thế kỷ 20. Tuy nhiên, cách chúng ta nghĩ, cách xã hội vận hành, và cách các hệ thống công ty được xây dựng vẫn đang chạy trên những ý tưởng của thế kỷ 20. Vì vậy, chúng ta phải thay đổi điều này.

Quan điểm của tất cả mọi người theo một quy tắc duy nhất là rất mạnh, không có ngoại lệ và xuyên suốt thế kỷ 20. Người ta tin rằng lòng khoan dung và việc thúc đẩy sự đa dạng sẽ chỉ dẫn đến thêm chi phí quản lý và giảm hiệu quả. Ý tưởng rằng rằng chỉ cần mọi người theo cùng một quy tắc sẽ cải thiện chi phí và hiệu quả vẫn còn tồn tại trong cách suy nghĩ hiện tại của chúng ta, và chúng ta phải thay đổi cách suy nghĩ này, linh hoạt trong việc dung thứ tính đa dạng.

Khi chúng ta nghĩ về AI, bất kể chúng ta nghiên cứu thuật toán sâu đến mức nào, khối lượng dữ liệu tích luỹ được bao nhiêu, thì thực sự khả năng làm được của nó rất thấp. Điều quan trọng nhất là kết quả số – đầu ra của nó. Tầm quan trọng của các kết quả này cũng như việc nuôi dưỡng các thay đổi và sự đa dạng như hai mặt của cùng một đồng tiền. Miễn là chúng ta có thể đạt được kết quả số mong muốn, nó có thể được thực hiện bằng cách thiết lập sự đa dạng khi cần thiết dựa trên nhu cầu của con người, xã hội và điều kiện địa phương – loại trừ điều kiện cần rằng mọi người cần tuân theo các quy tắc giống nhau. Con người và doanh nghiệp đều có nguồn gốc, lịch sử và trí tuệ riêng. Tăng cường sự đa dạng là cần thiết để tận dụng những nguồn gốc, lịch sử, trí tuệ đó – được gọi là “tư duy kết quả”.

Kết quả quan trọng nhất đối với cả xã hội nói chung mà con người nghĩ đến là “hạnh phúc”. Người Hy Lạp cổ đại và Khổng Tử đều sử dụng nó như một từ thể hiện kết quả cực đoan nhất đối với con người. Nếu chúng ta có thể định lượng “hạnh phúc” này và đưa nó vào AI làm dữ liệu, chúng ta sẽ có thể tận dụng khả năng của nhiều người để cải thiện hạnh phúc của xã hội nói chung. Công cụ tìm kiếm đã là phương tiện của chúng ta giúp tăng khả năng của con người trong khoảng 10 năm qua. Từ việc sử dụng thông tin có sẵn trên Internet để tăng khả năng của chúng ta ban đầu, nay chúng ta đã sử dụng các thông tin trên mức độ hàng ngày. Tuy nhiên, thông tin này chỉ là một phần nhỏ dữ liệu của thế giới. Thực tế, hành vi của con người xảy ra trong thời gian thực không thể được biểu diễn trong kết quả tìm kiếm. Hơn nữa, nó không thể được sử dụng như dữ liệu. Tất cả các hành động xảy ra bên trong một công ty hoàn toàn không được sử dụng làm dữ liệu.

Vì vậy, một cách tiếp cận hệ thống là rất cần thiết để bắt đầu sử dụng các loại dữ liệu. Khi người thực hiện của những hành động này là con người, điều này cũng liên quan trực tiếp đến hạnh phúc. Đó là bởi khi được đặt trong hoàn cảnh không hạnh phúc, con người trở nên không hiệu quả. Mặc dù có những manh mối để giải quyết vấn đề này ở những nơi khác nhau, nhưng khó có thể nhìn thấy từ bên trong hoàn cảnh không hạnh phúc, làm cho mong muốn và đổi mới vượt qua những hoàn cảnh đó và bước tới bước tiếp theo nhưng không thể. Thực tế, hạnh phúc của con người cùng năng suất của các doanh nghiệp và con người về cơ bản có liên quan đến nhau, là điều nhìn thấy được trong dữ liệu định lượng của R&D.

Khi AI thay đổi, phần mềm khác cũng vậy. Phần mềm thông thường thực hiện các hành động của nó chính xác như được quy định, bởi logic của mã phần mềm và không bao giờ vượt qua những hành động này. Như vậy, cùng một đầu vào chắc chắn sẽ tạo ra cùng một kết quả.

Ngược lại, AI đa năng được phát triển bởi Hitachi có thể hoạt động với các logic hoàn toàn khác nhau chỉ dựa trên những thay đổi đối với cài đặt hoặc dữ liệu đầu vào của nó. Bằng cách nhập dữ liệu của từng đặc tính riêng biệt hoặc các hạn chế của từng công ty vào AI đa năng, mỗi cấu hình dữ liệu sẽ hoạt động với một logic hoàn toàn khác. AI đa mục đích có thể tạo ra một thế giới hoàn toàn trái ngược, trong đó mọi người phải tuân theo cùng một quy tắc. Nói cách khác, AI là một cơ chế để đạt được sự đa dạng.

Trong 4 tỷ năm qua, sự sống trên Trái Đất đã tiến triển từ những sinh vật đơn giản đến những loài đa dạng với cơ chế được gọi là “tiến hóa”. Trong cuốn “On the Origin of Species” (Tạm dịch: Nguồn gốc các loài), Charles Darwin nhấn mạnh rằng sự tiến hóa không phải là tiến triển, mà là một cơ chế để đạt được sự đa dạng. Con người chúng ta vẫn chưa học đủ về cơ chế đã được sử dụng bởi các sinh vật sống trong 4 tỷ năm qua này. Tuy nhiên, thông qua AI, cuối cùng chúng ta đã đạt đến giai đoạn mà Hitachi có thể tái tạo nó.

Điều này có ý nghĩa rất lớn đối với xã hội loài người. Thế kỷ 20 là một trong số những mốc mà con người buộc phải sắp xếp bản thân với máy móc, hệ thống và cách làm việc tiêu chuẩn hóa. Một xã hội với AI, hoặc nói cách khác là một Xã hội Siêu thông minh, là cách nói chính xác. Các công nghệ tối ưu trí tuệ nhân tạo, dữ liệu để tạo nên sự đa dạng và tận dụng đầy đủ các đặc điểm cũng như lịch sử của địa điểm sẽ dẫn chúng ta tới một kỷ nguyên mới.

“Leap learning” vượt qua “Supervised learning”

AI là một chủ đề phổ biến, dường như mỗi ngày chúng ta lại thấy chủ đề “Sáng chế mới” hoặc “Hợp tác mới” trên báo chí. Trong số các tiêu đề bài báo, có nhiều câu chuyện kì diệu nhưng cũng còn những chuyện đáng lo ngại về việc máy móc sẽ thay thế vị trí của con người, hay Singularity[2] cho phép máy móc tạo ra các máy khác, và đặt con người dưới sự kiểm soát của chúng. Tuy nhiên, những “tưởng tượng” này tương đối không lành mạnh.

AI có thể làm gì và AI không thể làm gì, điều đã được xác định rõ ràng. Bản thân “AI” đã mang một ý nghĩa rất rộng. Khi bộ xử lý văn bản đầu tiên xuất hiện, khả năng chuyển đổi một hệ thống chữ viết tiếng Nhật sang hệ thống chữ viết khác được gọi là “chuyển đổi AI”. Khi điều khiển từ xa cho TV trở nên “thông minh” đủ để họ có thể thay đổi kênh chỉ bằng cách nhấn nút, nó được gọi là “truyền hình AI”. Khi máy tính có nhiều chức năng nâng cao hơn, chúng được gọi là “máy tính AI”. Từ “AI” đã được áp dụng khá là bừa bãi trong một thời gian.

Trong thực tế, chỉ có một điều quan trọng. Đó là chức năng được gọi là “Supervised learning” (Học có giám sát)[3].

Có dữ liệu ở lối vào, và ở đây (phần trung tâm), có một loại quá trình. Điều này có thể dùng cho kinh doanh, hoặc nó có thể là một hiện tượng xã hội. Lấy ví dụ cụ thể về hoạt động hàng ngày của một cửa hàng, bạn sẽ nhận được kết quả đầu ra: Có khá nhiều dữ liệu “đầu vào” và chúng ta sẽ nhận được kết quả, như “số tiền cửa hàng đã bán trong một ngày”.

Nếu chúng ta ghép nối dữ liệu cho thấy nhiều hiện tượng hoặc điều kiện khác nhau với các con số là kết quả của chúng, chúng ta sẽ có một mô hình đơn giản: ; có thể cho chúng ta cảm giác mơ hồ về quy trình trung gian. Đơn giản nhất, điều này có thể bắt nguồn từ thứ giống như . Nếu chúng ta nhập một lượng lớn dữ liệu với “giọng nói” được ghép nối tại đầu vào cùng “Từ thực sự được nói” ở đầu ra, điều này được gọi là “nhận dạng giọng nói”. Nếu chúng ta đưa vào rất nhiều dữ liệu với “ảnh” ở đầu vào ghép nối với “hình ảnh của một con mèo” hoặc “hình ảnh khuôn mặt của một người” tại đầu ra, điều này được gọi là “nhận dạng hình ảnh”.

Điểm quan trọng là đặt khối lượng “dữ liệu đầu vào” và “dữ liệu đầu ra” được kết nối với nhau, và tự động ngoại suy các mô hình mối quan hệ cho cả hai. Đây được gọi là “Supervised learning”. Lý do AI có thể làm được nhiều hơn trước đây là do khả năng học tập có giám sát của nó đã được cải thiện đáng kể.

Trước đây, phương pháp của chúng ta liên quan đến việc tạo ra một phương trình dựa trên đầu vào cùng quá trình, và thay x vào phương trình để tìm ra kết quả. Hoặc cách khác là dùng phương pháp suy luận về nghiên cứu hiện tượng, vật lý và xã hội học, và đưa ra một dự đoán.

Ngày nay, có thể sử dụng AI để nhập cả dữ liệu có điều kiện ở lối vào và kết quả, xác định logic giữa đầu vào và đầu ra – ngay cả khi chúng ta chưa biết quá trình trung gian. Chỉ với tiến bộ này, chúng ta có thể đặt bằng giọng nói hoặc hình ảnh, như bảng trò chơi để đi với kết quả là “thắng hoặc thua trò chơi”, “có bao nhiêu ô vuông đã thắng” và bằng cách nhập nhiều dữ liệu như kết quả trò chơi được ghi lại, nhiều đối thủ khác nhau rồi chúng ta có thể suy ra cách thắng. Tất nhiên, điều này sẽ không thể làm được chỉ với nhận dạng giọng nói, nhận dạng hình ảnh và dịch tự động. Nhưng với sự hỗ trợ của con người, khả năng này đã tăng lên.

Khi những quy trình này có thể thực hiện được, điều quan trọng nhất sẽ là hiệu quả định lượng về quản trị kinh doanh, hay nói cách khác là nền kinh tế. Chúng ta có thể nhập loại số mà chúng ta muốn tăng lên dưới vai trò của doanh nghiệp và dữ liệu đi kèm với chúng. Bằng cách nhập cả hai, chúng ta không chỉ có thể dự đoán “Dưới điều kiện nào chúng ta có thể đạt được kết quả này”, mà còn có thể ngoại suy từ dữ liệu trước đó. Chúng ta đã đạt được một phương pháp cho phép chúng ta tham gia một cách có hệ thống hơn trong các vấn đề xã hội và con người, không giống như vật lý, khó giải được bằng các phương trình.

Hitachi đã nỗ lực để làm việc để giải quyết những vấn đề này trong một thời gian dài. Hitachi AI Technology / H là nơi nghiên cứu trí tuệ nhân tạo của Hitachi nhằm giải quyết câu hỏi có ảnh hưởng lớn nhất là làm thế nào để cải thiện số lượng doanh nghiệp. Điều làm cho công nghệ trở nên có ý nghĩa là bằng cách cung cấp, ví dụ, doanh số bán hàng và lợi nhuận trong một ngày của một chi nhánh kinh doanh như là đầu ra, đầu vào sẽ là một lượng lớn dữ liệu và không thể kết hợp chúng một cách riêng biệt, như với mối quan hệ giữa bức ảnh và con mèo trong ví dụ “Supervised learning” ở trên. Trong “Supervised learning”, các ràng buộc là quá cứng nhắc để có giá trị đối với mục đích cải thiện kết quả kinh doanh.

Điều khiến Hitachi AI Technology / H đặc biệt là khả năng xử lý các vấn đề không phải trên cơ sở “one-on-one” (một đối một), mà dựa trên cơ sở “one-on-may” (một đối với nhiều). Điều này là cần thiết để tăng kết quả kinh doanh, và Hitachi đã bảo đảm bằng sáng chế cho công nghệ này được gọi là “Leap learning” (Học nhảy vọt). Nó đã được thử nghiệm trong các tình huống thực tế cho nhiều khách hàng doanh nghiệp. Ví dụ, khi nó tự động tối ưu hóa kho vận chuyển, tăng năng suất của họ lên 8%, hoặc khi nó tối ưu hóa vị trí công nhân trong một cửa hàng, dẫn đến tăng 15% doanh thu cho mỗi khách hàng. Nó cũng đã giảm lượng điện được sử dụng bởi một công ty đường sắt trong các mô phỏng. Nó đang được sử dụng trong các công ty chứng khoán để quyết định giá tối ưu từ dữ liệu khi cho vay cổ phiếu. Nó thậm chí còn được sử dụng trong vận chuyển, vì vậy mà các gói hàng có thể đến đúng địa điểm trong đúng khoảng thời gian xác định.

Hitachi AI Technology / H được đưa vào sử dụng trong các ứng dụng đa dạng này để giải quyết mọi vấn đề mà doanh nghiệp phải đối mặt, nhưng có điều kiện: Xác định rõ ràng kết quả số và nhập tất cả dữ liệu nguồn có liên quan. Nó cũng cần có một người để dạy AI nơi tạo ra phản hồi. Hitachi tin rằng bằng cách này, Hitachi đã tạo ra “AI đa năng hàng đầu thế giới”, có ích trong nhiều tình huống khác nhau.

Hà Thủy

* Bài viết được lược dịch theo nghiên cứu của Tiến sĩ Kazuo Yano – Kĩ sư trưởng Tập đoàn Hitachi, nhà tiên phong về AI tại Nhật Bản. TS. Yano là thành viên của Ủy ban Chuẩn và Thực hành Xã hội Trí tuệ nhân tạo (AIWS Standards and Practice Committee) – Viện Michael Dukakis về Lãnh đạo và Sáng tạo (MDI).


[1] Xã hội Siêu thông minh (Xã hội 5.0) được mô tả như sau: Một xã hội có khả năng cung cấp hàng hóa và dịch vụ cần thiết cho những người cần chúng vào đúng thời điểm và đủ khối lượng; Một xã hội có khả năng đáp ứng chính xác đến nhiều nhu cầu xã hội; Một xã hội mà tất cả mọi người có thể dễ dàng có được các dịch vụ chất lượng cao, vượt qua sự khác biệt về tuổi tác, giới tính, vùng miền và ngôn ngữ, và sống một cuộc sống đầy sức sống và viên mãn. Nhật Bản đang theo đuổi mục tiêu “Xã hội 5.0”, để ứng phó với các vấn đề của kỷ nguyên kỹ thuật số và những thách thức cản trở sự phát triển bền vững. Các nguyên tắc của “Xã hội 5.0” có thể gói gọn trong cụm từ “phân tích dữ liệu nhờ sức mạnh AI”.

[2] Singularity là một giả thuyết về thời điểm trí tuệ nhân tạo cùng các công nghệ khác đã phát triển tới mức con người phải trải qua một sự thay đổi rất lớn và không thể đảo ngược.

[3] Supervised learning là thuật toán dự đoán đầu ra (outcome) của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước. Cặp dữ liệu này còn được gọi là (data, label), tức (dữ liệu, nhãn). Supervised learning là nhóm phổ biến nhất trong các thuật toán Machine Learning.