Trong dự án tương tác giữa con người và robot ERATO ISHIGURO, hệ thống điều khiển trò chuyện đa phương thức và hệ thống điều khiển hội thoại đa robot được phát triển để tạo ra một robot có mức độ hiện diện giống như con người cũng như tạo được “cảm giác trò chuyện”. Dự án này đã cố gắng mở rộng lĩnh vực hoạt động của các robot đối thoại như vậy và từ đó ra đời việc phát triển một “ibuki” – android có hình dạng trẻ em, được trang bị bánh xe cho phép android di chuyển.

Các robot đàm thoại đã nhận được sự chú ý đáng kể trong các nghiên cứu gần đây. Tuy nhiên, nghiên cứu cho đến nay vẫn chưa khám phá đầy đủ được “ý thức trò chuyện” của robot, “sự tồn tại” của robot và “tính xã hội” của robot. Để trả lời trong lỗ hổng của nghiên cứu này, trưởng dự án, giáo sư Hiroshi Ishiguro (Đại Học Osaka) và các thành viên trong nhóm của ông đã phát triển một robot hình người với khả năng trò chuyện giống con người. Trong dự án này, họ tập trung vào quá trình liên hệ diễn ra khi robot tiếp xúc với con người. Để thúc đẩy vai trò chủ động của robot đối thoại, một android giống như trẻ em có tên “ibuki” đã được phát triển,  “ibuki” được thiết kế để có thể đi lại (di chuyển) cùng với con người bằng cách sử dụng bánh xe được trang bị.

Thứ nhất, một hệ thống nhận dạng đa phương thức sử dụng máy ảnh, đường line array microphone, vv. được phát triển. Tiếp theo, để thiết lập nền tảng công nghệ tạo thuận lợi cho sự tương tác của robot với con người, hệ thống điều khiển cuộc hội thoại được phát triển có thể kiểm soát lời nói, chuyển động, ánh mắt và cảm xúc của robot dựa trên ý định và mong muốn của nó để khiến con người cảm thấy robot giống người hơn trong quá trình tương tác. Mặc dù thử nghiệm để xác minh hệ thống được thực hiện trong một khoảng thời gian ngắn, kể cả việc trò chuyện với khách truy cập trong phòng chờ; nó đã chứng minh rằng android “ERICA” có thể thực hiện cuộc trò chuyện tự nhiên và tăng mức độ nhận thức của robot bởi con người, điều mà khó có thể đạt được bằng cách sử dụng các robot nổi tiếng khác.

Hơn nữa, bằng cách sử dụng một số công nghệ mới như khả năng gật đầu tự nhiên và các kiểu gật khác nhau trong quá trình tương tác, khả năng hỏi ngược lại bằng cách phân tích các thuật ngữ tập trung ngôn ngữ của câu tương tác và thực hiện cơ chế phát hiện phản ứng. Một hệ thống đối thoại được phát triển giúp robot có khả năng trò chuyện giống con người hơn. Áp dụng hệ thống này trong một thử nghiệm trong đó người tham gia được yêu cầu có cuộc trò chuyện với robot và những người tham gia phỏng vấn được phỏng vấn trong khi và sau thử nghiệm, cảm ứng thành công của con người đã được chấp thuận khi nói chuyện với robot và tiếp tục một cuộc trò chuyện giống như con người trong một thời gian dài; so với các hệ thống loa thông minh nổi tiếng.

Ngoài ra, một nhóm các robot xã hội giao tiếp có tên “CommU” đã được nghiên cứu để phát triển một hệ thống điều khiển hội thoại đa robot. Hệ thống này kiểm soát thời gian của nhiều hành vi đàm thoại của CommU như bắt đầu cuộc trò chuyện, gật đầu và các hành vi giao tiếp không lời. Điều này được thiết lập để thực hiện các tương tác chuyển đổi lần lượt giữa các robot lần lượt như chuyển cuộc trò chuyện, đóng một vai trò cụ thể trong cuộc trò chuyện, thậm chí chuyển đổi vai trò của nhau. Dự án nhận thấy rằng bằng cách hiển thị các cuộc trò chuyện giữa robot với người tương tác, con người cảm thấy rằng cuộc trò chuyện thực sự xảy ra thông qua sự độc lập về tính chính xác của nhận dạng giọng nói (công nghệ cho phép trò chuyện không cần nhận dạng giọng nói). Hơn nữa, cuộc nói chuyện thông qua bao gồm các câu mơ hồ và không rõ ràng, có thể với nhiều hơn một nghĩa/ý định, bởi hai hay nhiều robot giúp con người cảm thấy không có sự mâu thuẫn trong sự độc lập nói chuyện về ý định nói chuyện của con người (công nghệ cho phép nói chuyện mà không phát hiện ý định). Bằng cách sử dụng những kỹ thuật này, cảm giác trò chuyện được thể hiện và nhận thức của con người về cuộc trò chuyện có thể được cải thiện. Nói cách khác, người ta phát hiện ra rằng sự phối hợp của hai hay nhiều robot có thể thiết lập một tình huống xã hội và có thể thúc đẩy trí tưởng tượng của con người để giải thích các quan sát với một hướng đi tích cực, nhờ đó làm giảm sự bất tiện của cuộc đàm thoại.

Cuối cùng, để phát triển các công nghệ hệ thống hội thoại cần thiết cho một robot cố gắng “cùng tồn tại” với con người, và cũng để nghiên cứu một nền tảng cho robot giao tiếp thể hiện trong cuộc sống hàng ngày của con người, “ibuki”, một đứa trẻ giống như android với khả năng di chuyển được phát triển trong dự án này. Nó đã được phát triển không chỉ với mục đích cho phép chuyển động của một android mà còn thúc đẩy các công nghệ trong các tương tác giúp tạo ra mối quan hệ với con người bằng cách có khả năng đi cùng nhau. Dự án mong đợi tạo ra một android đàm thoại tự động, có thể có hoạt động trong cuộc sống hàng ngày của con người.

Những kiến thức thu được từ các nghiên cứu này và sự phát triển của “ibuki” dự kiến sẽ được áp dụng cho việc phát triển các lĩnh vực khác liên quan đến các robot tương tác xã hội tương tự như mục đích cung cấp thông tin, hỗ trợ đời sống và quá trình học tập của con người.

[Hình 1]: Android “ERICA”

“ERICA” là một nền tảng nghiên cứu và phát triển như một android đàm thoại sử dụng nhận dạng giọng nói để duy trì một cuộc trò chuyện tự nhiên với một con người. Nó được trang bị hệ thống nhận dạng đa phương thức, sử dụng nhiều loại cảm biến khác nhau. Ngoài khả năng nói, nó được trang bị các kỹ năng giao tiếp phi ngôn ngữ bao gồm chuyển động, ánh mắt và cảm xúc. Áp dụng các loại phương tiện truyền thông thông tin như vậy, một hệ thống kiểm soát cuộc hội thoại đa phương thức đã được xây dựng bởi ERICA.

[Hình 2]: Hình người “CommU”

“CommU” cung cấp một hình thức trò chuyện mới cho một robot đàm thoại. Nó được thiết kế để hoạt động trong một nhóm robot, trong đó hai hoặc nhiều robot có thể thực hiện một cuộc trò chuyện cùng với một người. Kịch bản này giúp con người cảm thấy một mức độ cao hơn về “cảm giác trò chuyện” với robot. Để làm được điều đó, CommU được trang bị các đơn vị chuyển động khác nhau với mức độ tự do cao: đơn vị nhãn cầu, bộ phận đầu và bộ phận cơ thể. Liên quan đến các đơn vị này ngoài việc giao tiếp bằng lời nói thông thường, robot có khả năng giao tiếp tin phi ngôn ngữ bằng các phương pháp khác nhau, ví dụ: nhiều cách nhìn khác nhau. Với việc sử dụng phương pháp này, robot sẽ có thể có một số hành vi xã hội “tinh tế” của con người, được kỳ vọng sẽ làm tăng “cảm giác trò chuyện” với robot.

[Hình 3]: Android giống như trẻ con “ibuki”

“Ibuki” là một android giống như đứa trẻ con được trang bị một đơn vị di chuyển. Bằng cách chuyển động cùng con người, có một cuộc trò chuyện với nhau và từ đó chia sẻ kinh nghiệm của họ, robot này được kỳ vọng sẽ trở thành một robot giao tiếp có khả năng xây dựng một mối quan hệ sâu sắc hơn với con người. Liên quan đến tính khả thi và các khía cạnh an toàn, một bộ bánh xe được sử dụng làm đơn vị di chuyển của nó. Các đơn vị bao gồm một cặp bánh xe lệch tâm cho phép chuyển động cơ thể ngang và một thiết bị truyền động trục vít điều khiển bóng cho chuyển động cơ thể theo chiều dọc. Điều này tái tạo chuyển động của một chịu ảnh hưởng trọng lực của con người trên robot và thể hiện một chuyển động giống như con người ngay cả với các bánh xe. Ngoài ra, có 47 bậc tự do cho phép nó có các biểu cảm cảm xúc khác nhau như cử chỉ và dấu hiệu tay, cùng các biểu hiện khuôn mặt khác nhau.

Nguyệt Minh

Lược dịch theo Japan Science and Technology Agency


Dự án phát triển một android với hình dạng trẻ con và khả năng di chuyển trên của nhóm nghiên cứu do GS. Hiroshi Ishiguro phụ trách – Giáo sư Đại học Osaka, Thành viên Ủy ban Chuẩn và Thực hành AIWS của Viện Michael Dukakis về Lãnh đạo và Sáng tạo (MDI).