AI hỗ trợ giao tiếp cho người bị liệt và không thể nói do đột quỵ

(Ảnh:SBS)

Trí thông minh nhân tạo đang giúp tạo ra giọng nói và cả khuôn mặt biểu cảm trên màn hình cho những người bị đột quỵ và một số bệnh nhân khác. Công nghệ kết nối não bộ với máy tính là công nghệ đầu tiên được phát triển trên thế giới tại Phòng thí nghiệm Chang thuộc Đại học California Berkeley.

Các tin tức về trí thông minh nhân tạo thường bị chi phối theo cách phát triển công nghệ để bắt chước ngôn từ và ý tưởng của con người.

Mới đây tờ The Atlantic tiết lộ hàng ngàn cuốn sách của các nhà văn đã bị sử dụng trái phép để tạo các mô hình ngôn ngữ lớn.

Các tác phẩm vi phạm bản quyền bao gồm tác phẩm của những nhà văn danh tiếng như Margaret Atwood, Stephen King và Elena Ferrante.

Những trường hợp như vậy đã đặt ra những câu hỏi nghiêm túc về đạo đức, về những gì con người sẽ mất khi AI sử dụng ngôn ngữ của chúng ta để tự cải thiện.

Nhưng nếu AI có thể đáp lại lời nói của chúng ta thì sao?

Khả năng đó đang được các nhà khoa học tại Phòng thí nghiệm Chang của Đại học California Berkeley khám phá.

Họ đang đào tạo một máy tính được AI hỗ trợ để giúp những bệnh nhân đột quỵ, liệt hoặc các bệnh khác về khả năng giao tiếp bằng lời nói.

Nghiên cứu sinh Kaylo Littlejohn là một trong những người dẫn đầu cuộc nghiên cứu.

"Nó gần giống như một loại giọng nói kỹ thuật số. Nó thay thế chức năng bị mất của người bệnh. Và nó là cầu nối từ não đến lời nói, sử dụng các tín hiệu thần kinh tương ứng với chuyển động của cơ hoặc chuyển động của thanh quản."

Công nghệ kết nối não bộ với máy tính là một chuyên ngành được Edward Chang phát triển tại phòng thí nghiệm.

Công nghệ này không chỉ giải mã tín hiệu từ não và chuyển chúng thành lời nói mà còn có thể thể hiện những nét mặt biểu cảm.

“Đây là lần đầu tiên trên thế giới, lời nói và nét mặt được giải mã từ tín hiệu não.”

Điều này đã thay đổi cuộc đời của Ann Johnson, một người tham gia nghiên cứu.

Cô bị đột quỵ ở tuổi 30, não bị tổn thương và không thể nói chuyện hay cử động cánh tay.

Ông Littlejohn nói rằng khi chứng kiến cô Johnson giao tiếp thông qua AI, tất cả những người liên quan đều cảm thấy xúc động.

“Điều đó rất khích lệ và thú vị. Đối với bản thân tôi, tôi cảm thấy xúc động và ấm lòng khi thấy tất cả công việc này trở thành hiện thực và biết rằng chúng ta thực sự có thể giải mã lời nói từ não. Và đây là bằng chứng đầu tiên về nguyên tắc tổng hợp giọng nói dễ hiểu và quản lý hình đại diện của một người không thể nói. Từ phản hồi của Ann, chúng tôi biết rằng đây là khoảnh khắc vô cùng xúc động đối với cô ấy. Thật tuyệt khi chúng tôi có thể khôi phục lại giọng nói cá nhân của cô ấy, bởi vì khía cạnh cá nhân đó, khía cạnh con người đó, thực sự rất quan trọng."

Trước đây, Johnson dùng bảng viết để giao tiếp.

Điều đó cho phép cô đánh vần các từ bằng cách sử dụng chuyển động nhỏ của đầu để tạo thành các chữ cái, với tốc độ khoảng 14 từ mỗi phút.

Với máy tính hỗ trợ AI của Chang, số từ đã tăng lên 78.

Điều đó gần giống với lời nói của con người hơn, vốn hoạt động tự nhiên ở khoảng từ 140 đến 160 từ mỗi phút.

Vậy chính xác thì công nghệ này hoạt động như thế nào?

“Tóm lại, một thiết bị ghi vào thần kinh được đặt trên bề mặt não của Ann. Những tín hiệu được ghi lại từ não của cô ấy, rồi được gửi đến một cái giá đỡ, gắn trên đỉnh hộp sọ của cô ấy, rồi chuyển đến một máy tính, nơi mà mô hình AI chuyển đổi các tín hiệu thần kinh thành văn bản được giải mã, tổng hợp giọng nói có thể nghe được và hình ảnh trên khuôn mặt đại diện. Và sau đó những kết quả đầu ra đó sẽ được hiển thị cho cả cô ấy và bất kỳ ai đang nhìn vào. Và điều này cho phép cô ấy giao tiếp bằng cách sử dụng bộ phận giả thần kinh để nói.”

Những người ngồi cùng cô Johnson có thể nhìn khuôn mặt đại diện có chuyển động khi nghe thấy lời nói phát ra.

Biểu cảm trên khuôn mặt đến từ một hình đại diện do cô Johnson chọn và cá nhân hóa. Giọng nói của nó được bắt nguồn từ giọng nói của chính cô, được ghi lại trên một đoạn video quay tại đám cưới của cô.

Tuy nhiên, hiện tại, bạn khó có thể nhầm lẫn hình đại diện AI với giọng nói của con người.

Ông Littlejohn cho biết nhóm muốn tiếp tục cải thiện độ chính xác và tin rằng họ có thể tạo ra giải pháp khả thi về mặt lâm sàng.

Họ hy vọng sẽ xây dựng được dự án bằng cách thu nhỏ kích thước của máy chạy các mô hình giải mã AI và bằng cách tạo kết nối không dây.

Hiện tại, công nghệ này đã mang lại nụ cười trên khuôn mặt của Ann Johnson - và đó là nụ cười mà cô có thể chia sẻ với mọi người.