Trả lời ngay: Sora là công cụ tạo video ngay lập tức từ văn bản vừa được OpenAI ra mắt ngày 15/02 vừa qua.

 

 

Ảnh chụp màn hình từ video do AI tạo ra về voi ma mút lông cừu. Ảnh: OpenAI

 

 

 

Mô hình ngôn ngữ mới, có biệt danh là Sora theo từ tiếng Nhật có nghĩa là “bầu trời”, có thể tạo ra những thước phim chân thực dài tới một phút tuân thủ hướng dẫn của người dùng về cả chủ đề và phong cách. Theo một bài đăng trên blog của công ty, người mẫu này cũng có thể tạo video dựa trên hình ảnh tĩnh hoặc mở rộng cảnh quay hiện có bằng chất liệu mới.

 

Bài đăng trên blog viết: “Chúng tôi đang dạy AI hiểu và mô phỏng thế giới vật chất đang chuyển động, với mục tiêu đào tạo các mô hình giúp con người giải quyết các vấn đề đòi hỏi sự tương tác trong thế giới thực”.

 

Một video nằm trong số một số ví dụ ban đầu của công ty dựa trên lời nhắc: “Đoạn giới thiệu phim kể về cuộc phiêu lưu của người đàn ông vũ trụ 30 tuổi đội mũ bảo hiểm xe máy dệt kim len màu đỏ, bầu trời xanh, sa mạc muối, phong cách điện ảnh, cảnh quay trên phim 35mm, màu sắc sống động”.

 

Công ty thông báo đã mở quyền truy cập Sora cho một số nhà nghiên cứu và người sáng tạo video. Các chuyên gia sẽ “đội đỏ” sản phẩm – kiểm tra khả năng tuân thủ các điều khoản dịch vụ của OpenAI, nghiêm cấm “bạo lực cực đoan, nội dung tình dục, hình ảnh thù hận, chân dung người nổi tiếng hoặc IP của người khác”, theo bài đăng trên blog của công ty.

 

Công ty chỉ cho phép truy cập hạn chế đối với các nhà nghiên cứu, nghệ sĩ thị giác và nhà làm phim, mặc dù Giám đốc điều hành Sam Altman đã trả lời lời nhắc của người dùng trên Twitter sau thông báo bằng các video clip mà ông nói là do Sora thực hiện. Các video có hình mờ cho thấy chúng được tạo bởi AI.

 

 

 

OpenAI đã ra mắt trình tạo hình ảnh tĩnh Dall-E vào năm 2021 và chatbot AI tổng hợp ChatGPT vào tháng 11 năm 2022, nhanh chóng thu hút được 100 triệu người dùng. Các công ty AI khác đã ra mắt các công cụ tạo video, mặc dù những mô hình đó chỉ có thể tạo ra những đoạn phim ngắn vài giây và thường ít liên quan đến lời nhắc của họ. Google và Meta cho biết họ đang trong quá trình phát triển các công cụ video tổng hợp, mặc dù họ chưa phát hành chúng ra công chúng. Vào thứ Tư, họ đã công bố một thử nghiệm bổ sung bộ nhớ sâu hơn cho ChatGPT để có thể ghi nhớ nhiều cuộc trò chuyện của người dùng hơn.

 

OpenAI không tiết lộ bao nhiêu cảnh quay đã được sử dụng để đào tạo Sora hoặc các video đào tạo có thể bắt nguồn từ đâu, ngoài việc nói với New York Times rằng kho tài liệu chứa các video được cung cấp công khai và được cấp phép từ chủ sở hữu bản quyền. Công ty đã bị kiện nhiều lần vì bị cáo buộc vi phạm bản quyền trong việc đào tạo các công cụ AI tổng hợp, có khả năng xử lý lượng tài liệu khổng lồ được lấy từ Internet và bắt chước hình ảnh hoặc văn bản có trong các bộ dữ liệu đó.