AI tạo video từ văn bản không còn xa lạ, ngoài ứng dụng Sora của OpenAI có thể kể tới như Lumiere, Video Poet… Vậy, Sora có ưu điểm gì nổi bật và sự ra đời của nó có trở thành lựa chọn hoàn hảo để thay thế con người?
OpenAI Sora tạo video từ văn bản ấn tượng bởi sự chân thật
Sora là sản phẩm mới ra mắt năm nay của OpenAI (tập đoàn công nghệ lớn ở Mỹ). Với khả năng “thấu hiểu sâu sắc ngôn ngữ”, tập đoàn OpenAI đã tạo ra nhiều “cơn sốt” công nghệ AI như ứng dụng tạo hình ảnh tĩnh Dall-E (năm 2012), chatbot AI tổng hợp ChatGPT (năm 2022), đã thu hút được hơn 100 triệu người dùng.
Mới đây, ngày 16/2/2024, OpenAI ra mắt trí tuệ nhân tạo (AI) tạo video từ văn bản, có tên gọi là Sora. Mặc dù ứng dụng mới trong phạm vi thử nghiệm với một nhóm người dùng nhỏ để thu thập các lỗi và nguy cơ tiềm ẩn. Nhưng đây cũng là bước đi kinh ngạc xây xôn xao cộng đồng sáng tạo nội dung truyền thông.
Điều đáng nói, Video được tạo ra từ Sora ấn tượng bởi khả năng thể hiện cảm xúc sinh động, đa dạng về phong cách và chủ đề, tạo ra nhiều cảnh phức tạp với nhiều nhân vật, góc nhìn linh hoạt.
- Sora có thể tạo ra các video dài tới một phút trong khi vẫn duy trì chất lượng hình ảnh và tuân thủ yêu cầu của người dùng.
- Nó có thể tạo ra những đoạn trailer khoa học viễn tưởng thuyết phục, thể hiện khả năng tạo ra các nhân vật giống như ảnh thật và cũng phù hợp với các phong cách điện ảnh cụ thể.
- Cũng có thể làm phim hoạt hình ngắn theo phong cách Pixar, dân chủ hóa hoạt hình và mở ra cơ hội cho bất kỳ ai có trí tưởng tượng.
- Nó có thể thực hiện chủ nghĩa ảnh hiện thực và hoạt hình theo phong cách Pixar, nhưng cũng có thể kết hợp cả hai để tạo ra một số clip siêu thực mà nếu không sẽ phải mất hàng giờ để tạo hoạt ảnh.
Trên Website của mình, OpenAI cho biết: “Chúng tôi đang đào tạo để AI hiểu và mô phỏng thành công thế giới vật lý trong chuyển động”.
Con người do Sora tạo ra giống như thật:
Sora mô tả một con quái vật lông xù theo phong cách Pixar:
Sora thay thế máy bay không người lái:
OpenAI Sora có thể thay thế con người không?
Sử dụng Video để truyền thông, quảng bá hình ảnh, tăng nhận diện thương hiệu đã trở thành một phần không thiếu trong hoạt động Marketing. Sự ra đời của AI tạo video từ văn bản sẽ góp phần không nhỏ trong hoạt động thị thị, giúp tăng tốc độ sản xuất video đúng với yêu cầu của người.
Có thể thấy Sora tạo video từ văn bản mới ra đời ở mức độ trải nghiệm nhưng cũng đã nhận lại những tín hiệu đáng mừng. Bên cạnh đó “mẹ đẻ” OpenAI khẳng định rằng “Sora có khả năng tạo ra các cảnh phức tạp với nhiều nhân vật. Các loại chuyển động của chủ thể và khung nền có thể chính xác đến từng chi tiết. Mô hình không chỉ hiểu những gì người dùng đã yêu cầu trong đề bài, mà còn hiểu cách những thứ đó tồn tại trong thế giới vật lý.” Điều này hứa hẹn về một ứng dụng tạo video chân thật, tự nhiên. Đây sẽ là bước tiến rất lớn trong công nghệ AI tạo video từ văn bản giúp tăng tốc độ làm việc, thúc đẩy hoạt động tiếp thị.
Nhưng đồng thời, chủ sở hữu Sora cũng không ngần ngại thừa nhận về những hạn chế. Theo chuyên trang Techradar, OpenAI đang lo lắng yếu điểm trong việc biểu hiện mối quan hệ giữa nguyên nhân và kết quả (OpenAI admits that it can struggle with “accurately simulating the physics of a complex scene”, understanding “specific instances of cause of effect” and can also “confuse spatial details of a prompt”)
Sora tạo video từ văn bản có nhiều ưu điểm. Thực tế, tận dụng được những ưu điểm của mô hình AI tạo video từ văn bản thì sẽ giúp ích rất nhiều trong hoạt động Marketing. Bởi tiếp thị bằng video có khả năng tiếp cận khách hàng nhanh chóng và hiệu quả, giảm thiểu công việc của con người.
Nhưng cần khẳng định rằng dù có đạt tới trình độ hoàn hảo đến đâu thì AI nói chung vẫn không thể thay thế con người. Bởi AI chỉ có thể mô phỏng bắt chước mà không thể sáng tạo linh hoạt và cảm xúc như con người. Tuy nhiên cần ghi nhận rằng sự ra đời của mô hình AI tạo video bằng văn bản sẽ trở thành công cụ đắc lực của con người trong tương lai, hứa hẹn sẽ mang lại nhiều sản phẩm sinh động.