Trang chủCông nghệByteDance ra mắt Seedance 2.5, mô hình video 4K AI gốc dài...

ByteDance ra mắt Seedance 2.5, mô hình video 4K AI gốc dài 30 giây chấp nhận 50 đầu vào tham chiếu

ByteDance đã tiết lộ Seedance 2.5 vào thứ Ba tại hội nghị Volcano Engine FORCE ở Bắc Kinhmột mô hình tạo video tạo ra các clip dài 30 giây ở độ phân giải gốc 4K chỉ từ một lời nhắc. Công ty đã bỏ qua hoàn toàn bốn phiên bản trung gian, nhảy thẳng từ phiên bản tiền nhiệm để báo hiệu điều mà họ mô tả là một bước nhảy vọt mang tính thế hệ.

Bản beta dành cho doanh nghiệp đã có sẵn và dự kiến ra mắt công chúng vào đầu tháng 7. Giám đốc điều hành Liang Rubo phát biểu tại hội nghị rằng việc leo lên hội nghị thượng đỉnh AI là ưu tiên hàng đầu của công ty, với hoạt động kinh doanh theo mô hình dịch vụ đang phát triển thành một hoạt động nền tảng được hỗ trợ bởi đầu tư dài hạn.

Nâng cấp tiêu đề là dung lượng tham chiếu: mô hình chấp nhận tới 50 đầu vào đa phương thức, bao gồm hình ảnh, clip âm thanh, mô hình trắng 3D và tham chiếu kiểu, tăng từ 12 ở phiên bản tiền nhiệm. Những thông tin đầu vào đó mang lại cho Seedance 2.5 khả năng kiểm soát chi tiết hơn nhiều về kiểu dáng, chuyển động và bố cục so với chỉ một lời nhắc văn bản.

TNW City Coworking Space – Nơi công việc tốt nhất của bạn diễn ra

- Quảng cáo -

Một không gian làm việc được thiết kế để phát triển, hợp tác và có cơ hội kết nối vô tận ở trung tâm công nghệ.

Mô hình này tạo ra ở mức 4K nguyên bản thay vì nâng cấp từ độ phân giải thấp hơn, một điểm khác biệt quan trọng đối với quy trình sản xuất chuyên nghiệp. Nó hỗ trợ độ sâu màu 10 bit để có độ chuyển màu mượt mà hơn và có nhiều chỗ hơn cho việc phân loại màu sau sản xuất. ByteDance cũng tuyên bố khả năng tuân thủ nhanh chóng tốt hơn 20%, nghĩa là sẽ có ít thế hệ hơn trước khi có được kết quả có thể sử dụng được.

Âm thanh hiện được đồng xử lý trong cùng không gian tiềm ẩn với tín hiệu hình ảnh, tạo ra sự đồng bộ hóa nguyên gốc giữa các hành động trên màn hình và hiệu ứng âm thanh tương ứng của chúng. Chức năng xem trước hộp trắng 3D mới cho phép người tạo tạo hoạt ảnh có độ trung thực thấp trước khi cam kết hiển thị chất lượng đầy đủ. Cùng với nhau, các tính năng định vị mô hình như một công cụ sản xuất chứ không phải là một công cụ tạo ra tính mới.

Thông báo này được đưa ra ba tháng sau khi ByteDance buộc phải thêm hình mờ và rào chắn IP vào Seedance 2.0 sau những lá thư yêu cầu ngừng hoạt động từ Disney, Warner Bros Discovery, Paramount và Netflix. Một đoạn video deepfake lan truyền về Tom Cruise đánh nhau với Brad Pitt trên sân thượng đã thu hút khiếu nại chính thức từ Hiệp hội Điện ảnh và lời khiển trách từ SAG-AFTRA.

ByteDance đã tạm dừng triển khai toàn cầu vào giữa tháng 3 và không tiếp tục thông qua CapCut cho đến cuối tháng 3, với các bộ lọc chặn khuôn mặt, hình mờ C2PA và tính năng phát hiện ký tự có bản quyền. Không có mốc thời gian nào được đưa ra để cung cấp mô hình mới ở Hoa Kỳ.

- Quảng cáo -

Bối cảnh cạnh tranh đã thay đổi đáng kể kể từ tháng Hai. OpenAI đã đóng cửa Sora vào tháng 3 sau khi công cụ video này đạt đỉnh điểm khoảng một triệu người dùng và được cho là tiêu tốn khoảng một triệu đô la mỗi ngày để vận hành, tạo ra tổng doanh thu chỉ hơn hai triệu đô la.

Veo 3.1 của Google đã lấp đầy phần lớn khoảng trống, cung cấp đầu ra 4K gốc, tạo âm thanh và tối đa ba hình ảnh tham chiếu để kiểm soát phong cách. Nhưng mô hình ByteDance mới vượt xa đáng kể công suất đầu vào tham chiếu của Veo, chấp nhận 50 đầu vào so với 3 đầu vào của Veo, một khoảng cách quan trọng đối với quy trình làm việc chuyên nghiệp.

Thị trường sản xuất video AI đã phân mảnh nhanh chóng, với các mô hình Trung Quốc tiến nhanh hơn về công cụ sản xuất so với các đối thủ phương Tây. Các nền tảng của bên thứ ba như AI Studio của Reallusion đã xây dựng các quy trình chuyên nghiệp xung quanh mô hình tiền nhiệm và công cụ thế hệ thứ tư của Runway đã bị loại khỏi top 10 Phân tích nhân tạo.

Liệu mô hình mới có thể tiếp cận thị trường toàn cầu mà không khơi lại cuộc chiến bản quyền đã làm đình trệ phiên bản tiền nhiệm hay không vẫn là câu hỏi trọng tâm. ByteDance có mô hình, khả năng phân phối thông qua 400 triệu người dùng hoạt động hàng tháng của CapCut và sự tích hợp theo chiều dọc từ tạo, chỉnh sửa đến chia sẻ. Điều mà nó chưa có là một thỏa thuận với Hollywood, và mọi đặc điểm giúp mô hình này có khả năng cao hơn cũng làm tăng nguy cơ xung đột chưa được giải quyết đó.



Nguồn The Next Web

- Có thể bạn thích -
BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Bài viết mới

- Quảng cáo -

Bình luận mới