Trình tạo hình ảnh AI nội bộ đầu tiên của Microsoft, MAI-Image-1, bây giờ đã có sẵn trong hai sản phẩm, Bing Image Creator và Copilot Audio Expressions. Công ty đã công bố mô hình này vào tháng 10. Giám đốc AI của Microsoft Mustafa Suleyman đã viết trong một đăng bài trên X rằng mô hình chuyển văn bản thành hình ảnh sẽ “sắp ra mắt” tại EU.
Suleyman nói thêm rằng mô hình này “thực sự xuất sắc” trong việc tạo ra hình ảnh về đồ ăn và cảnh thiên nhiên, cũng như ánh sáng nghệ thuật và chi tiết quang học.
Microsoft trước đây đã đăng thêm chi tiết về blog của nó: “MAI-Image-1 vượt trội trong việc tạo ra hình ảnh quang học, như ánh sáng (ví dụ: ánh sáng phản chiếu, phản chiếu), phong cảnh, v.v. Điều này đặc biệt đúng khi so sánh với nhiều mô hình lớn hơn, chậm hơn. Sự kết hợp giữa tốc độ và chất lượng có nghĩa là người dùng có thể đưa ý tưởng của mình lên màn hình nhanh hơn, lặp lại nhanh chóng và sau đó chuyển công việc của họ sang các công cụ khác để tiếp tục tinh chỉnh.”
MAI-Image-1 của Microsoft cũng sẽ tạo ra tác phẩm nghệ thuật do AI tạo ra để đi kèm với các câu chuyện âm thanh do AI tạo ra trong “chế độ câu chuyện” của nền tảng chuyển văn bản thành giọng nói của Copilot, Copilot Audio Expressions.
Vào tháng 8, Microsoft đã công bố các mô hình AI nội bộ đầu tiên của họ – mô hình giọng nói MAI-Voice-1 và mô hình dựa trên văn bản MAI-1-preview. Vào thời điểm đó, công ty cho biết họ có kế hoạch sử dụng bản xem trước MAI-1 trong trợ lý Copilot AI của mình trong một số trường hợp chưa xác định, một dấu hiệu cho thấy Microsoft có thể đang chuyển hướng khỏi sự phụ thuộc vào các mô hình của OpenAI. Tính đến hôm nay, Microsoft cho biết Chatbot phi công phụ đang chuyển sang mẫu GPT-5 mới nhất của OpenAI, đồng thời cung cấp các mẫu Claude AI của Anthropic làm tùy chọn cho người dùng.
MAI-Image-1 được liệt kê là một trong ba mô hình AI có sẵn trên trang web và ứng dụng tạo hình ảnh của Bing. Hai mẫu còn lại, DALL-E 3 và GPT-4o, đều đến từ OpenAI.
Nguồn The Verge