Bộ phận AI của Microsoft được công bố Nhà đầu tiên của nó Các mô hình AI vào thứ năm: Mai-woice-1 AI và Mai-1-Preview. Công ty cho biết mô hình bài phát biểu Mai-Bonice-1 mới của họ có thể tạo ra âm thanh trị giá một phút trong vòng một giây chỉ trên một GPU, trong khi Mai-1-Preview Hồi cung cấp một cái nhìn thoáng qua về các dịch vụ trong tương lai bên trong Copilot.
Microsoft đã sử dụng MA1-VOICE-1 để cung cấp năng lượng cho một vài tính năng của nó, bao gồm cả Copilot hàng ngàycó một máy chủ AI đọc thuộc lòng những câu chuyện tin tức hàng đầu của ngày và để tạo ra các cuộc thảo luận theo phong cách podcast để giúp giải thích các chủ đề.
Bạn có thể thử MA1-VOICE-1 cho chính mình Trên phòng thí nghiệm Copilotnơi bạn có thể nhập những gì bạn muốn mô hình AI nói, cũng như thay đổi giọng nói và phong cách nói của nó. Ngoài mô hình này, Microsoft đã giới thiệu Mai-1-Preview, cho biết họ đã đào tạo về khoảng 15.000 GPU NVIDIA H100. Nó được xây dựng cho người dùng cần mô hình AI có khả năng làm theo các hướng dẫn và cung cấp các câu trả lời hữu ích cho các truy vấn hàng ngày.
Trưởng Microsoft AI Mustafa Suleyman đã nói trong một tập của Bộ giải mã Năm ngoái, các mô hình AI nội bộ của công ty không tập trung vào các trường hợp sử dụng doanh nghiệp. Logic của tôi là chúng tôi phải tạo ra một cái gì đó hoạt động rất tốt cho người tiêu dùng và thực sự tối ưu hóa cho trường hợp sử dụng của chúng tôi, theo ông Su Suleyman. Vì vậy, chúng tôi có rất nhiều dữ liệu rất dự đoán và rất hữu ích về phía AD, về từ xa người tiêu dùng, v.v.
Công ty có kế hoạch tung ra Mai-1-Preview cho một số trường hợp sử dụng văn bản trong một trợ lý AI Copilot, hiện đang dựa vào các mô hình ngôn ngữ lớn của Openai. Nó cũng đã bắt đầu thử nghiệm công khai mô hình Mai-1 Preview của mình trên nền tảng điểm chuẩn AI Lmarena.
Chúng tôi có tham vọng lớn về nơi chúng tôi đi tiếp theo, Microsoft Microsoft viết trong bài đăng trên blog. Chúng tôi không chỉ theo đuổi những tiến bộ hơn nữa ở đây, mà chúng tôi tin rằng việc phối hợp một loạt các mô hình chuyên dụng phục vụ các trường hợp sử dụng và ý định khác nhau của người dùng sẽ mở khóa giá trị to lớn.
Nguồn The Verge