Các nhà nghiên cứu của KAIST đã phát triển một phương pháp thị giác AI được xây dựng để giải quyết một vấn đề mà các nhà sản xuất điện thoại không thể bỏ qua mãi mãi. Upsample Anything xây dựng lại các tính năng hình ảnh có độ phân giải cao từ dữ liệu hình ảnh nén, nhằm mục đích làm cho AI trên thiết bị sắc nét hơn mà không yêu cầu ngân sách bộ nhớ lớn hơn nhiều.
Điện thoại đã dựa vào khả năng nén để giữ cho trí thông minh dựa trên máy ảnh luôn hoạt động nhanh chóng. Sự đánh đổi là các vật thể nhỏ, cạnh mỏng và các khiếm khuyết nhỏ có thể bị loại bỏ trước khi hệ thống thị giác có đủ chi tiết để xử lý.
Video được đề xuất
Thật khó để bỏ lỡ con số tiêu đề của nhóm KAIST. Nó cho biết Upsample Anything có thể khôi phục thông tin hình ảnh gần giống với hình ảnh gốc đồng thời cải thiện hiệu suất bộ nhớ GPU lên tới 16 lần.
KAIST
Làm sao nó thấy được nhiều hơn với ít hơn
Upsample Bất cứ điều gì không buộc đường dẫn tầm nhìn đầy đủ phải chạy ở độ phân giải cao ngay từ đầu. Nó hoạt động với các bản đồ đặc trưng có độ phân giải thấp hơn, sau đó sử dụng các cạnh và cấu trúc của hình ảnh đầu vào để tái tạo lại các đặc điểm có độ phân giải cao hơn.
Sơ đồ quy trình làm việc ở trang 4 hiển thị đường dẫn của phương pháp. Hình ảnh có độ phân giải cao được giảm bớt, được xây dựng lại thông qua tối ưu hóa thời gian thử nghiệm và được sử dụng để tìm hiểu các hạt nhân khôi phục có thể nâng bản đồ tính năng có độ phân giải thấp hơn thành chi tiết tốt hơn.
Nó cũng không cần đào tạo nên không cần một đợt đào tạo mô hình mới trước khi áp dụng cho dữ liệu mới. Điều đó mang lại cho nó một con đường rõ ràng hơn vào các môi trường khác nhau so với các phương pháp dựa vào đào tạo lại hoặc tối ưu hóa nặng nề hơn.
Tại sao điện thoại lại là điểm áp lực
Điện thoại thông minh không có khoảng trống nhiệt hoặc bộ nhớ như phần cứng AI lớn hơn, nhưng AI trực quan đang tiến gần hơn đến thiết bị. Các tính năng của máy ảnh, công cụ nhận dạng và tác vụ nhận thức cục bộ đều gây áp lực lên các chip không thể đốt thêm bộ nhớ GPU mỗi khi chi tiết mỏng đi.
KAIST đã thử nghiệm phương pháp này bằng cách sử dụng hình ảnh 224 x 224, kích thước phổ biến trong nghiên cứu AI và báo cáo thời gian tính toán là khoảng 0,4 giây. Điều đó không chứng minh hiệu suất sẵn sàng của điện thoại, nhưng nó mang lại cho nghiên cứu một dấu hiệu hiệu quả cụ thể thay vì một lời hứa mơ hồ.

Những gì vẫn phải làm việc
Upsample Mọi thứ vẫn đang trong quá trình nghiên cứu, chưa phải là một tính năng sẵn sàng được đưa vào ứng dụng camera trên điện thoại. Tác phẩm đã được đăng trên arXiv và được chấp nhận tham gia CVPR 2026, nơi nó đã được công nhận về hiệu quả tính toán và tính minh bạch trong nghiên cứu.
Thử nghiệm tiếp theo là triển khai thực tế. Các nhà sản xuất điện thoại và nhà phát triển ứng dụng sẽ cần chứng minh rằng tầm nhìn địa phương sắc nét hơn không tạo ra các vấn đề mới về pin, nhiệt độ hoặc độ trễ trên phần cứng di động thực.
Nguồn DigitalTrend