Trang chủKhácTầm nhìn AI đang quá đói và phương pháp này khiến nó...

Tầm nhìn AI đang quá đói và phương pháp này khiến nó phải ăn kiêng

Các nhà nghiên cứu của KAIST đã phát triển một phương pháp thị giác AI được xây dựng để giải quyết một vấn đề mà các nhà sản xuất điện thoại không thể bỏ qua mãi mãi. Upsample Anything xây dựng lại các tính năng hình ảnh có độ phân giải cao từ dữ liệu hình ảnh nén, nhằm mục đích làm cho AI trên thiết bị sắc nét hơn mà không yêu cầu ngân sách bộ nhớ lớn hơn nhiều.

Điện thoại đã dựa vào khả năng nén để giữ cho trí thông minh dựa trên máy ảnh luôn hoạt động nhanh chóng. Sự đánh đổi là các vật thể nhỏ, cạnh mỏng và các khiếm khuyết nhỏ có thể bị loại bỏ trước khi hệ thống thị giác có đủ chi tiết để xử lý.

Video được đề xuất

Thật khó để bỏ lỡ con số tiêu đề của nhóm KAIST. Nó cho biết Upsample Anything có thể khôi phục thông tin hình ảnh gần giống với hình ảnh gốc đồng thời cải thiện hiệu suất bộ nhớ GPU lên tới 16 lần.

- Quảng cáo -

KAIST

Làm sao nó thấy được nhiều hơn với ít hơn

Upsample Bất cứ điều gì không buộc đường dẫn tầm nhìn đầy đủ phải chạy ở độ phân giải cao ngay từ đầu. Nó hoạt động với các bản đồ đặc trưng có độ phân giải thấp hơn, sau đó sử dụng các cạnh và cấu trúc của hình ảnh đầu vào để tái tạo lại các đặc điểm có độ phân giải cao hơn.

Sơ đồ quy trình làm việc ở trang 4 hiển thị đường dẫn của phương pháp. Hình ảnh có độ phân giải cao được giảm bớt, được xây dựng lại thông qua tối ưu hóa thời gian thử nghiệm và được sử dụng để tìm hiểu các hạt nhân khôi phục có thể nâng bản đồ tính năng có độ phân giải thấp hơn thành chi tiết tốt hơn.

Nó cũng không cần đào tạo nên không cần một đợt đào tạo mô hình mới trước khi áp dụng cho dữ liệu mới. Điều đó mang lại cho nó một con đường rõ ràng hơn vào các môi trường khác nhau so với các phương pháp dựa vào đào tạo lại hoặc tối ưu hóa nặng nề hơn.

- Quảng cáo -

Tại sao điện thoại lại là điểm áp lực

Điện thoại thông minh không có khoảng trống nhiệt hoặc bộ nhớ như phần cứng AI lớn hơn, nhưng AI trực quan đang tiến gần hơn đến thiết bị. Các tính năng của máy ảnh, công cụ nhận dạng và tác vụ nhận thức cục bộ đều gây áp lực lên các chip không thể đốt thêm bộ nhớ GPU mỗi khi chi tiết mỏng đi.

KAIST đã thử nghiệm phương pháp này bằng cách sử dụng hình ảnh 224 x 224, kích thước phổ biến trong nghiên cứu AI và báo cáo thời gian tính toán là khoảng 0,4 giây. Điều đó không chứng minh hiệu suất sẵn sàng của điện thoại, nhưng nó mang lại cho nghiên cứu một dấu hiệu hiệu quả cụ thể thay vì một lời hứa mơ hồ.

Ứng dụng AI được cài đặt trên iPhone Gemini DeepSeek Claude ChatGPT Auren

Aerps / Bapt

Những gì vẫn phải làm việc

Upsample Mọi thứ vẫn đang trong quá trình nghiên cứu, chưa phải là một tính năng sẵn sàng được đưa vào ứng dụng camera trên điện thoại. Tác phẩm đã được đăng trên arXiv và được chấp nhận tham gia CVPR 2026, nơi nó đã được công nhận về hiệu quả tính toán và tính minh bạch trong nghiên cứu.

- Quảng cáo -

Thử nghiệm tiếp theo là triển khai thực tế. Các nhà sản xuất điện thoại và nhà phát triển ứng dụng sẽ cần chứng minh rằng tầm nhìn địa phương sắc nét hơn không tạo ra các vấn đề mới về pin, nhiệt độ hoặc độ trễ trên phần cứng di động thực.



Nguồn DigitalTrend

- Có thể bạn thích -
BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Bài viết mới

- Quảng cáo -

Bình luận mới