Tầm nhìn AI đang quá đói và phương pháp này khiến nó phải ăn kiêng

18/06/2026

0

Các nhà nghiên cứu của KAIST đã phát triển một phương pháp thị giác AI được xây dựng để giải quyết một vấn đề mà các nhà sản xuất điện thoại không thể bỏ qua mãi mãi. Upsample Anything xây dựng lại các tính năng hình ảnh có độ phân giải cao từ dữ liệu hình ảnh nén, nhằm mục đích làm cho AI trên thiết bị sắc nét hơn mà không yêu cầu ngân sách bộ nhớ lớn hơn nhiều.

Điện thoại đã dựa vào khả năng nén để giữ cho trí thông minh dựa trên máy ảnh luôn hoạt động nhanh chóng. Sự đánh đổi là các vật thể nhỏ, cạnh mỏng và các khiếm khuyết nhỏ có thể bị loại bỏ trước khi hệ thống thị giác có đủ chi tiết để xử lý.

Video được đề xuất

Thật khó để bỏ lỡ con số tiêu đề của nhóm KAIST. Nó cho biết Upsample Anything có thể khôi phục thông tin hình ảnh gần giống với hình ảnh gốc đồng thời cải thiện hiệu suất bộ nhớ GPU lên tới 16 lần.

- Quảng cáo -

KAIST

Mục lục

Làm sao nó thấy được nhiều hơn với ít hơn

Upsample Bất cứ điều gì không buộc đường dẫn tầm nhìn đầy đủ phải chạy ở độ phân giải cao ngay từ đầu. Nó hoạt động với các bản đồ đặc trưng có độ phân giải thấp hơn, sau đó sử dụng các cạnh và cấu trúc của hình ảnh đầu vào để tái tạo lại các đặc điểm có độ phân giải cao hơn.

Sơ đồ quy trình làm việc ở trang 4 hiển thị đường dẫn của phương pháp. Hình ảnh có độ phân giải cao được giảm bớt, được xây dựng lại thông qua tối ưu hóa thời gian thử nghiệm và được sử dụng để tìm hiểu các hạt nhân khôi phục có thể nâng bản đồ tính năng có độ phân giải thấp hơn thành chi tiết tốt hơn.

Nó cũng không cần đào tạo nên không cần một đợt đào tạo mô hình mới trước khi áp dụng cho dữ liệu mới. Điều đó mang lại cho nó một con đường rõ ràng hơn vào các môi trường khác nhau so với các phương pháp dựa vào đào tạo lại hoặc tối ưu hóa nặng nề hơn.

- Quảng cáo -

Tại sao điện thoại lại là điểm áp lực

Điện thoại thông minh không có khoảng trống nhiệt hoặc bộ nhớ như phần cứng AI lớn hơn, nhưng AI trực quan đang tiến gần hơn đến thiết bị. Các tính năng của máy ảnh, công cụ nhận dạng và tác vụ nhận thức cục bộ đều gây áp lực lên các chip không thể đốt thêm bộ nhớ GPU mỗi khi chi tiết mỏng đi.

KAIST đã thử nghiệm phương pháp này bằng cách sử dụng hình ảnh 224 x 224, kích thước phổ biến trong nghiên cứu AI và báo cáo thời gian tính toán là khoảng 0,4 giây. Điều đó không chứng minh hiệu suất sẵn sàng của điện thoại, nhưng nó mang lại cho nghiên cứu một dấu hiệu hiệu quả cụ thể thay vì một lời hứa mơ hồ.

Ứng dụng AI được cài đặt trên iPhone Gemini DeepSeek Claude ChatGPT Auren

Aerps / Bapt

Những gì vẫn phải làm việc

Upsample Mọi thứ vẫn đang trong quá trình nghiên cứu, chưa phải là một tính năng sẵn sàng được đưa vào ứng dụng camera trên điện thoại. Tác phẩm đã được đăng trên arXiv và được chấp nhận tham gia CVPR 2026, nơi nó đã được công nhận về hiệu quả tính toán và tính minh bạch trong nghiên cứu.

- Quảng cáo -

Thử nghiệm tiếp theo là triển khai thực tế. Các nhà sản xuất điện thoại và nhà phát triển ứng dụng sẽ cần chứng minh rằng tầm nhìn địa phương sắc nét hơn không tạo ra các vấn đề mới về pin, nhiệt độ hoặc độ trễ trên phần cứng di động thực.

Nguồn DigitalTrend

- Có thể bạn thích -

Bài trước

Thùng rác sẽ đi đâu sau khi được thu thập? Điều gì thực sự xảy ra với chất thải được giải thích

BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn

Vui lòng nhập tên của bạn ở đây

Bạn đã nhập một địa chỉ email không chính xác!

Vui lòng nhập địa chỉ email của bạn ở đây

Tầm nhìn AI đang quá đói và phương pháp này khiến nó phải ăn kiêng

Làm sao nó thấy được nhiều hơn với ít hơn

Tại sao điện thoại lại là điểm áp lực

Những gì vẫn phải làm việc

Mũi điện nhỏ lạ có thể là mảnh ghép còn thiếu cho tủ lạnh thông minh

Trình chỉnh sửa hình ảnh AI của Google Photos mở rộng tới nhiều khu vực hơn, nhưng chỉ dành cho người dùng Android

Google đang cung cấp cho Ảnh chụp màn hình Pixel tăng cường AI trên đám mây trong khi vẫn giữ dữ liệu của bạn...

Một bang Mỹ muốn cấm đeo kính thông minh khi lái xe, có thể mở hộp Pandora

Epic Games vừa thực hiện một bước tiến lớn hướng tới trò chơi do AI xây dựng với Unreal Engine 5.8

Trang Lên lịch mới của ChatGPT đặt tất cả các tác vụ tự động của bạn ở một nơi

BÌNH LUẬN

Bài viết mới

Thùng rác sẽ đi đâu sau khi được thu thập? Điều gì thực sự xảy ra với chất thải được giải thích

Anh v New Zealand: Bài kiểm tra nam thứ hai, ngày thứ hai – trực tiếp

Tesco đang di chuyển 40.000 máy chủ khỏi VMware và kiện Broadcom đòi hơn 100 triệu bảng Anh

Boris Johnson đã đứng về phía một người rất quan trọng – mẹ của Nigel Farage

Bình luận mới

BẢI VIẾT CHỌN LỌC

BÀI VIẾT NÔI BẬT

Ngôi sao của BBC Dragons ‘Den xác nhận các tập cuối sau thông báo xuất cảnh

Vận động viên cưỡi ngựa giành huy chương vàng rút lui khỏi Thế vận hội sau khi video cho thấy “sai lầm trong phán...

Tom Brady và Bridget Moynahan đoàn tụ tại lễ tốt nghiệp trung học của con trai Jack

DANH MỤC NỔI BẬT

ABOUT US

FOLLOW US