Trang chủKhácDLSS 4 của Nvidia không như bạn nghĩ. Hãy lật tẩy những...

DLSS 4 của Nvidia không như bạn nghĩ. Hãy lật tẩy những huyền thoại

CES 2025 Đọc và xem toàn bộ phạm vi phủ sóng CES của chúng tôi tại đây Đã cập nhật chưa đầy 1 giờ trước Mục lục

Nvidia đã thu hút sự chú ý tại CES 2025 với việc công bố RTX 5090 và mặc dù có rất nhiều tranh luận về mức giá 2.000 USD của thẻ, nó mở ra rất nhiều công nghệ mới. Đứng đầu trong số đó là DLSS 4, mang đến khả năng tạo nhiều khung hình cho GPU của Nvidia, mang lại hiệu suất tăng gấp 4 lần trong hơn 75 trò chơi ngay khi GPU dòng RTX 50 mới của Nvidia xuất hiện trên đường phố.

Tuy nhiên, tôi đã thấy có quá nhiều sự hiểu lầm về cách thức hoạt động của DLSS 4. Giữa những nhận xét sai lệch từ Giám đốc điều hành của Nvidia và việc thiết kế lại hoàn toàn cách thức hoạt động của DLSS, không có gì ngạc nhiên khi có thông tin sai lệch về công nghệ mới, khả năng của nó và quan trọng là những hạn chế của nó.

Vì vậy, hãy lập kỷ lục, ít nhất là nhiều nhất có thể trước khi card đồ họa mới của Nvidia ra mắt và tất cả chúng ta đều được trải nghiệm trực tiếp những gì DLSS 4 mang lại.

Không, nó không ‘dự đoán tương lai’

Giám đốc điều hành Nvidia Jensen trước phông nền.Nvidia

Một trong những vấn đề chính về việc hiểu đúng cách hoạt động của DLSS 4 xuất phát từ nhận xét của Giám đốc điều hành Nvidia Jensen Huang đưa ra trong phần Hỏi đáp. Jarred Walton ở Phần cứng của Tom đã hỏi Huang về cách DLSS 4 hoạt động ở cấp độ kỹ thuật và Huang đã dứt khoát phủ nhận rằng DLSS 4 sử dụng phép nội suy khung. Ông nói rằng DLSS 4 “dự đoán tương lai” thay vì “nội suy quá khứ”. Đó chắc chắn là một trích dẫn ồn ào. Thật tệ là nó không chính xác.

Trước đây, Huang đã viết rất nhiều về việc tạo khung DLSS và mặc dù kiểu đóng khung này có tác dụng giải thích một công nghệ như DLSS 4 cho khán giả phổ thông, nhưng nó cũng dẫn đến một số hiểu lầm về cách thức hoạt động thực sự của nó. Sau trích dẫn này, tôi thực sự đã có một số độc giả liên hệ nói với tôi rằng tôi đã hiểu sai cách hoạt động của DLSS 4. Hóa ra tôi không hiểu nhầm cách thức hoạt động của nó, nhưng tôi hiểu tại sao lại có nhiều nhầm lẫn.

Việc tạo nhiều khung của DLSS 4 sử dụng một kỹ thuật gọi là nội suy khung. Đây là kỹ thuật tương tự mà chúng ta đã thấy trong DLSS 3 và cũng là kỹ thuật bạn sẽ tìm thấy trong các công cụ tạo khung khác như Lossless Scaling và FSR 3 của AMD. Nội suy khung hoạt động như thế này: Card đồ họa của bạn hiển thị hai khung hình và sau đó là một khung hình. thuật toán bước vào để tính toán sự khác biệt giữa các khung đó. Sau đó, nó “tạo” một khung hình để xen vào giữa, đoán xem khung hình xen kẽ sẽ trông như thế nào dựa trên sự khác biệt giữa hai khung hình được hiển thị.

Biểu đồ chuyển động qua DLSS 3 của Nvidia.Nvidia

Và DLSS 4 sử dụng phép nội suy khung. Đã có một số nghiên cứu ban đầu về các kỹ thuật mới để tạo khung – đặc biệt là nghiên cứu của Intel về phép ngoại suy khung – nhưng vẫn còn ở giai đoạn đầu cho công nghệ đó. Có một số chi tiết tôi chưa thể chia sẻ nhưng hiện tại tôi đã xác nhận với nhiều nguồn rằng DLSS 4 trên thực tế đang sử dụng phép nội suy khung. Nó cũng có ý nghĩa. Những loại công cụ kết xuất này không tự nhiên xuất hiện và hầu như luôn có rất nhiều tài liệu nghiên cứu trước khi bất kỳ kỹ thuật kết xuất mới nào được biến thành sản phẩm có thể bán được trên thị trường như DLSS 4.

Điều đó không làm mất đi khả năng của DLSS 4. Nó có thể sử dụng kỹ thuật tương tự như DLSS 3 để tạo khung hình mới, nhưng điều đó sẽ không làm bạn phân tâm khỏi những gì DLSS 4 thực sự có thể làm.

Độ trễ không phải là vấn đề bạn nghĩ

Tiện ích độ trễ trong Special K.Jacob Roach / Xu hướng kỹ thuật số

Tôi hiểu tại sao Nvidia không muốn bình luận nhiều về việc sử dụng nội suy khung của DLSS 4. Đó là vì phép nội suy khung sẽ gây ra độ trễ. Bạn cần kết xuất hai khung hình và sau đó thực hiện phép nội suy trước khung hình đầu tiên trong chuỗi được hiển thị, vì vậy khi sử dụng bất kỳ công cụ nội suy khung hình nào, về cơ bản bạn đang phát với độ trễ nhẹ. Giả định mà tôi đã thấy là những khung hình bổ sung này làm tăng độ trễ một cách tuyến tính, nhưng thực tế không phải vậy.

The Verge tỏ ra lo lắng cho biết họ muốn “xem công nghệ tạo khung hình mới ảnh hưởng như thế nào đến độ trễ” trong khi TechSpot đã tuyên bố rằng “người dùng lo ngại rằng việc hiển thị nhiều khung hình có thể làm tăng thêm [latency] vấn đề.” Đó là một biện pháp tự nhiên đối phó với số lượng khung hình “giả” mà DLSS 4 có thể tạo ra. Nếu việc tạo một khung hình gây ra vấn đề về độ trễ thì chắc chắn việc tạo ra ba khung hình trong số đó sẽ gây ra vấn đề về độ trễ lớn hơn. Nhưng đó không phải là cách nó hoạt động.

Đây là lý do tại sao điều quan trọng là phải hiểu rằng DLSS 4 sử dụng phép nội suy khung. Ý tưởng phát ở chế độ trễ không có gì khác biệt giữa DLSS 3 tạo thêm một khung hình và DLSS 4 tạo thêm ba khung hình bổ sung — quá trình này vẫn liên quan đến việc hiển thị hai khung hình và so sánh sự khác biệt giữa chúng. Độ trễ của bạn không tăng đáng kể giữa việc chèn một, hai hoặc ba khung hình bổ sung vào giữa hai khung hình được hiển thị. Bất kể số lượng khung hình ở giữa là bao nhiêu thì độ trễ được thêm vào bởi quá trình nội suy khung phần lớn là như nhau.

Hãy để tôi minh họa điều này. Giả sử bạn đang chơi một trò chơi ở tốc độ 60 khung hình/giây (khung hình/giây). Điều đó có nghĩa là có 16,6 mili giây giữa mỗi khung hình bạn nhìn thấy. Với DLSS 3, tốc độ khung hình của bạn sẽ tăng gấp đôi lên 120 khung hình/giây nhưng độ trễ không giảm một nửa xuống còn 8,3 mili giây. Trò chơi trông mượt mà hơn nhưng vẫn có 16,6 mili giây giữa mỗi khung hình được hiển thị. Với DLSS 4, bạn sẽ có thể đạt tốc độ lên tới 240 khung hình/giây, tăng gấp bốn lần tốc độ khung hình, nhưng một lần nữa, độ trễ không giảm xuống 4,2 mili giây. Nó vẫn như cũ 16,6ms.

Đây là một cái nhìn rất ngắn gọn về độ trễ của PC — có chi phí cần thiết để DLSS Frame Generation chạy, cộng với độ trễ do màn hình và chuột của bạn thêm vào — nhưng sẽ hữu ích khi hiểu rằng độ trễ lõi không tăng tuyến tính khi thêm nhiều khung hình vào khung quá trình nội suy. Thời gian giữa mỗi khung hình được hiển thị không thay đổi. Độ trễ mà bạn gặp phải phần lớn vẫn là kết quả của tốc độ khung hình cơ bản trước khi tạo khung DLSS và chi phí chung mà công cụ có.

DLSS 4 trên Nvidia RTX 5080 Cái nhìn đầu tiên: Super Res + Multi Frame-Gen trên Cyberpunk 2077 RT Overdrive!

Bạn không cần phải tin lời tôi về điều đó. Digital Foundry đã thử nghiệm DLSS 4, bao gồm cả độ trễ và nhận thấy chính xác những gì tôi vừa mô tả. “Đối với tôi, có vẻ như phần lớn độ trễ tăng thêm vẫn đến từ việc đệm khung hình bổ sung đó, nhưng việc thêm các khung hình trung gian khác sẽ khiến độ trễ tăng lên tương đối tối thiểu,” viết Richard Leadbetter của Digital Foundry. Độ trễ bổ sung nhỏ chỉ đơn giản đến từ việc DLSS tính toán nhiều khung hình hơn ở giữa hai khung hình đã được hiển thị, do đó phần lớn độ trễ tăng lên với DLSS 4 không khác nhiều so với DLSS 3.

Vấn đề về độ trễ với DLSS 4 phần lớn cũng giống như với DLSS 3. Nếu bạn đang chơi ở tốc độ khung hình cơ bản thấp, sẽ có sự mất kết nối giữa khả năng phản hồi mà bạn đang trải nghiệm và độ mượt mà bạn đang thấy. Việc ngắt kết nối đó sẽ quan trọng hơn với DLSS 4, nhưng điều đó không đột nhiên có nghĩa là độ trễ tăng lên đáng kể. Đó là lý do tại sao Reflex 2 mới đầy ấn tượng của Nvidia không cần thiết cho DLSS 4; Giống như DLSS 3, các nhà phát triển chỉ cần triển khai phiên bản Reflex đầu tiên để DLSS 4 hoạt động.

Một mô hình hoàn toàn mới

Giới thiệu về cách hoạt động của DLSS 4.Nvidia

Việc làm rõ cách thức hoạt động của DLSS 4 có thể khiến bạn tin rằng nó giống nhau hơn, nhưng thực tế không phải vậy. DLSS 4 là một sự khác biệt rất quan trọng so với DLSS 3, đó là vì nó sử dụng mô hình AI hoàn toàn khác. Hay tôi nên nói là các mô hình AI. Như chi tiết của NvidiaDLSS 4 chạy năm mô hình AI riêng biệt cho từng khung hình được hiển thị khi sử dụng Siêu phân giải, Tái tạo tia và Tạo nhiều khung hình, tất cả đều cần thực thi trong vài mili giây.

Do những gì DLSS 4 đòi hỏi, Nvidia đã loại bỏ Mạng thần kinh Convolution trước đây hoặc CNN và hiện đang sử dụng mô hình biến đổi tầm nhìn. Có hai thay đổi lớn với mô hình máy biến áp. Đầu tiên là thứ được gọi là “sự chú ý đến bản thân”. Mô hình có thể theo dõi tầm quan trọng của các pixel khác nhau trên nhiều khung hình. Việc tự tham khảo theo cách này sẽ cho phép mẫu máy mới tập trung hơn vào các khu vực có vấn đề, chẳng hạn như các chi tiết mỏng với Độ phân giải siêu cao có thể hiển thị lung linh.

Các mô hình máy biến áp cũng có khả năng mở rộng cao hơn, cho phép Nvidia bổ sung nhiều tham số hơn vào DLSS so với phương pháp CNN trước đây. Theo công ty, trên thực tế, mẫu máy biến áp mới có thông số gấp đôi.

Siêu phân giải DLSS với Model biến áp mới | Chân trời cấm Tây

Như bạn có thể thấy trong video ở trên, Nvidia tuyên bố mẫu máy mới này có độ ổn định tốt hơn và bảo toàn các chi tiết đẹp hơn so với phương pháp CNN trước đây. Những cải tiến này cũng không chỉ dành riêng cho GPU dòng RTX 50. Tất cả các card đồ họa RTX sẽ có thể tận dụng mô hình máy biến áp mới trong các trò chơi DLSS 4, ít nhất là đối với các tính năng được mỗi thế hệ hỗ trợ.

Tôi đã thấy DLSS 4 hoạt động một vài lần, nhưng thử nghiệm thực sự cho tính năng này sẽ là khi GPU thế hệ tiếp theo của Nvidia ra mắt. Sau đó, tôi sẽ có thể đánh giá cách hoạt động của tính năng này trên một số trò chơi và tình huống để xem nó hoạt động như thế nào. Bất chấp điều đó, có rất nhiều thay đổi với tính năng này và theo những gì Nvidia đã chia sẻ cho đến nay, những thay đổi đó có tác dụng làm cho DLSS trở nên tốt hơn nữa.



Nguồn DigitalTrend

BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Bài viết mới

- Quảng cáo -

Bình luận mới