Trang chủCông nghệGiá token AI giảm 98% nhưng hóa đơn doanh nghiệp tăng gấp...

Giá token AI giảm 98% nhưng hóa đơn doanh nghiệp tăng gấp ba lần

Uber đã vượt qua toàn bộ ngân sách mã hóa AI năm 2026 vào tháng 4. Microsoft đã thu hồi giấy phép Claude Code của các nhà phát triển sáu tháng sau khi kích hoạt chúng. Một công ty theo báo cáo đã kiếm được hóa đơn Claude trị giá 500 triệu đô la chỉ trong một tháng sau khi quên đặt giới hạn sử dụng. Một nhân viên của Priceline nói với TechCrunch rằng việc gia hạn hợp đồng Cursor định kỳ sẽ đắt hơn gấp bốn đến năm lần.

Mô hình này giống nhau ở mọi nơi. Giá mỗi mã thông báo đã giảm, nhưng việc thúc đẩy các đại lý AI tự trị đã khiến mức tiêu thụ tăng vọt. Các công ty đã dồn sức cho việc đăng ký ăn thỏa sức vào đầu năm 2025 hiện đang cố gắng tìm hiểu xem tiền đã đi đâu và liệu có khoản nào trong số đó tạo ra lợi nhuận hay không.

Nghịch lý về những con số

Hiệu suất tương đương GPT-4 hiện có giá khoảng 0,40 USD trên một triệu mã thông báo, giảm từ mức 20 USD trên một triệu vào cuối năm 2022. Đó là mức giảm 98%. Tuy nhiên, hóa đơn AI của doanh nghiệp đã tăng khoảng 320%, theo nhiều phân tích của ngành. Ngân sách trung bình dành cho AI của doanh nghiệp đã tăng từ 1,2 triệu USD mỗi năm vào năm 2024 lên 7 triệu USD vào năm 2026.

Thủ phạm là khối lượng. Các công cụ Agentic AI được phát hành từ tháng 11 năm 2025, bao gồm Claude Opus 4.5 của Anthropic, GPT-5.1 của OpenAI và Gemini 3 Pro của Google, đã tăng mức tiêu thụ mã thông báo cho mỗi nhiệm vụ. Một quy trình làm việc tuyến tính đơn giản vào năm 2023 có giá khoảng 0,04 USD cho mỗi lần tương tác. Một hệ thống tác nhân được điều phối vào năm 2026 có giá khoảng 1,20 USD, cao hơn khoảng 30 lần. Các kỹ sư cá nhân tại Microsoft được cho là đã chi từ 500 đến 2.000 đô la một tháng cho các token trước khi giấy phép bị thu hồi.

TNW City Coworking Space – Nơi công việc tốt nhất của bạn diễn ra

Một không gian làm việc được thiết kế để phát triển, hợp tác và có cơ hội kết nối vô tận ở trung tâm công nghệ.

Nicholas Arcolano, người đứng đầu bộ phận nghiên cứu tại nền tảng quản lý kỹ thuật Jellyfish, nói với TechCrunch rằng mức tiêu thụ của mỗi nhà phát triển đã tăng khoảng 18,6 lần trong 9 tháng. Những kỹ sư sử dụng nhiều token nhất có năng suất cao gấp đôi so với những người dùng ít sử dụng hơn, nhưng họ đã chi số token gấp 10 lần để đạt được điều đó. “Việc chi tiêu quá mức có mang lại lợi ích hay không phụ thuộc vào giá trị kinh doanh cuối cùng của mã được vận chuyển, điều mà hầu hết các công ty vẫn không thể đo lường được,” Arcolano nói.

Từ tokenmaxxing đến lan can

Sáu tháng trước, tôi có một cuộc trò chuyện với một khách hàng và tất cả chỉ là ‘Nó có thể làm được gì? Nó có đủ tốt không?‘” Alexander Embiricos, người đứng đầu doanh nghiệp của OpenAI, nói với TechCrunch. “Bây giờ các cuộc trò chuyện đều xoay quanh vấn đề ‘Chúng ta đang chi tiêu quá nhiều. Bạn có khả năng hiển thị gì? Bạn có những biện pháp kiểm soát mã thông báo nào?‘”

JR Storment, giám đốc điều hành của FinOps Foundation, đã mô tả sự thay đổi một cách thẳng thắn. “Vào tháng 4 và tháng 5, tôi bắt đầu nghe các công ty nói: ‘Ôi chúa ơi, chúng tôi đã sử dụng gấp 3 lần toàn bộ ngân sách mã thông báo năm 2026 và mới chỉ có tháng 4 thôi.’ Toàn bộ cuộc trò chuyện chuyển từ tokenmaxxing và ‘đi nhanh’ sang ‘chúng tôi cần lan can, làm cách nào để kiểm soát điều này?‘”

Giám đốc cấp cao về tài chính CNTT của Priceline, Chris Reed, đã so sánh với kỷ nguyên thanh toán viễn thông. “Nó giống như đại dịch crack-cocain. Họ cho phép bạn thử nó để khiến bạn bị cuốn hút, và bây giờ bạn gần như say mê nó.” Công ty đã bắt đầu đặt giới hạn mã thông báo cho một số nhóm nhất định. Reed cho biết anh đã nhận thấy sự khác biệt giữa việc sử dụng do nhà cung cấp báo cáo và dữ liệu nội bộ của Priceline.

Quỹ Tokenomics

Trong bối cảnh đó, Linux Foundation tuần này đã tiết lộ các kế hoạch cho Tokenomics Foundation, một cơ quan tiêu chuẩn mới nhằm đưa ra nguyên tắc chi phí tương tự cho các token AI mà FinOps mang đến cho chi tiêu trên nền tảng đám mây.

Tổ chức có kế hoạch xây dựng một định nghĩa kinh điển về “kinh tế học mã thông báo,“các tiêu chuẩn mở cho việc sử dụng và thanh toán mã thông báo AI cũng như các số liệu mới bao gồm chi phí mỗi trí thông minh và mã thông báo trên mỗi watt. Việc ra mắt chính thức được lên kế hoạch vào tháng 7. Nishant Gupta, giám đốc tính khả dụng tại Salesforce, cho biết trong một tuyên bố rằng “kinh tế mã thông báo về cơ bản là trừu tượng và không rõ ràng hơn bất kỳ điều gì chúng tôi đã quản lý ở quy mô này trước đây.”

Thử thách là rất lớn. “Theo dõi chi phí trên đám mây là vấn đề về dữ liệu hàng trăm triệu hàng mỗi tháng,” Storment nói.”Theo dõi chi phí mã thông báo là vấn đề dữ liệu hàng nghìn tỷ hàng mỗi tháng.

Một thị trường hình thành xung quanh vấn đề

Các công ty khởi nghiệp và nhà cung cấp đã thành lập đang chạy đua để lấp đầy khoảng trống. Pay-i theo dõi và tối ưu hóa chi tiêu AI. Trả phí cho phép các nhà phát triển tính phí dựa trên giá trị thực tế thay vì phí đăng ký. Jellyfish, Waydev và Faros AI cung cấp dịch vụ giám sát tác nhân để chứng minh ROI của các công cụ dành cho nhà phát triển. Ramp đã chuyển sang quản lý chi tiêu bằng AI. Datadog và New Relic đã bổ sung khả năng quan sát ở cấp độ mã thông báo.

Định tuyến mô hình đang nổi lên như đòn bẩy chi phí chính. Factory, một công ty khởi nghiệp về mã hóa AI dành cho doanh nghiệp, đã ra mắt một bộ định tuyến mẫu trong tuần này, tự động chọn mẫu phù hợp rẻ nhất cho từng tác vụ. Vitaly Gordon, Giám đốc điều hành của Faros AI, cho biết các phòng thí nghiệm biên giới đã thực hiện việc này trong nội bộ. “Báo cáo tài chính về số tiền bạn chi cho Anthropic, ngay cả khi bạn gọi là mô hình Opus, một phần chi tiêu sẽ dành cho Sonnet hoặc Haiku, vì họ đủ thông minh để làm điều đóanh ấy nói.

Goldman Sachs dự án Việc sử dụng mã thông báo toàn cầu sẽ tăng gấp 24 lần vào năm 2030. Các công ty đã vượt quá ngân sách hiện cần các giải pháp và sản phẩm đầu tiên của Tokenomics Foundation vẫn còn vài tháng nữa mới ra mắt. Như Gordon đã nói: “Có thể chúng ta đã tạo ra được động cơ hơi nước nhưng vẫn chưa tìm ra được dây chuyền lắp ráp.



Nguồn The Next Web

BÀI VIẾT LIÊN QUAN

BÌNH LUẬN

Vui lòng nhập bình luận của bạn
Vui lòng nhập tên của bạn ở đây

Bài viết mới

- Quảng cáo -

Bình luận mới