Graphon AI nổi lên từ hoạt động lén lút với khoản tài trợ ban đầu trị giá 8,3 triệu USD để xây dựng “lớp thông minh tiền mô hình” giúp khám phá các mối quan hệ trên dữ liệu doanh nghiệp đa phương thức trước khi nó đạt đến mô hình nền tảng. Vòng này được dẫn dắt bởi Novera Ventures, với sự tham gia của Perplexity Fund, Samsung Next, GS Futures, Hitachi Ventures và các tổ chức khác. Công ty được đặt tên theo một khái niệm toán học được đồng chính thức hóa bởi các cố vấn kỹ thuật của nó, các giáo sư Jennifer Chayes và Christian Borgs của UC Berkeley. Được thành lập bởi Arbaaz Khan (CEO), Deepak Mishra (COO) và Clark Zhang (CTO), với các thành viên nhóm từ Amazon, Meta, Google, Apple, NVIDIA và NASA. Khách hàng ban đầu Tập đoàn GS (tập đoàn Hàn Quốc) đã triển khai Graphon để phân tích cửa hàng tiện lợi và an toàn tại công trường.
Cái tên đã nói lên điều đó. Graphon AI, xuất hiện từ lén lút vào thứ Tư với 8,3 triệu đô la tài trợ ban đầu, được đặt theo tên của một đối tượng toán học mà hầu hết mọi người trong lĩnh vực AI chưa bao giờ nghe đến và hai cố vấn nổi bật nhất của nó đã giúp phát minh ra nó. Gravon là giới hạn của một chuỗi các đồ thị dày đặc: một hàm liên tục nắm bắt cấu trúc của các mối quan hệ khi các mạng phát triển vô cùng lớn. Đó là loại khái niệm tồn tại ở ranh giới giữa toán học thuần túy và khoa học máy tính lý thuyết, và hiện nó là nền tảng của một công ty khởi nghiệp tuyên bố đã xây dựng lớp còn thiếu giữa dữ liệu doanh nghiệp và các mô hình được cho là có ý nghĩa về nó.
Luận điểm của công ty rất đơn giản, ngay cả khi toán học đằng sau nó không như vậy. Các mô hình ngôn ngữ lớn ngày nay có thể xử lý khoảng một triệu mã thông báo cùng một lúc. Các doanh nghiệp nắm giữ hàng nghìn tỷ token trên các tài liệu, video, âm thanh, hình ảnh, nhật ký và cơ sở dữ liệu. Thế hệ tăng cường truy xuất, cách tiếp cận tiêu chuẩn hiện tại, có thể hiển thị nội dung có liên quan từ khối lượng đó, nhưng nó không thể khám phá mối quan hệ giữa các phần dữ liệu chưa bao giờ được lưu trữ cùng nhau. LLM sử dụng RAG có thể trả lời câu hỏi về một tài liệu cụ thể. Nó không thể suy luận về cách tài liệu đó kết nối với video giám sát, nhật ký tuân thủ và cơ sở dữ liệu khách hàng, ít nhất là không có ai đó đã lập bản đồ các kết nối đó.
Sản phẩm của Graphon nằm phía trước mô hình chứ không phải bên trong mô hình. Bằng cách sử dụng các hàm graphon, một khung toán học giúp mở rộng khái niệm học thuật thành một lớp phần mềm, hệ thống sẽ nhập dữ liệu đa phương thức và tự động khám phá cấu trúc quan hệ trên đó, tạo ra thứ mà công ty gọi là bộ nhớ quan hệ liên tục. Về lý thuyết, kết quả là sự thể hiện dữ liệu của tổ chức mà bất kỳ mô hình nền tảng hoặc khung tác nhân nào cũng có thể truy vấn mà không bị hạn chế bởi cửa sổ ngữ cảnh của nó.
Những người đằng sau toán học
TNW City Coworking Space – Nơi công việc tốt nhất của bạn diễn ra
Một không gian làm việc được thiết kế để phát triển, hợp tác và có cơ hội kết nối vô tận ở trung tâm công nghệ.
Nhóm sáng lập bao gồm Arbaaz Khan là giám đốc điều hành, Deepak Mishra là giám đốc điều hành và Clark Zhang là giám đốc công nghệ. Công ty cho biết đội ngũ rộng hơn của họ bao gồm các nhà nghiên cứu và kỹ sư cũ từ Amazon, Meta, Google, Apple, NVIDIA, Samsung AI Center, MIT, Rivian và NASA.
Đáng chú ý hơn có lẽ là các cố vấn kỹ thuật. Jennifer Chayes, hiệu trưởng Trường Cao đẳng Máy tính, Khoa học Dữ liệu và Xã hội tại UC Berkeley, và Christian Borgs, giáo sư khoa học máy tính của UC Berkeley, đều được liệt kê là cố vấn. Borgs nằm trong nhóm các nhà nghiên cứu, cùng với Chayes, László Lovász, Vera Sós, và Katalin Vesztergombi – những người đã chính thức hóa graphene như một khái niệm toán học vào năm 2008. Trên thực tế, công ty đang thương mại hóa một khuôn khổ mà các cố vấn của họ đã đồng phát minh ra.
Chayes và Borgs đã mô tả cách tiếp cận này trong một tuyên bố chung là cách tiếp cận coi cấu trúc quan hệ như một phần tử hạng nhất của ngăn xếp AI chứ không phải là thứ được suy ra sau thực tế. Sự khác biệt quan trọng vì hầu hết các hệ thống AI hiện tại đều coi dữ liệu là tập hợp các mục riêng lẻ cần truy xuất chứ không phải là mạng lưới các mối quan hệ cần được bảo tồn.
Một bảng nhà đầu tư bất thường
Vòng hạt giống được dẫn dắt bởi Arvind Gupta của Novera Ventures, người đã biến Graphon trở thành khoản đầu tư đầu tiên vào quỹ của mình từ phương tiện hàng đầu của nó. Gupta được biết đến nhiều hơn với tư cách là người sáng lập IndieBio, công cụ tăng tốc khoa học đời sống và việc ông hướng tới một công ty cơ sở hạ tầng AI cho thấy ông nhận thấy sự chồng chéo về cấu trúc giữa các vấn đề mà Graphon giải quyết và các thách thức dữ liệu đa phương thức, phức tạp xác định tính toán khoa học.
Phần còn lại của bảng giới hạn giống như một bài tập có chủ ý về sự đa dạng chiến lược. Perplexity Fund, chi nhánh mạo hiểm trị giá 50 triệu USD của công ty tìm kiếm AI, đã tham gia cùng với Samsung Next, Hitachi Ventures, GS Futures (chi nhánh liên doanh của tập đoàn GS Hàn Quốc), Gaia Ventures, B37 Ventures và Aurum Partners, quỹ đầu tư liên kết với nhóm sở hữu của San Francisco 49ers.
Sự pha trộn đang nói lên điều đó. Một công ty tìm kiếm AI, một gã khổng lồ về điện tử tiêu dùng, một tập đoàn công nghiệp Nhật Bản và một chaebol Hàn Quốc đều đầu tư vào cùng một lớp dữ liệu tiền mô hình cho thấy rằng vấn đề về cửa sổ ngữ cảnh mà Graphon tuyên bố sẽ giải quyết được áp dụng trong các ngành vốn có rất ít điểm chung. GS Group, được xếp hạng trong số các tập đoàn lớn nhất Hàn Quốc với các lĩnh vực năng lượng, bán lẻ và xây dựng, cũng là khách hàng sớm. Ally Kim, phó chủ tịch GS, cho biết các giải pháp AI đa phương thức của công ty đã được áp dụng để phân tích chuyển động của khách hàng trong các cửa hàng tiện lợi và tăng cường an toàn thông qua phân tích camera quan sát tại các công trường xây dựng.
Đặt cược kỹ thuật
Định vị của Graphon phản ánh sự thay đổi lớn hơn trong thị trường cơ sở hạ tầng AI. Ba năm qua đã bị chi phối bởi cuộc đua xây dựng các mô hình lớn hơn với cửa sổ ngữ cảnh dài hơn. Nhưng ngay cả những mô hình có khả năng nhất vẫn đạt mức trần: chúng có thể xử lý nhiều mã thông báo hơn, nhưng chúng không thể duy trì nhận thức quan hệ về khối lượng dữ liệu mà các tổ chức lớn tạo ra. Câu hỏi mà Graphon đang đặt cược là liệu giải pháp không nằm ở việc mở rộng thêm cửa sổ ngữ cảnh mà nằm ở việc cấu trúc dữ liệu trước khi nó đi vào cửa sổ.
Công ty cho biết họ đã triển khai nền tảng để quản lý nội dung doanh nghiệp, trí tuệ công nghiệp, quy trình làm việc tự động và các ứng dụng trên thiết bị trên điện thoại, máy ảnh, thiết bị đeo và kính thông minh. Phạm vi rộng của các trường hợp sử dụng được xác nhận là tham vọng đối với một công ty ở giai đoạn hạt giống và việc thiếu các tiêu chuẩn độc lập hoặc nghiên cứu trường hợp khách hàng chi tiết ngoài Tập đoàn GS khiến việc đánh giá công nghệ đã phát triển bao xa từ ý tưởng đến sản xuất.
Điều rõ ràng là vấn đề mà Graphon mô tả là có thật. Khoảng cách giữa những gì LLM có thể làm về mặt lý thuyết và những gì chúng thực sự có thể làm với dữ liệu doanh nghiệp vẫn là một trong những hạn chế đáng kể nhất đối với việc triển khai AI. Thế hệ tăng cường truy xuất đã là câu trả lời chính của ngành và những hạn chế của nó, truy xuất phẳng bỏ qua các mối quan hệ giữa các tập dữ liệu, các cửa sổ ngữ cảnh buộc các ranh giới nhân tạo trên những gì mô hình có thể nhìn thấy, đều được ghi lại rõ ràng. Liệu các hàm đồ thị có cung cấp cách tiếp cận tốt hơn về cơ bản hay chỉ đơn thuần là một phiên bản đẹp hơn về mặt lý thuyết của cấu trúc dữ liệu dựa trên đồ thị là câu hỏi mà công ty sẽ cần trả lời khi chuyển từ toán học ở chế độ ẩn sang cơ sở hạ tầng cấp sản xuất.
8,3 triệu đô la giúp nó có cơ hội thử sức. Các cố vấn đồng phát minh ra toán học cơ bản đã mang lại sự tin cậy cho nó. Nhưng trong một thị trường AI không thiếu các công ty khởi nghiệp tuyên bố đã tìm thấy lớp còn thiếu, thách thức của Graphon sẽ là chứng minh rằng toán học mà nó được đặt theo tên sẽ chuyển thành một cải tiến có thể đo lường được về cách các mô hình nền tảng xử lý thực tế đa phương thức, lộn xộn của dữ liệu doanh nghiệp, không chỉ về mặt lý thuyết mà còn ở quy mô mà lý thuyết không còn đủ nữa.
Nguồn The Next Web