Hệ thống đa tác nhân của Coral Protocol đã vượt trội hơn Magnetic-UI được Microsoft hỗ trợ với tỷ lệ 34% trên chuẩn GAIA, chứng minh rằng việc phối hợp thông minh các mô hình nhỏ hơn có thể cạnh tranh hoặc vượt qua các phương pháp AI quy mô lớn truyền thống.
Cơ sở hạ tầng phi tập trung cho AI hợp tác, Coral Protocol báo cáo rằng hệ thống đa tác nhân của nó đã vượt trội hơn 34% so với Magnetic-UI được Microsoft hỗ trợ trên GAIA Benchmark—một kết quả chưa từng có cho thấy việc mở rộng theo chiều ngang có thể cung cấp một cách tiếp cận hiệu quả hơn so với việc mở rộng các tham số mô hình. Hệ thống của giao thức tận dụng sự điều phối thông minh giữa nhiều tác nhân, thay vì chỉ tập trung vào việc tăng kích thước mô hình.
Buổi trình diễn này đánh dấu điểm số xác minh cao nhất trên GAIA Benchmark sử dụng các tác nhân nhỏ, hỗ trợ giả thuyết của NVIDIA rằng các mô hình nhỏ hơn được phối hợp tốt có thể đóng một vai trò quan trọng trong tương lai của AI. Kết quả, theo các nhà phát triển của Coral, phản ánh một sự chuyển biến trong cách tiếp cận khả năng mở rộng của AI thay vì chỉ đơn thuần là tăng cường sức mạnh hệ thống.
Là một giao thức mở, Coral tạo điều kiện cho việc mở rộng khả năng của AI bằng cách cho phép sự phối hợp giữa các tác nhân chuyên biệt trên toàn cầu, thay vì dựa vào các mô hình tổng quát tập trung. Kiến trúc của nó cho phép tương tác song song, an toàn giữa các tác nhân, nâng cao chức năng của các mô hình ngôn ngữ ở mọi kích thước trong các nhiệm vụ yêu cầu lý luận, lập kế hoạch và giải quyết vấn đề nâng cao.
"Cột mốc này đánh dấu một bước ngoặt trong hạ tầng AI," Giám đốc công nghệ của Coral, Caelum Forder, cho biết trong một tuyên bố bằng văn bản. "Đây là bằng chứng rằng mở rộng theo chiều ngang không chỉ khả thi - mà còn thực tiễn, và Coral là cách hiệu quả nhất để thực hiện điều đó. Internet của các tác nhân hiện là một thực tế hoạt động. Nếu bạn là nhà phát triển tác nhân, hãy Coralise nó. Nếu bạn là nhà phát triển ứng dụng, hãy xây dựng nó tốt hơn với chi phí thấp hơn bằng cách sử dụng hạ tầng của chúng tôi," ông nói thêm.
Coral Tops GAIA Benchmark, Xác thực sức mạnh của các mô hình nhỏ trong các hệ thống tác động tiên tiến
Giữa sự cạnh tranh ngày càng tăng để phát triển các hệ thống tác nhân tiên tiến, phần lớn sự tập trung vẫn dành cho việc mở rộng các mô hình để quản lý độ phức tạp của nhiệm vụ đang gia tăng. Hiệu suất gần đây của Coral đã thách thức cách tiếp cận phổ biến này, phù hợp với những phát hiện từ một nghiên cứu gần đây của NVIDIA cho thấy rằng các hệ thống nhỏ hơn có thể cung cấp hiệu suất cao mà không làm giảm tốc độ, độ an toàn hoặc hiệu quả. GAIA Benchmark, một bộ đánh giá toàn diện cho AI tiên tiến, được thiết kế để đánh giá khả năng xử lý các nhiệm vụ thực tế của các hệ thống, mà thường đòi hỏi nhiều thời gian và kỹ năng từ các chuyên gia con người. Bao gồm 450 yêu cầu phức tạp kiểm tra khả năng nghiên cứu, phân tích và lý luận, benchmark này phục vụ như một chỉ số quan trọng trong ngành để đánh giá hiệu quả của các mô hình ngôn ngữ lớn đa năng (LLM).
Hệ thống GAIA Agent của Coral, được sử dụng trong bài kiểm tra chuẩn, dựa trên Giao thức Coral và rút ra từ các nguyên tắc thiết kế của OWL của CAMEL. Nó tích hợp các tác nhân chuyên biệt để thực hiện một loạt các nhiệm vụ bao gồm nghiên cứu, phân tích, phê bình, lập kế hoạch và duyệt web, tất cả đều giao tiếp thông qua hạ tầng máy chủ MCP của Coral.
Việc dẫn đầu bảng xếp hạng GAIA Benchmark cho các mô hình nhỏ hơn cho thấy tiềm năng của Coral trong việc mở rộng chức năng của các hệ thống AI thông qua một cấu trúc dựa trên đồ thị. Kết quả này gợi ý rằng có thể tạo ra các tác nhân nhẹ hiệu suất cao bằng cách sử dụng các mô hình nhỏ hơn—tạo điều kiện thuận lợi cho việc xử lý dữ liệu rộng rãi hơn, tích hợp hệ sinh thái mượt mà hơn và cải thiện khả năng giao tiếp giữa các tác nhân.
“Vai trò của các mô hình nhỏ trong các hệ thống tác nhân đã không được đánh giá đúng mức cho đến nay, nhưng xu hướng đang bắt đầu thay đổi,” Caelum Forder nói. “Chúng tôi đã chứng minh rằng những mô hình như vậy có thể mở rộng vượt qua các giới hạn đã biết trước đây và cạnh tranh vượt trội với các đối thủ hiện tại. Tôi tin rằng chúng có một vai trò trung tâm trong tương lai của AI tác nhân,” ông kết luận.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Coral Protocol vượt trội Microsoft 34% với điểm chuẩn GAIA hàng đầu cho mô hình mini AI
Tóm tắt
Hệ thống đa tác nhân của Coral Protocol đã vượt trội hơn Magnetic-UI được Microsoft hỗ trợ với tỷ lệ 34% trên chuẩn GAIA, chứng minh rằng việc phối hợp thông minh các mô hình nhỏ hơn có thể cạnh tranh hoặc vượt qua các phương pháp AI quy mô lớn truyền thống.
Cơ sở hạ tầng phi tập trung cho AI hợp tác, Coral Protocol báo cáo rằng hệ thống đa tác nhân của nó đã vượt trội hơn 34% so với Magnetic-UI được Microsoft hỗ trợ trên GAIA Benchmark—một kết quả chưa từng có cho thấy việc mở rộng theo chiều ngang có thể cung cấp một cách tiếp cận hiệu quả hơn so với việc mở rộng các tham số mô hình. Hệ thống của giao thức tận dụng sự điều phối thông minh giữa nhiều tác nhân, thay vì chỉ tập trung vào việc tăng kích thước mô hình.
Buổi trình diễn này đánh dấu điểm số xác minh cao nhất trên GAIA Benchmark sử dụng các tác nhân nhỏ, hỗ trợ giả thuyết của NVIDIA rằng các mô hình nhỏ hơn được phối hợp tốt có thể đóng một vai trò quan trọng trong tương lai của AI. Kết quả, theo các nhà phát triển của Coral, phản ánh một sự chuyển biến trong cách tiếp cận khả năng mở rộng của AI thay vì chỉ đơn thuần là tăng cường sức mạnh hệ thống.
Là một giao thức mở, Coral tạo điều kiện cho việc mở rộng khả năng của AI bằng cách cho phép sự phối hợp giữa các tác nhân chuyên biệt trên toàn cầu, thay vì dựa vào các mô hình tổng quát tập trung. Kiến trúc của nó cho phép tương tác song song, an toàn giữa các tác nhân, nâng cao chức năng của các mô hình ngôn ngữ ở mọi kích thước trong các nhiệm vụ yêu cầu lý luận, lập kế hoạch và giải quyết vấn đề nâng cao.
"Cột mốc này đánh dấu một bước ngoặt trong hạ tầng AI," Giám đốc công nghệ của Coral, Caelum Forder, cho biết trong một tuyên bố bằng văn bản. "Đây là bằng chứng rằng mở rộng theo chiều ngang không chỉ khả thi - mà còn thực tiễn, và Coral là cách hiệu quả nhất để thực hiện điều đó. Internet của các tác nhân hiện là một thực tế hoạt động. Nếu bạn là nhà phát triển tác nhân, hãy Coralise nó. Nếu bạn là nhà phát triển ứng dụng, hãy xây dựng nó tốt hơn với chi phí thấp hơn bằng cách sử dụng hạ tầng của chúng tôi," ông nói thêm.
Coral Tops GAIA Benchmark, Xác thực sức mạnh của các mô hình nhỏ trong các hệ thống tác động tiên tiến
Giữa sự cạnh tranh ngày càng tăng để phát triển các hệ thống tác nhân tiên tiến, phần lớn sự tập trung vẫn dành cho việc mở rộng các mô hình để quản lý độ phức tạp của nhiệm vụ đang gia tăng. Hiệu suất gần đây của Coral đã thách thức cách tiếp cận phổ biến này, phù hợp với những phát hiện từ một nghiên cứu gần đây của NVIDIA cho thấy rằng các hệ thống nhỏ hơn có thể cung cấp hiệu suất cao mà không làm giảm tốc độ, độ an toàn hoặc hiệu quả. GAIA Benchmark, một bộ đánh giá toàn diện cho AI tiên tiến, được thiết kế để đánh giá khả năng xử lý các nhiệm vụ thực tế của các hệ thống, mà thường đòi hỏi nhiều thời gian và kỹ năng từ các chuyên gia con người. Bao gồm 450 yêu cầu phức tạp kiểm tra khả năng nghiên cứu, phân tích và lý luận, benchmark này phục vụ như một chỉ số quan trọng trong ngành để đánh giá hiệu quả của các mô hình ngôn ngữ lớn đa năng (LLM).
Hệ thống GAIA Agent của Coral, được sử dụng trong bài kiểm tra chuẩn, dựa trên Giao thức Coral và rút ra từ các nguyên tắc thiết kế của OWL của CAMEL. Nó tích hợp các tác nhân chuyên biệt để thực hiện một loạt các nhiệm vụ bao gồm nghiên cứu, phân tích, phê bình, lập kế hoạch và duyệt web, tất cả đều giao tiếp thông qua hạ tầng máy chủ MCP của Coral.
Việc dẫn đầu bảng xếp hạng GAIA Benchmark cho các mô hình nhỏ hơn cho thấy tiềm năng của Coral trong việc mở rộng chức năng của các hệ thống AI thông qua một cấu trúc dựa trên đồ thị. Kết quả này gợi ý rằng có thể tạo ra các tác nhân nhẹ hiệu suất cao bằng cách sử dụng các mô hình nhỏ hơn—tạo điều kiện thuận lợi cho việc xử lý dữ liệu rộng rãi hơn, tích hợp hệ sinh thái mượt mà hơn và cải thiện khả năng giao tiếp giữa các tác nhân.
“Vai trò của các mô hình nhỏ trong các hệ thống tác nhân đã không được đánh giá đúng mức cho đến nay, nhưng xu hướng đang bắt đầu thay đổi,” Caelum Forder nói. “Chúng tôi đã chứng minh rằng những mô hình như vậy có thể mở rộng vượt qua các giới hạn đã biết trước đây và cạnh tranh vượt trội với các đối thủ hiện tại. Tôi tin rằng chúng có một vai trò trung tâm trong tương lai của AI tác nhân,” ông kết luận.