Sakana AI đang trở thành một trong những cái tên được chú ý nhất trong làn sóng trí tuệ nhân tạo đến từ Nhật Bản. Không đi theo hướng xây dựng một mô hình ngôn ngữ khổng lồ nguyên khối, startup này chọn cách phát triển hệ thống AI đa tác nhân, nơi nhiều mô hình chuyên biệt cùng phối hợp để xử lý vấn đề. Nổi bật trong số đó là Fugu, model AI được đánh giá có năng lực cạnh tranh với Claude Fable 5 nhờ khả năng điều phối thông minh, suy luận đa bước và tối ưu chi phí vận hành. Vậy Sakana AI là gì, Fugu hoạt động ra sao và vì sao mô hình này lại được xem là đối thủ đáng chú ý của các hệ thống AI hàng đầu hiện nay?
Nguồn gốc và triết lý của Sakana AI
Sakana AI ra đời năm 2023 tại Tokyo và được định giá khoảng 2,65 tỷ USD sau vòng gọi vốn Series B diễn ra vào tháng 11/2025. Startup này nhận được sự hỗ trợ từ nhiều nhà đầu tư lớn như NVIDIA, Mitsubishi UFJ và Google. Hai nhà sáng lập chính của công ty là CEO David Ha và CTO Llion Jones. Đặc biệt, Llion Jones là một trong những đồng tác giả của công trình khoa học “Attention Is All You Need”, nghiên cứu đã đặt nền tảng cho kiến trúc Transformer.
Tên Sakana trong tiếng Nhật có nghĩa là “cá”, thể hiện rõ định hướng kỹ thuật phỏng sinh học của công ty. Thay vì phát triển các mô hình ngôn ngữ khổng lồ theo kiểu đơn khối, Sakana AI nghiên cứu cách những loài sống theo bầy đàn như cá, ong, kiến và chim phối hợp với nhau. Từ đó, họ cho rằng sự cộng tác hiệu quả giữa nhiều thành phần nhỏ có thể tạo nên các mô hình gọn nhẹ hơn nhưng vẫn đạt hiệu suất cao.
Hệ thống điều phối Fugu vận hành ra sao?
Fugu không hoạt động như một mô hình ngôn ngữ lớn độc lập. Thay vào đó, hệ thống này sử dụng một mô hình lõi nhỏ khoảng 7 tỷ tham số, đóng vai trò như “nhạc trưởng” để phối hợp nhiều mô hình AI chuyên biệt. Fugu được phát triển dựa trên hai nghiên cứu nổi bật tại ICLR 2026 là TRINITY và Conductor. Nhờ nền tảng này, hệ thống có thể ứng dụng học tăng cường để tự tìm ra chiến lược điều phối tối ưu, thay vì phụ thuộc hoàn toàn vào cách thiết kế thủ công.
Khi tiếp nhận một yêu cầu phức tạp, Fugu sẽ phân tích bài toán, chia nhỏ thành các nhiệm vụ phụ, sau đó chuyển từng phần việc cho các mô hình nền tảng phù hợp nhất xử lý. Kết quả từ các mô hình này tiếp tục được kiểm tra chéo, trước khi hệ thống tổng hợp lại thành một phản hồi thống nhất và gửi đến người dùng thông qua một API chung.
Sakana AI hiện cung cấp hai phiên bản Fugu cho các nhu cầu sử dụng khác nhau. Fugu tiêu chuẩn được tối ưu cho tốc độ phản hồi nhanh và độ trễ thấp, phù hợp với các tác vụ thường ngày như lập trình, rà soát mã nguồn hoặc trò chuyện trực tuyến. Trong khi đó, Fugu Ultra là phiên bản nâng cao, hướng đến những bài toán phức tạp cần xử lý nhiều bước như nghiên cứu khoa học, phân tích bảo mật và tra cứu bằng sáng chế.
Vì sao Fugu được đánh giá ngang hàng Claude Fable 5?
Ban đầu, nhiều chuyên gia công nghệ còn hoài nghi trước tuyên bố của Sakana AI rằng Fugu có thể đạt năng lực tương đương Claude Fable 5 của Anthropic. Claude Fable 5 được biết đến là một mô hình ngôn ngữ lớn dạng nguyên khối, nổi bật với khả năng suy luận logic sâu và xử lý lượng ngữ cảnh rất lớn. Tuy nhiên, các kết quả thực tế cho thấy Fugu có thể tạo ra sức mạnh cạnh tranh nhờ kiến trúc trí tuệ tập thể.
Thay vì dồn toàn bộ kiến thức và năng lực xử lý vào một mô hình duy nhất, Fugu phân tách vấn đề thành nhiều phần nhỏ, sau đó lựa chọn những mô hình chuyên biệt phù hợp nhất cho từng nhiệm vụ. Yếu tố quan trọng giúp Fugu tiệm cận sức mạnh của Fable 5 nằm ở cơ chế xác minh chéo nhiều tầng. Vai trò “nhạc trưởng” của Fugu không chỉ dừng lại ở việc tổng hợp kết quả, mà còn điều phối các tác nhân AI tự đánh giá, phản biện và kiểm tra lẫn nhau nhằm hạn chế tối đa tình trạng ảo giác thông tin.
Nhờ cơ chế điều phối linh hoạt này, Fugu có thể bù đắp cho hạn chế về quy mô tham số. Trên bảng xếp hạng GPQA Diamond, khả năng xử lý các câu hỏi khoa học phức tạp của Fugu được đánh giá tương đương với dòng Claude Fable 5. Điều này cho thấy chiến lược kết hợp nhiều mô hình nhỏ hoàn toàn có thể tạo ra năng lực suy luận cao, không thua kém những hệ thống nguyên khối có chi phí vận hành lớn.
Hiệu năng kỹ thuật và chi phí vận hành
Theo thông tin được Sakana AI công bố, hệ thống đa tác nhân Fugu đã đạt nhiều kết quả nổi bật trên các bài đánh giá kỹ thuật. Trong bài kiểm tra SWE Bench Pro về kỹ thuật phần mềm, Fugu Ultra ghi nhận 73,7 điểm, cao hơn Claude Opus 4.8 với 69,2 điểm và GPT 5.5 với 58,6 điểm. Bên cạnh đó, phiên bản Fugu tiêu chuẩn cũng cho thấy năng lực tốt trên các bài kiểm tra SciCode và suy luận trong ngữ cảnh dài.
Không chỉ gây chú ý ở hiệu năng, Fugu còn được đánh giá cao về chi phí vận hành. Hệ thống này có mức giá chỉ bằng khoảng 25% so với các phương án kết hợp mô hình truyền thống, giúp tối ưu ngân sách cho doanh nghiệp và nhóm phát triển. Sakana AI cung cấp nhiều gói đăng ký linh hoạt, bao gồm gói Standard giá 20 USD/tháng cho các quy trình nhẹ, gói Pro giá 100 USD/tháng dành cho nhu cầu sử dụng cao hơn và gói Max giá 200 USD/tháng cho các hệ thống tự động hóa hoạt động liên tục.
Riêng với Fugu Ultra, hình thức tính phí theo token được áp dụng ở mức 5 USD cho mỗi một triệu token đầu vào và 30 USD cho mỗi một triệu token đầu ra. Cách định giá này giúp người dùng dễ kiểm soát chi phí khi triển khai Fugu cho các tác vụ chuyên sâu hoặc có quy mô lớn.
Nhược điểm của Sakana AI
Dù Fugu gây chú ý nhờ hiệu năng cao và chi phí vận hành tối ưu, hệ thống này vẫn tồn tại một số hạn chế khi triển khai thực tế. Trước hết, Fugu hiện chưa khả dụng tại khu vực châu Âu do vướng các yêu cầu liên quan đến quyền riêng tư theo GDPR, đặc biệt với kiến trúc định tuyến dạng hộp đen.
Bên cạnh đó, độ trễ xử lý cũng là điểm cần cân nhắc. Với một số bài kiểm thử lập trình thông thường, Fugu Ultra có thể mất tới 30 phút để hoàn thành, lâu hơn kỳ vọng của nhiều người dùng. Phiên bản Fugu Ultra cũng chưa hỗ trợ tùy biến sâu, vì hệ thống sử dụng danh sách mô hình cố định và người dùng không thể tự thay đổi.
Ngoài ra, Fugu có thể phát sinh chi phí cao hơn khi xử lý dữ liệu lớn. Các yêu cầu vượt quá 272.000 token sẽ bị tính phí gấp đôi cho phần đầu vào và gấp rưỡi cho phần đầu ra. Vì vậy, người dùng cần tính toán kỹ khối lượng dữ liệu trước khi triển khai hệ thống này cho các tác vụ quy mô lớn.
Vì sao Fugu mạnh ngang Claude Fable 5?
Fugu đạt năng lực tương đương Claude Fable 5 nhờ kiến trúc điều phối thông minh. Hệ thống này chia nhỏ vấn đề, phân công từng phần cho các mô hình chuyên biệt và áp dụng cơ chế xác minh chéo nhiều lớp. Nhờ đó, Fugu có thể tạo ra khả năng suy luận phức tạp, chính xác và hạn chế sai lệch thông tin.
Hệ thống Fugu có những giới hạn nào cần lưu ý?
Fugu hiện chưa được triển khai tại châu Âu do các yêu cầu liên quan đến quyền riêng tư. Ngoài ra, Fugu Ultra có thể mất tới 30 phút để xử lý một số tác vụ lập trình. Với những văn bản đầu vào quá lớn, người dùng cũng cần lưu ý vì chi phí sử dụng có thể tăng cao hơn.
Hy vọng thông tin trong bài viết trên của Rickchilling Store hữu ích cho bạn. Sakana AI cho thấy một hướng đi khác biệt trong cuộc đua trí tuệ nhân tạo: không nhất thiết phải xây dựng một mô hình khổng lồ mới có thể đạt hiệu năng cao. Thông qua kiến trúc lấy cảm hứng từ trí tuệ tập thể trong tự nhiên, Fugu chứng minh rằng nhiều mô hình nhỏ được điều phối hợp lý vẫn có thể tạo ra năng lực suy luận mạnh mẽ, tiệm cận những hệ thống AI hàng đầu như Claude Fable 5. Dù còn một số giới hạn về khu vực triển khai, độ trễ xử lý và chi phí khi dùng dữ liệu lớn, Sakana AI vẫn là cái tên đáng theo dõi trong tương lai, đặc biệt khi xu hướng AI đa tác nhân ngày càng được quan tâm.











