Khi sự phấn khích từ Nvidia GTC 2026 lắng xuống—đặc biệt là xung quanh thông báo về phần mở rộng bộ đệm CMX KV cho các ổ SSD RDMA được kết nối bên ngoài—chúng tôi đã phân tích xem sự phát triển này có thể ảnh hưởng đến WEKA như thế nào. Đáng ngạc nhiên là công ty xem tin tức này là một sự phát triển tích cực.
Điều này trái ngược với mong đợi ban đầu của chúng tôi. Chúng tôi đã dự đoán rằng các nhà cung cấp như WEKA và Hammerspace—cả hai đều đã đầu tư rất nhiều vào việc sử dụng SSD cục bộ trong các máy chủ GPU, thông qua Lưới bộ nhớ tăng cường của WEKA và phần mềm Cấp 0 của Hammerspace—có thể bị các đối thủ cạnh tranh hỗ trợ tiêu chuẩn CMX mới vượt mặt hoặc gạt sang một bên. Trước khi triển khai khung CMX/STX, WEKA và Hammerspace có một lợi thế khác biệt: không nhà cung cấp nào khác có thể sánh kịp tốc độ cung cấp dữ liệu vào các ổ SSD cục bộ này của họ, vì làm như vậy sẽ yêu cầu phát triển phần mềm chuyên dụng.
Với sự xuất hiện của kiến trúc tham chiếu CMX/STX, ban đầu chúng tôi cho rằng WEKA sẽ cần sửa đổi phần mềm của mình để truyền dữ liệu tới các ổ SSD hỗ trợ CMX thay vì các ổ SSD cục bộ trong máy chủ GPU. Ngoài ra, các đối tác lưu trữ Nvidia khác hiện có quyền truy cập vào khuôn khổ này, giúp tạo ra sân chơi cạnh tranh bình đẳng và cho phép họ—chẳng hạn như Everpure và VAST Data—thu hẹp khoảng cách với WEKA và Hammerspace.
Valentin Bercovici, Giám đốc AI của WEKA, bác bỏ ý kiến cho rằng WEKA sẽ gặp bất lợi. Anh ấy nói với chúng tôi: “WEKA không phải thay đổi phần mềm của chúng tôi cho STX/CMX.”
Ông giải thích lý do là cả mô-đun phần mềm máy chủ và máy khách NeuralMesh của WEKA đều hỗ trợ các máy chủ Grace dựa trên Arm của Nvidia kể từ khi chúng tích hợp với hệ thống GB200 và GB300. Hỗ trợ gốc này giúp loại bỏ nhu cầu đại tu phần mềm để thích ứng với tiêu chuẩn CMX mới.
Trên các máy chủ Grace, WEKA đạt được 97% hiệu suất CX-7 400GbE tốc độ đường truyền trong khối lượng công việc I/O hỗn hợp trong thế giới thực. Công ty có kế hoạch sớm chứng minh hiệu suất tương đương với CX-8/CX-9 800GbE trên hệ thống Vera, củng cố thêm thông tin về hiệu suất của mình.
Các DPU dựa trên Vera BlueField-4 (BF-4) của Nvidia—có số lượng lõi gần gấp đôi so với các phiên bản tiền nhiệm—sẽ nâng cao hiệu suất trên ba loại mô-đun vùng chứa trong NeuralMesh:
-
Quản lý độ sâu hàng đợi “Drive”
-
“Tính toán” siêu dữ liệu NVMe Fabric và đồng bộ hóa khóa
-
Giao thức “Front-end” (NFS, S3, SMB)
AXON của WEKA là việc triển khai phần mềm hệ thống tệp NeuralMesh, được triển khai dưới dạng dịch vụ vi mô được đóng gói trên các máy chủ GPU của Nvidia. Kiến trúc cùng vị trí này—nơi các dịch vụ lưu trữ và điện toán chạy trên cùng một cơ sở hạ tầng vật lý—mang lại độ trễ thấp và hiệu quả cao bằng cách giữ dữ liệu gần với khối lượng công việc GPU. Bercovici giải thích thêm: “Các hệ thống dựa trên CMX trên bộ khởi tạo/máy khách và mục tiêu/máy chủ BF-4 mới sẽ không chỉ tương thích ngược với AXON trên GB300 ngày nay mà còn cung cấp cho NeuralMesh nhiều không gian hơn để tối đa hóa hiệu suất của WEKA trong các tình huống thực tế, trên nhiều cấu hình Vera-Rubin hơn (Kyber, Oberon, Ultra, HGX, MGX).”
“Điều này sẽ ngày càng trở nên quan trọng khi quy mô lập lịch và định tuyến KV Cache trên toàn cụm cùng với các tiến bộ kiến trúc LLM sắp tới—chẳng hạn như kiến trúc Hybrid DiT, Mamba và JEPA—cũng như các engram kiểu 4 DeepSeek (các lớp bộ nhớ có điều kiện), dự kiến sẽ ra mắt trong năm nay,” ông nói thêm.
Bercovici lập luận thêm: "Ngay cả bản xem trước ngày nay của Claude Mythos, với 10 nghìn tỷ thông số, cuối cùng cũng sẽ phát hiện ra các yêu cầu CMX mới. Tính linh hoạt của NeuralMesh dưới tải quy mô lớn sẽ mang lại lợi ích cho các phòng thí nghiệm hàng đầu đang đẩy lùi các giới hạn về nhu cầu bộ nhớ GPU."
Và anh ấy đã tiết lộ một điều quan trọng: “Nói một cách đơn giản - CMX sẽ là một trong những dịch vụ nền tảng phần cứng của chúng tôi cho phiên bản tiếp theo của WEKApod.” Điều này phù hợp với trọng tâm gần đây của WEKA trong việc phát triển các thiết bị WEKApod, là những cấu hình được xác thực trước để triển khai NeuralMesh trên quy mô lớn.
Công ty TNHH Công nghệ Qianxing Jietong Bắc Kinh
Sandy Yang/Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Trọng tâm kinh doanh:
Phân phối sản phẩm CNTT/Tích hợp hệ thống & Dịch vụ/Giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu thế giới để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
“Sử dụng công nghệ để xây dựng một thế giới thông minh”Nhà cung cấp dịch vụ sản phẩm CNTT đáng tin cậy của bạn!