Trong GTC 2026, VDURA đã giới thiệu các cập nhật chính cho Nền tảng dữ liệu của mình, được thiết kế để tăng cường sử dụng GPU và hiệu quả lưu trữ trong môi trường AI.khả năng truy cập bộ nhớ trực tiếp từ xa (RDMA), một bản xem trước công nghệ Context-Aware Tiering sáng tạo và cấu hình cơ sở hạ tầng được xác nhận được xây dựng xung quanh các CPU AMD EPYC Turin và các thành phần mạng NVIDIA ConnectX-7.
Những bản cập nhật này được thiết kế để loại bỏ các nút thắt chuyển dữ liệu giữa các cụm GPU và hệ thống lưu trữ,trong khi tối ưu hóa vị trí dữ liệu trên các tầng lưu trữ để hỗ trợ tốt hơn các khối lượng công việc đào tạo và suy luận AI quy mô lớn.
RDMA cho phép đường dẫn dữ liệu trực tiếp GPU
VDURA đã tích hợp hỗ trợ RDMA trên toàn bộ nền tảng dữ liệu của mình, cho phép máy chủ GPU truy cập lưu trữ trực tiếp qua mạng mà không cần sự tham gia của CPU.Bước đột phá này cho phép chuyển dữ liệu từ GPU sang lưu trữ để bỏ qua các đường dẫn truyền thống của lõi và CPU, giảm đáng kể thời gian trễ và tăng hiệu suất thông tin, cung cấp đường dẫn dữ liệu có độ trễ thấp và hiệu suất cao mà đào tạo AI và khối lượng công việc suy luận đòi hỏi ở quy mô lớn.
VDURA Global Namespace
Việc thực hiện RDMA được tích hợp chặt chẽ với VDURA DirectFlow, lớp chuyển động dữ liệu độc quyền của công ty, đảm bảo tất cả lưu lượng truy cập máy chủ GPU tận dụng RDMA.Bằng cách loại bỏ CPU overhead trong đường dẫn dữ liệu, tài nguyên tính toán vẫn được dành riêng cho các nhiệm vụ đào tạo mô hình cốt lõi và suy luận. Cách tiếp cận này duy trì tỷ lệ sử dụng GPU cao hơn trong khi giảm thiểu độ trễ đường ống trong các cụm AI phân tán,một ưu tiên quan trọng cho việc triển khai AI quy mô lớn.
Mục tiêu xếp hạng theo ngữ cảnh hiệu quả vị trí dữ liệu
VDURA cũng chi tiết về giai đoạn đầu tiên của khả năng Context-Aware Tiering, dự kiến sẽ được phát hành chung vào cuối năm 2026.Đặt dữ liệu tự động qua các tầng lưu trữ dựa trên hành vi khối lượng công việc và các mẫu truy cập thời gian thực Ứng dụng vượt ra ngoài các chính sách tĩnh để đảm bảo dữ liệu ở chính xác nơi cần thiết nhất.
Giai đoạn ban đầu mở rộng bộ đệm DirectFlow vào các ổ SSD NVMe cục bộ, cho phép dữ liệu được truy cập thường xuyên ở gần các tài nguyên tính toán.Điều này làm giảm sự phụ thuộc vào lưu trữ chia sẻ hoặc kết nối mạng cho dữ liệu hoạt động, cải thiện thời gian phản hồi cho khối lượng công việc quan trọng và tối ưu hóa hiệu suất hơn nữa.
Ngoài ra, nền tảng này giới thiệu các điều khiển ghi lại KVCache, chỉ duy trì dữ liệu suy luận quan trọng cho lưu trữ lâu dài.Điều này giảm thiểu hoạt động I / O không cần thiết trong khi duy trì các đảm bảo bền vững được yêu cầu bởi các đường ống suy luận AI sản xuất, đạt được sự cân bằng giữa hiệu quả và độ tin cậy.
VDURA cũng đang triển khai một framework Context Cache Tiering thống nhất bao gồm DRAM và SSD cục bộ.làm cho nó phù hợp với các trường hợp sử dụng như suy luận LLM ngữ cảnh dài và phát triển tăng cường truy xuất (RAG).
VDURA lưu ý rằng các giai đoạn tương lai của Context-Aware Tiering sẽ mở rộng sang vị trí dữ liệu theo ứng dụng, tăng cường sự nhất quán bộ nhớ cache trên các nút,và hỗ trợ cho các thành phần cơ sở hạ tầng mới nổi như NVIDIA BlueField-4 DPUs tiếp tục mở rộng khả năng của nền tảng khi khối lượng công việc AI phát triển.
Để bổ sung cho các cải tiến phần mềm này, công ty đã giới thiệu các cấu hình nền tảng tối ưu hóa kết hợp các bộ xử lý AMD EPYC Turin với bộ chuyển đổi mạng NVIDIA ConnectX-7.Các cấu hình này được xây dựng đặc biệt để bổ sung cho các đường dẫn dữ liệu có khả năng RDMA, hỗ trợ thông tin liên lạc tốc độ cao, độ trễ thấp giữa các cụm GPU và hệ thống lưu trữ, thiết lập một chuẩn mực mới cho cơ sở hạ tầng AI gốc GPU.
Tập trung vào đường ống dẫn dữ liệu AI đầy đủ
Giám đốc điều hành VDURA Ken Claffey nhấn mạnh sự tập trung của công ty vào việc cung cấp một nền tảng lưu trữ AI trải dài toàn bộ hệ thống phân cấp dữ liệu từ bộ nhớ đến lưu trữ dài hạn, mà không hề thỏa hiệp về hiệu suất.Ông nhấn mạnh rằng nền tảng này tận dụng RDMA để trực tiếp, truy cập dữ liệu không có CPU và Context-Aware Tiering để định vị dữ liệu một cách thông minh qua các tầng lưu trữ ‡ những đổi mới giúp các tổ chức hỗ trợ các mô hình AI lớn hơn, xử lý nhiều yêu cầu suy luận hơn,và mở rộng cơ sở hạ tầng AI trong khi đáp ứng các yêu cầu độ tin cậy cấp sản xuất.
Cách tiếp cận kết hợp này được thiết kế đặc biệt để hỗ trợ kích thước mô hình lớn hơn, tăng thông lượng suy luận,và cải thiện hiệu quả cơ sở hạ tầng tổng thể, đồng thời duy trì các tiêu chuẩn độ tin cậy và tuân thủ cần thiết cho việc triển khai AI sản xuất.
Có sẵn
Hỗ trợ RDMA hiện có sẵn trên nền tảng VDURA V5000 và V7000, sẵn sàng triển khai ngay lập tức.với các chương trình truy cập sớm hiện đang được tiến hành cho các khách hàng được chọn để thử nghiệm và tối ưu hóa công nghệ trước khi phát hành đầy đủ.
Công ty công nghệ Bắc Kinh Qianxing Jietong Co., Ltd.
Sandy Yang - Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Tập trung kinh doanh:
Phân phối sản phẩm ICT / tích hợp hệ thống & dịch vụ / giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
Sử dụng công nghệ để xây dựng một thế giới thông minh Nhà cung cấp dịch vụ sản phẩm ICT đáng tin cậy của bạn!
Sandy Yang - Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Tập trung kinh doanh:
Phân phối sản phẩm ICT / tích hợp hệ thống & dịch vụ / giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
Sử dụng công nghệ để xây dựng một thế giới thông minh Nhà cung cấp dịch vụ sản phẩm ICT đáng tin cậy của bạn!



