MinIO đã phát hành MemKV, một bộ nhớ ngữ cảnh chuyên dụng được xây dựng để giải quyết một nút thắt quan trọng trong các đường ống suy luận AI quy mô lớn.Phục vụ như là giải pháp hàng đầu thứ hai của MinIO bên cạnh AIStor, MemKV mở rộng cơ sở hạ tầng dữ liệu của công ty vào tầng bộ nhớ. Nó được thiết kế để cung cấp dữ liệu ngữ cảnh liên tục, được chia sẻ cho khối lượng công việc AI đại lý chạy trên các cụm GPU phân tán.
MINIO AIStor
Khi các hệ thống AI tiến triển từ các phản hồi một lần đến lý luận nhiều lần và thực hiện nhiệm vụ tự động, duy trì bối cảnh liên tục trên các chu kỳ suy luận ngày càng trở nên cần thiết.Dưới kiến trúc hiện có, dữ liệu ngữ cảnh thường bị loại bỏ do dung lượng hạn chế của các lớp bộ nhớ liền kề GPU bao gồm HBM và DRAM. Điều này buộc GPU phải tính toán lại ngữ cảnh hiện có nhiều lần, tăng độ trễ,sử dụng tính toán và tiêu thụ năng lượng. MinIO định nghĩa khối lượng công việc dư thừa này là "thuế tính toán lại", một sự thiếu hiệu quả tồi tệ hơn theo cấp số nhân trong môi trường đám mây siêu quy mô.
MemKV được thiết kế để giảm bớt điểm đau này thông qua một lớp bộ nhớ liên tục được chia sẻ có khả năng lưu trữ quy mô petabyte với độ trễ truy cập ở mức microsecond.Bằng cách giữ dữ liệu ngữ cảnh trong suốt các luồng công việc suy luận, nền tảng cắt giảm tính toán dư thừa và tăng hiệu quả cơ sở hạ tầng tổng thể.Dữ liệu so sánh nội bộ từ MinIO xác minh độ trễ thời gian đến đầu tiên được cải thiện trong sự đồng thời cấp độ sản xuấtTrong một triển khai điển hình được trang bị 128 GPU và cửa sổ ngữ cảnh mã thông báo 128K, việc sử dụng GPU đã tăng từ khoảng 50% lên hơn 90%, chuyển thành giảm chi phí tính toán hàng năm đáng kể.
Các giám đốc điều hành của MinIO đã tuyên bố rằng chi phí cộng lại vẫn không thể nhận thấy trong các triển khai quy mô nhỏ nhưng lại trở thành một lỗ hổng cấu trúc cơ bản ở quy mô doanh nghiệp.tái tạo bối cảnh lặp đi lặp lại gây ra mức tiêu thụ năng lượng và chi phí cơ sở hạ tầng cao hơn, làm cho các hệ thống bộ nhớ chuyên biệt là không thể thiếu cho hoạt động AI bền vững.
Giải quyết vấn đề cân bằng trí nhớ
Cơ sở hạ tầng AI cũ buộc các nhà phát triển phải thỏa hiệp giữa tốc độ truy cập và dung lượng lưu trữ.Các lớp bộ nhớ hiệu suất cao như HBM và DRAM cung cấp độ trễ microsecond nhưng có giới hạn công suất chặt chẽ và chi phí caoNgược lại, các hệ thống lưu trữ thông thường cung cấp khả năng mở rộng lớn nhưng bị trễ ở mức độ millisecond, khiến chúng không tương thích với suy luận thời gian thực và các nhiệm vụ lý luận ngữ cảnh dài.
Micron HBM4
MemKV thu hẹp khoảng cách trong ngành này bằng cách giới thiệu một lớp bộ nhớ chia sẻ trung gian cân bằng độ trễ cực thấp và khả năng mở rộng lưu trữ lớn.Tương thích với NVIDIA BlueField-4 STX và tích hợp với NVIDIA Dynamo cùng với các công cụ NIXL, giải pháp cho phép toàn bộ các cụm GPU truy cập vào các hồ dữ liệu ngữ cảnh thống nhất với tốc độ truyền kết luận.Thiết kế này loại bỏ việc di chuyển dữ liệu ngữ cảnh thường xuyên giữa bộ nhớ cô lập và lớp lưu trữ, giảm độ trễ và tăng công suất hệ thống.
NVIDIA BlueField-4
Kiến trúc được tối ưu hóa cho khối lượng công việc suy luận
Được thiết kế độc quyền cho các đường ống dẫn dữ liệu suy luận, MemKV phù hợp với lớp G3.5 của khuôn khổ phân cấp bộ nhớ GPU của MinIO.nó đạt được dung lượng cấp độ petabyte trong khi giữ độ trễ truy cập microsecond, tách thành công khả năng mở rộng bộ nhớ khỏi tài nguyên tính toán GPU.
Hệ thống từ bỏ các trừu tượng lưu trữ truyền thống phức tạp, chuyển dữ liệu trực tiếp từ ổ đĩa NVMe sang các đường ống dữ liệu AI thông qua truyền RDMA từ đầu đến cuối.Điều này cắt giảm hiệu suất overhead mang lại bởi các giao thức HTTP, chuyển đổi hệ thống tệp và máy chủ lưu trữ trung gian Ứng dụng thông thường trong kiến trúc lưu trữ dựa trên đối tượng và tệp.
Nguồn: Google
Các tối ưu hóa kiến trúc chính bao gồm thực thi nhị phân ARM64 gốc trên NVIDIA BlueField-4 STX, được nhúng trực tiếp trong lớp lưu trữ để giảm sự phụ thuộc vào các nút lưu trữ x86 bên ngoài.Tất cả các chuyển dữ liệu giữa bộ nhớ GPU và lưu trữ NVMe áp dụng truyền RDMANgoài ra, MemKV sử dụng kích thước khối mở rộng từ 2 MB đến 16 MB,được tối ưu hóa cho các đặc điểm thông lượng GPU thay vì các khối lưu trữ 4 KB cũNó hỗ trợ các loại kết nối tốc độ cao tiên tiến như NVIDIA Spectrum-X Ethernet và PCIe Gen6, tạo điều kiện truyền dữ liệu gần tốc độ dây qua các cụm.
Có sẵn
MinIO MemKV hiện có sẵn thương mại để triển khai doanh nghiệp.
Công ty công nghệ Bắc Kinh Qianxing Jietong Co., Ltd.
Sandy Yang - Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Tập trung kinh doanh:
Phân phối sản phẩm ICT / tích hợp hệ thống & dịch vụ / giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
Sử dụng công nghệ để xây dựng một thế giới thông minh Nhà cung cấp dịch vụ sản phẩm ICT đáng tin cậy của bạn!
Sandy Yang - Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Tập trung kinh doanh:
Phân phối sản phẩm ICT / tích hợp hệ thống & dịch vụ / giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
Sử dụng công nghệ để xây dựng một thế giới thông minh Nhà cung cấp dịch vụ sản phẩm ICT đáng tin cậy của bạn!



