Bối cảnh lưu trữ dành cho đào tạo và suy luận AI bị chi phối bởi bộ lưu trữ đối tượng và tệp tầm trung có quy mô lớn, hỗ trợ GPU NVIDIA Direct, KV Caches và kiến trúc STX để giữ cho GPU xử lý dữ liệu mã thông báo. Tuy nhiên, khối lượng lớn dữ liệu doanh nghiệp nằm trên các mảng nguyên khối cao cấp của Dell PowerMax, Hitachi Vantara VSP One Block High End, IBM DS6000 và Lenovo InfiniBox — không có mảng nào hỗ trợ STX và các thành phần liên quan của nó.Chúng tôi đã phỏng vấn David Chapa, Giám đốc chiến lược AI tại Hitachi Vantara, để khám phá khoảng trống này.
Chapa tuyên bố rằng NVIDIA BlueField-4 STX đánh dấu một bước phát triển rộng hơn về kiến trúc cơ sở hạ tầng AI. Mảng doanh nghiệp truyền thống được xây dựng để xử lý yêu cầu lưu trữ hiệu quả, trong khi STX thay đổi việc tạo ra giá trị trong cơ sở hạ tầng AI. Các mảng cao cấp kế thừa ưu tiên độ bền, khả năng phục hồi, hiệu suất, thời gian hoạt động và các dịch vụ dữ liệu tập trung. Ngược lại, STX đưa nhiều thông tin hơn vào quy trình xử lý dữ liệu, mang lại tính bảo mật, điều phối, định vị dữ liệu, phối hợp bộ nhớ và dịch vụ dữ liệu gần hơn với GPU và môi trường thời gian chạy AI.
Trọng tâm cốt lõi không phải là liệu các khả năng này có phải chạy nguyên bản trên mảng lưu trữ hay không, mà là cách triển khai chúng một cách tối ưu trên các đường dẫn dữ liệu AI. Hitachi Vantara không coi sự không tương thích hiện tại là hạn chế của các mảng của mình mà là một lựa chọn kiến trúc tự nhiên trong bối cảnh cơ sở hạ tầng AI đang phát triển. Các mảng doanh nghiệp cao cấp vẫn đóng vai trò quan trọng trong việc cung cấp các dịch vụ dữ liệu đáng tin cậy, bao gồm khả năng phục hồi, tính khả dụng, hiệu suất, độ bền và quản lý thống nhất.
Khi các đường dẫn dữ liệu AI ngày càng phụ thuộc vào các dịch vụ được tăng tốc DPU, các lớp điều phối, bộ nhớ đệm và thực thi nhận biết cục bộ, một số chức năng sẽ tiến gần hơn đến tài nguyên điện toán, trong khi các mảng doanh nghiệp tiếp tục tập trung vào sức mạnh cốt lõi của chúng: dịch vụ dữ liệu đáng tin cậy.
Khi được hỏi liệu các mảng cao cấp của Hitachi Vantara cuối cùng có tích hợp với NVIDIA STX hay không, Chapa lưu ý rằng STX và CMX đại diện cho những thành tựu kỹ thuật đáng kể. Cuộc thảo luận ít về lộ trình sản phẩm mà nhiều hơn về định vị kiến trúc để phát triển các hệ thống AI.
Cơ sở hạ tầng AI hiện đại bộc lộ những hạn chế chưa từng có trong kiến trúc doanh nghiệp truyền thống. Thách thức ngày nay không nằm ở bộ lưu trữ độc lập, GPU hay hiệu suất mạng mà là sức mạnh tổng hợp của dữ liệu, bộ nhớ, điện toán, bảo mật và điều phối khi quy mô triển khai AI.
STX hợp nhất nhiều đường dẫn dữ liệu AI hơn vào ngăn xếp tích hợp của NVIDIA thông qua DPU BlueField, các thiết kế mạng và tham chiếu giúp định hình sự tích hợp và sự khác biệt của nhà cung cấp. CMX nhắm mục tiêu cụ thể vào bộ nhớ ngữ cảnh, bộ đệm KV và trạng thái suy luận. Hitachi Vantara không coi những công nghệ này là một nỗ lực nhằm vượt qua bộ nhớ doanh nghiệp mà là một ngành phân chia giữa hai loại dữ liệu riêng biệt: dữ liệu thời gian chạy tạm thời cho các công việc AI và dữ liệu doanh nghiệp được quản lý, liên tục tồn tại rất lâu sau khi các nhiệm vụ AI hoàn thành.
Hai loại dữ liệu mang các ràng buộc hoạt động khác nhau. Bộ nhớ đệm KV và ngữ cảnh suy luận có thời gian tồn tại ngắn và nhạy cảm với độ trễ, khiến chúng phù hợp hơn để chạy gần GPU, tầng bộ nhớ hoặc thời gian chạy AI. Khi so sánh, dữ liệu kinh doanh cốt lõi, kiểm soát tuân thủ và dịch vụ dữ liệu toàn doanh nghiệp yêu cầu cơ sở hạ tầng mạnh mẽ được xây dựng để sử dụng lâu dài, quản trị, khả năng phục hồi và hoạt động doanh nghiệp quy mô lớn.
Đối với Hitachi Vantara, việc kích hoạt hỗ trợ STX trên các mảng cao cấp không chỉ là một bản cập nhật chương trình cơ sở đơn giản. Nó liên quan đến những cân nhắc cơ bản xung quanh vị trí dữ liệu, tải bộ nhớ, tính bền vững của dữ liệu, ranh giới bảo mật, điều phối và vị trí tối ưu của các dịch vụ cơ sở hạ tầng.
Ưu tiên là xác định vị trí chức năng khi cơ sở hạ tầng AI trưởng thành, xác định các điểm khác biệt, xác định phạm vi tích hợp hợp lý và phân bổ nguồn lực kỹ thuật để tối đa hóa giá trị khách hàng.
NVIDIA đã giải quyết một cách hiệu quả các nút thắt chính trên cơ sở hạ tầng AI, tuy nhiên các phương pháp tiếp cận kiến trúc của nó không phù hợp với tất cả khách hàng, khối lượng công việc hoặc chiến lược nền tảng. Hitachi Vantara phân biệt những thay đổi kiến trúc lâu dài với các xu hướng tính năng ngắn hạn, đánh giá sự tích hợp mang lại giá trị hữu hình và chỉ đạo các nỗ lực phát triển nhằm mang lại lợi ích lớn nhất cho người dùng.
Hitachi Vantara đặt mảng doanh nghiệp cao cấp của mình bên ngoài chuỗi phân phối dữ liệu trực tiếp cho các máy chủ GPU vì cho rằng sự tích hợp như vậy không phù hợp về mặt kiến trúc. Các nền tảng này đóng vai trò là hệ thống bản ghi cốt lõi được tối ưu hóa cho độ bền, quản trị, khả năng phục hồi và hoạt động ở quy mô doanh nghiệp, thay vì bối cảnh suy luận và bộ nhớ đệm KV nhất thời, có độ trễ quan trọng.
Chúng tôi tin rằng các mảng doanh nghiệp cao cấp như VSP One Block High End sẽ áp dụng các công cụ AI như tác nhân thông minh nội bộ để hợp lý hóa việc quản lý. Khi AI tác nhân và suy luận chính thống đạt được sức hút, các doanh nghiệp sẽ yêu cầu quyền truy cập vào dữ liệu bản ghi cốt lõi cho khối lượng công việc AI. Cuối cùng, các đường dẫn dữ liệu AI sẽ mở rộng để kết hợp các mảng doanh nghiệp cao cấp làm nguồn dữ liệu chính.
Công ty TNHH Công nghệ Qianxing Jietong Bắc Kinh
Sandy Yang/Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Trọng tâm kinh doanh:
Phân phối sản phẩm CNTT/Tích hợp hệ thống & Dịch vụ/Giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu thế giới để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
“Sử dụng công nghệ để xây dựng một thế giới thông minh”Nhà cung cấp dịch vụ sản phẩm CNTT đáng tin cậy của bạn!