Nhà Các trường hợp

IBM giới thiệu Content-Aware-Storage cho RAG Workloads

Tất cả sản phẩm

Máy chủ lưu trữ Rack
(165)

Máy chủ Huawei Fusion
(31)

Máy chủ Dell Poweredge
(59)

Máy chủ H3C
(30)

Công tắc Datacom
(97)

Thiết bị WLAN
(21)

Bộ định tuyến không dây thông minh
(10)

Ổ cứng HDD
(24)

Ổ cứng bên trong SSD
(16)

Thẻ đồ họa Geforce
(27)

Bộ xử lý CPU INTEL
(20)

Bộ nhớ máy chủ RAM
(6)

Máy chủ lưu trữ được tân trang
(6)

Mô-đun thu phát SFP
(4)

chuyển đổi kênh sợi quang
(42)

Chứng nhận

Trung Quốc Beijing Qianxing Jietong Technology Co., Ltd. Chứng chỉ

Khách hàng đánh giá

Các nhân viên kinh doanh của Beijing Qianxing Jietong Technology Co., Ltd rất chuyên nghiệp và kiên nhẫn. Họ có thể cung cấp báo giá một cách nhanh chóng. Chất lượng và bao bì của sản phẩm cũng rất tốt. Sự hợp tác của chúng tôi rất suôn sẻ.

—— 《Festfing DV》 LLC

Khi tôi đang tìm kiếm gấp CPU intel và SSD Toshiba, Sandy từ Beijing Qianxing Jietong Technology Co., Ltd đã giúp đỡ tôi rất nhiều và nhanh chóng nhận được sản phẩm tôi cần. Tôi thực sự đánh giá cao cô ấy.

—— Kitty Yen

Sandy của Beijing Qianxing Jietong Technology Co., Ltd là một nhân viên bán hàng rất cẩn thận, người có thể nhắc nhở tôi về lỗi cấu hình kịp thời khi tôi mua máy chủ. Các kỹ sư cũng rất chuyên nghiệp và có thể nhanh chóng hoàn thành quá trình thử nghiệm.

—— Strelkin Mikhail Vladimirovich

Chúng tôi rất hài lòng với trải nghiệm làm việc với Bắc Kinh Qianxing Jietong. Chất lượng sản phẩm tuyệt vời và giao hàng luôn đúng hẹn. Đội ngũ bán hàng của họ chuyên nghiệp, kiên nhẫn và rất hữu ích với tất cả các câu hỏi của chúng tôi. Chúng tôi thực sự đánh giá cao sự hỗ trợ của họ và mong muốn có một mối quan hệ đối tác lâu dài. Rất khuyến khích!

—— Ahmad Navid

Chất lượng: Kinh nghiệm tuyệt vời với nhà cung cấp của tôi. MikroTik RB3011 đã được sử dụng, nhưng nó ở trong tình trạng rất tốt và mọi thứ hoạt động hoàn hảo.và tất cả những lo ngại của tôi đã được giải quyết nhanh chóng- Nhà cung cấp rất đáng tin cậy.

—— Geran Colesio

Tôi trò chuyện trực tuyến bây giờ

IBM giới thiệu Content-Aware-Storage cho RAG Workloads

April 24, 2026

IBM đã công bố một kiến trúc lưu trữ nhận thức nội dung (CAS) nhúng xử lý dữ liệu AI trực tiếp trong lớp lưu trữ.Cách tiếp cận này được thiết kế riêng cho các luồng công việc phát triển tăng cường thu hồi (RAG), vì nó tích hợp vectorization tài liệu vào hệ thống lưu trữ chính nó giảm nhu cầu về các đường ống xử lý trước bên ngoài.

CAS chuyển một chức năng RAG quan trọng  nhúng tài liệu thông qua các phương pháp dựa trên mô hình ngôn ngữ lớn (LLM)  vào cơ sở hạ tầng lưu trữ.Điều này cho phép các doanh nghiệp xử lý và lập chỉ mục dữ liệu tại vị trí hiện tại của nó, điều chỉnh các hệ thống lưu trữ với khối lượng công việc dựa trên AI và giảm thiểu chuyển động dữ liệu qua các tầng cơ sở hạ tầng khác nhau.IBM đặt vị trí này như một phương tiện để đơn giản hóa việc triển khai trong khi tăng hiệu suất và nâng cao vị trí dữ liệu cho các ứng dụng AI.

Cơ sở dữ liệu vector ở quy mô

Tại trung tâm của việc triển khai CAS của IBM là một cơ sở dữ liệu vector được tối ưu hóa cho tìm kiếm ngữ nghĩa.cho phép các hệ thống AI truy xuất các đoạn dữ liệu có liên quan dựa trên các số liệu tương đồng như tương đồng cosinus hoặc khoảng cách L2Khả năng này là cơ bản cho RAG, nơi các truy vấn của người dùng được chuyển đổi thành vector và khớp với dữ liệu doanh nghiệp được lập chỉ mục để cung cấp các phản hồi nhận thức ngữ cảnh.

IBM CAS Chart

IBM Research, hợp tác với Samsung và NVIDIA, đã giới thiệu một hệ thống nguyên mẫu có khả năng mở rộng đến 100 tỷ vector trên một máy chủ duy nhất.Hệ thống đạt được hơn 90 phần trăm nhớ lại và chính xác, với độ trễ truy vấn trung bình dưới 700 mili giây. quy mô này phục vụ cho môi trường doanh nghiệp nơi các bộ dữ liệu có thể trải dài hàng tỷ tệp và, một khi được lập chỉ mục đầy đủ,phát triển đến hàng trăm tỷ vector.

Tích hợp đường ống RAG

RAG đang trở thành một cách tiếp cận được ưa chuộng cho AI doanh nghiệp, vì nó tăng độ chính xác đầu ra mà không cần đào tạo lại mô hình.Nó hoạt động bằng cách bổ sung yêu cầu với dữ liệu cụ thể của doanh nghiệp lấy từ cơ sở dữ liệu vector.

Các đường ống bắt đầu với việc hấp thụ dữ liệu, nơi các tài liệu như PDF và bản trình bày được phân tích, chia thành các mảnh, và chuyển đổi thành các bản nhúng.Những bản nhúng này được lưu trữ trong cơ sở dữ liệu vector tổ chức dữ liệu để tìm kiếm sự tương đồng hiệu quảTrong quá trình truy vấn, đầu vào của người dùng được nhúng và khớp với các vector được lưu trữ, với nội dung có liên quan được truyền đến mô hình ngôn ngữ như ngữ cảnh.Cơ chế nối đất này làm giảm ảo giác và tăng niềm tin vào các kết quả được tạo ra bởi AI.

IBM CAS tích hợp toàn bộ đường ống này trực tiếp vào lưu trữ, củng cố hấp thụ, lập chỉ mục và truy xuất gần dữ liệu.

Giải quyết các thách thức về quy mô và chi phí

Các hệ thống lưu trữ doanh nghiệp đã hoạt động ở quy mô petabyte. Khi mở rộng đến CAS, mỗi tệp có thể tạo ra hàng trăm vector, nhanh chóng mở rộng kích thước bộ dữ liệu.Cơ sở dữ liệu vector truyền thống thường mở rộng trên nhiều máy chủ, đưa ra chi phí bổ sung và sự phức tạp của hoạt động.

Phương pháp tiếp cận của IBM tập trung vào việc cải thiện mật độ vector và giảm chi phí indexing để hạn chế sự lan rộng cơ sở hạ tầng.cho phép mở rộng quy mô độc lập của các nguồn lưu trữ và tính toánĐiều này được thực hiện bởi IBM Storage Scale và hệ thống tệp song song hiệu suất cao của nó.

Cơ sở lưu trữ và kiến trúc phần cứng

Việc triển khai CAS tận dụng IBM Storage Scale System 6000 (ESS 6000), một nền tảng toàn flash được thiết kế cho AI và khối lượng công việc hiệu suất cao.Hệ thống hỗ trợ tối đa 48 ổ NVMe cho mỗi vỏ 4U, với dung lượng ổ đĩa riêng từ 7 TB đến 60 TB. Nó tích hợp kết nối PCIe Gen5, 400 Gb InfiniBand hoặc 200 Gb Ethernet,cung cấp tới 340 GB/s đọc và 175 GB/s ghi thông lượng mỗi nút, cùng với tối đa 7 triệu IOPS.

Nền tảng này cũng hỗ trợ NVIDIA GPUDirect Storage, tạo điều kiện cho các đường dẫn dữ liệu trực tiếp giữa bộ lưu trữ và GPU, cũng như các DPU BlueField-3 để giảm tải các nhiệm vụ mạng và xử lý dữ liệu.

Samsung PM9D3a PCIe Gen5 NVMe SSD cung cấp dung lượng lưu trữ mật độ cao, dung lượng lưu trữ cao. Dựa trên thế hệ thứ tám TLC V-NAND, các ổ đĩa này cung cấp dung lượng lên đến 30,72 TB mỗi thiết bị.với tốc độ đọc tuần tự lên đến 12 GB/s và tốc độ ghi lên đến 6.8 GB / s. Việc sử dụng các ổ SSD doanh nghiệp có sẵn trên thị trường cho phép kiến trúc mở rộng quy mô bằng cách sử dụng các thành phần tiêu chuẩn.

Chỉ mục phân cấp và tăng tốc GPU

Để giải quyết việc lập chỉ mục theo quy mô, IBM đã phát triển một mô hình lập chỉ mục phân cấp bao gồm nhiều chỉ mục con có thể được tối ưu hóa độc lập.Cấu trúc này cho phép cập nhật từng bước và lập chỉ mục lại địa phương mà không làm gián đoạn toàn bộ bộ dữ liệu, cải thiện cả tính sẵn sàng và hiệu quả hoạt động.

Tăng tốc GPU làm giảm đáng kể thời gian lập chỉ mục so với các phương pháp chỉ sử dụng CPU.Xây dựng các chỉ số cho 100 tỷ vector mất 4 ngày với 6 GPU NVIDIA H200, so với ước tính 120 ngày trên một hệ thống CPU hai ổ cắm.

Toàn bộ dữ liệu, bao gồm các vector và chỉ mục, tiêu thụ khoảng 153 TiB dung lượng lưu trữ.Hệ thống kết quả cung cấp một độ trễ truy vấn trung bình 694ms với 90% nhớ, được xác nhận dựa trên các tính toán thực tế cơ bản.

Bản đồ hành trình

IBM và NVIDIA đang tiếp tục tối ưu hóa nền tảng, tập trung vào việc giảm độ trễ lập chỉ mục và truy vấn.Giảm thời gian hấp thu dữ liệu từ chín ngày xuống một ngày, và giảm độ trễ truy vấn xuống khoảng 50-100 mili giây trong khi duy trì 90 phần trăm nhớ lại.

Tích hợp lập chỉ mục vector vào các hệ thống tập tin tiêu chuẩn nhằm mục đích đơn giản hóa việc triển khai và giảm rào cản cho việc áp dụng AI doanh nghiệp.IBM đang định vị CAS như một lớp nền tảng cho cơ sở hạ tầng hỗ trợ AI.

Công ty công nghệ Bắc Kinh Qianxing Jietong Co., Ltd.
Sandy Yang - Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Tập trung kinh doanh:
Phân phối sản phẩm ICT / tích hợp hệ thống & dịch vụ / giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
Sử dụng công nghệ để xây dựng một thế giới thông minh Nhà cung cấp dịch vụ sản phẩm ICT đáng tin cậy của bạn!

PREV: Dell PowerMaxOS 10.4 bao gồm tăng hiệu suất, tăng khả năng phục hồi mạng và tích hợp ứng dụng hiện đại

NEXT: NetApp Mở rộng Tích hợp Google Cloud để Tinh giản Dữ liệu Doanh nghiệp cho AI

Chi tiết liên lạc

Beijing Qianxing Jietong Technology Co., Ltd.

Người liên hệ: Ms. Sandy Yang

Tel: 13426366826

IBM giới thiệu Content-Aware-Storage cho RAG Workloads

Máy chủ lưu trữ Rack

Máy chủ Huawei Fusion

Máy chủ Dell Poweredge

Máy chủ H3C

Công tắc Datacom

Thiết bị WLAN

Bộ định tuyến không dây thông minh

Ổ cứng HDD

Ổ cứng bên trong SSD

Thẻ đồ họa Geforce

Bộ xử lý CPU INTEL

Bộ nhớ máy chủ RAM

Máy chủ lưu trữ được tân trang

Mô-đun thu phát SFP

chuyển đổi kênh sợi quang

IBM giới thiệu Content-Aware-Storage cho RAG Workloads

Cơ sở dữ liệu vector ở quy mô

Tích hợp đường ống RAG

Giải quyết các thách thức về quy mô và chi phí

Cơ sở lưu trữ và kiến trúc phần cứng

Chỉ mục phân cấp và tăng tốc GPU

Bản đồ hành trình

Máy chủ lưu trữ Rack

12 khay 1U Rackmount Máy chủ Lenovo ThinkSystem SR630 Rack Server

ThinkSystem SR250 V2 4SFF Rack Storage Server Bộ xử lý Intel Xeon E-2378G

Máy chủ lưu trữ giá đỡ Intel C621A Máy chủ gắn giá đỡ 1U NF5180M6 1U

Máy chủ Huawei Fusion

FusionServer 5288 V6 4U Rack Server 32 DDR4 DIMMs 44 3.5 inch Đĩa cứng

Máy chủ lưu trữ mạng Huawei Fusion Server 1U mật độ cực cao 1288H V5

Bộ lưu trữ Flash kết hợp máy chủ Huawei Rack 5310 thế hệ mới OceanStor 5310