Qdrant, một nhà cung cấp các giải pháp tìm kiếm vector và cơ sở dữ liệu có thể kết hợp đã triển khai hiệu suất lập chỉ mục nâng cao, cơ chế chuyển đổi lỗi cụm ba vùng,và các tính năng ghi nhật ký kiểm toán tập trung vào tuân thủ.
Công ty phát triển một cơ sở dữ liệu vector độc lập để lưu trữ các bản nhúng được yêu cầu bởi các mô hình ngôn ngữ lớn (LLM) và các đại lý AI tự trị,thường cung cấp các luồng công việc suy luận AI như Retrieval-Augmented Generation (RAG)Theo Qdrant, các nhóm mua sắm doanh nghiệp luôn đánh giá các công cụ tìm kiếm vector theo ba tiêu chí cốt lõi: khả năng mở rộng cho khối lượng công việc ngày càng tăng, tính liên tục dịch vụ trong bối cảnh cơ sở hạ tầng thất bại,và kiểm toán hoạt động có thể truy xuất.
André Zayarni, đồng sáng lập và Giám đốc điều hành của Qdrant, nhận xét: GPU không còn giới hạn trong suy luận mô hình; chúng cũng tối ưu hóa lập chỉ mục dữ liệu.Chúng tôi đã cho phép xây dựng HNSW GPU tăng tốc trong phiên bản mã nguồn mở của chúng tôi kể từ v1.13, và khả năng này bây giờ chính thức có sẵn trên Qdrant Cloud.bộ tích hợp trang bị cho các doanh nghiệp triển khai Qdrant cho khối lượng công việc sản xuất quan trọng.
Các nâng cấp sản phẩm mới nhất của Qdrant bao gồm ba cải tiến chính:
Chỉ mục hóa tăng tốc GPU: Các thử nghiệm chuẩn xác nhận GPU chuyên dụng tăng tốc độ xây dựng chỉ số HNSW lên đến bốn lần trên Qdrant Cloud.Người dùng có thể gắn các tài nguyên GPU vào các cụm hiện có để xử lý các vụ nổ lập chỉ mục cường độ cao hiệu quả.
Các nhóm vùng đa khả dụng (AZ): Cơ chế sao chép chéo AZ trùng lặp dữ liệu qua ba vùng sẵn có trong một khu vực duy nhất. Nó loại bỏ thời gian trễ chuyển đổi bằng tay,đảm bảo hoạt động đọc-viết không bị gián đoạn ngay cả khi một vùng sẵn có bị mất điện.
Ghi nhật ký kiểm toán: Chức năng ghi lại tất cả các hoạt động dựa trên API, bao gồm truy vấn dữ liệu, bổ sung, xóa, quản lý bộ sưu tập và các nhiệm vụ chụp nhanh.đánh dấu danh tính người dùngKhi các hệ thống tự trị thực hiện các tác vụ dựa trên dữ liệu thu hồi, các nhật ký cung cấp các đường dẫn kiểm toán rõ ràng cho các nguồn yêu cầu,thời gian thực hiện và tính hợp pháp truy cập. Người dùng có thể tùy chỉnh chu kỳ lưu giữ nhật ký và xuất hồ sơ bên ngoài thông qua API để lưu trữ lâu dài.
Hiện nay, lập chỉ mục tăng tốc GPU có thể truy cập trên AWS, với kế hoạch mở rộng phạm vi bảo hiểm đến nhiều nhà cung cấp và khu vực đám mây hơn.cung cấp thời gian hoạt động được hỗ trợ bởi SLA là 99.95%. Tính năng ghi nhật ký kiểm toán mở cho tất cả các cụm đám mây Qdrant trả tiền.
Tài liệu chính thức cung cấp thêm chi tiết về ba khả năng mới.
Phụ lục
Hierarchical Navigable Small World (HNSW) là một thuật toán được thiết kế để xác định vector hàng xóm gần nhất.mà mở rộng mạnh mẽ với khối lượng dữ liệu ngày càng tăng. HNSW xếp chồng nhiều lớp đồ thị ảo: lớp thưa thớt trên cùng chứa các vector tối thiểu để tìm kiếm sơ bộ nhanh chóng,trong khi các lớp dưới lưu trữ ngày càng nhiều vector cho đến khi lớp dưới bao gồm tất cả các điểm dữ liệuMỗi lớp hoạt động như là một điểm đầu vào tối ưu cho tiếp theo, giảm đáng kể độ trễ tìm kiếm tổng thể.
Qdrant phải đối mặt với sự cạnh tranh từ nhiều đối tác trong ngành. Pinecone cũng áp dụng thuật toán HNSW và tận dụng GPU NVIDIA để tối ưu hóa hiệu suất nhúng và xếp hạng lại.Zilliz cung cấp cả khả năng tương thích HNSW và gia tốc GPU; cơ sở dữ liệu Milvus cơ bản của nó tích hợp Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) từ thư viện RAPIDS cuVS để cho phép lập chỉ mục GPU.
Công ty công nghệ Bắc Kinh Qianxing Jietong Co., Ltd.
Sandy Yang - Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Tập trung kinh doanh:
Phân phối sản phẩm ICT / tích hợp hệ thống & dịch vụ / giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
Sử dụng công nghệ để xây dựng một thế giới thông minh Nhà cung cấp dịch vụ sản phẩm ICT đáng tin cậy của bạn!