Đối với nhiều doanh nghiệp, kho dữ liệu đã chuyển từ một tài sản chiến lược thành một gánh nặng hoạt động.cùng với các dịch vụ dành riêng cho đám mây như Snowflake, đã cung cấp khả năng mở rộng và hiệu suất nhưng với chi phí khóa nhà cung cấp, giá cả không lường trước được và khả năng thích nghi kiến trúc hạn chế.
Khi sự giám sát pháp lý tăng cường và phân tích dựa trên AI trở thành trung tâm cho lợi thế cạnh tranh,các tổ chức đang đánh giá lại liệu các nền tảng kho hiện tại của họ có thực sự phù hợp với các mục tiêu kinh doanh dài hạn.
EDB Postgres® AI (EDB PG AI) giải quyết những thách thức này trực tiếp với WarehousePG, một kho dữ liệu mã nguồn mở, quy mô petabyte được thiết kế để khôi phục kiểm soát, tính dự đoán,và chủ quyền dữ liệu tất cả mà không ảnh hưởng đến hiệu suấtĐược xây dựng trên Postgres và được thiết kế cho phân tích song song lớn, WarehousePG cung cấp một cách hiện đại để thoát khỏi các hệ thống hạn chế trong khi cắt giảm tổng chi phí sở hữu (TCO) lên đến 58%.
Nguồn mở, phân tích quy mô Petabyte với Postgres ở cốt lõi của nó
Các kho dữ liệu doanh nghiệp hiện đang được kéo dài vượt ra ngoài giới hạn thiết kế ban đầu của họ.và phân tích dựa trên AI tất cả cùng tồn tại trong môi trường sản xuất đòi hỏi cả hiệu suất đặc biệt và sự linh hoạt kiến trúc.
Nền tảng độc quyền truyền thống và kho lưu trữ trên đám mây chỉ đấu tranh để đáp ứng các nhu cầu này đồng thời, buộc các tổ chức phải đánh đổi giữa chi phí, kiểm soát và chức năng.
EDB Postgres AI cho WarehousePG lấp đầy khoảng trống này bằng cách cung cấp một kho dữ liệu mở nguồn, quy mô petabyte hoàn toàn được xây dựng trên Postgres.và triển khai linh hoạt trên các cơ sở, đám mây, và môi trường lai, nó giải quyết những hạn chế của hệ thống cũ và đám mây độc quyền.
Kiến trúc: MPP dựa trên Postgres ở quy mô
Kiến trúc xử lý song song khổng lồ (MPP) của WarehousePG cho phép nó mở rộng trên hàng trăm nút.nó phân phối cả dữ liệu và thực thi truy vấn trên nhiều nút phân đoạn, được giám sát bởi một nút điều phối trung tâm.
Điều phối viên xử lý phân tích truy vấn, tối ưu hóa và lập kế hoạch thực hiện. Một khi kế hoạch truy vấn được hoàn tất, các nhiệm vụ được phân phối cho các phân đoạn,hoạt động song song trên phân vùng dữ liệu cục bộ của họCách tiếp cận này cho phép WarehousePG chạy các truy vấn phân tích phức tạp hiệu quả bao gồm các kết nối lớn, tổng hợp, chức năng cửa sổ và chuyển đổi trên các bộ dữ liệu quy mô petabyte.
Kiến trúc này loại bỏ các nút thắt vốn có của cơ sở dữ liệu đơn khối trong khi duy trì khả năng tương thích SQL đầy đủ với Postgres, giảm đáng kể đường cong học tập cho các nhóm dữ liệu hiện có.
Hiệu suất dự đoán mà không có hạn chế độc quyền
Không giống như các kho lưu trữ dựa trên đám mây dựa trên định giá dựa trên tiêu thụ và quản lý tài nguyên không minh bạch, WarehousePG cung cấp hành vi khối lượng công việc xác định và hiệu suất nhất quán.Việc phân bổ tài nguyên và thực thi truy vấn được kiểm soát hoàn toàn trong cụm, đảm bảo thời gian phản hồi ổn định ngay cả dưới khối lượng công việc phân tích hỗn hợp.
Là một giải pháp được cấp phép Apache 2.0 được xây dựng trên Postgres mã nguồn mở, WarehousePG giải phóng các doanh nghiệp khỏi các định dạng lưu trữ độc quyền và các công cụ thực thi được kiểm soát bởi nhà cung cấp.,di động, và triển khai bất cứ nơi nào tổ chức cần nó tại chỗ để tuân thủ quy định, trong đám mây công cộng để linh hoạt, hoặc trong các thiết lập lai để tối ưu hóa chi phí.
Sự độc lập kiến trúc này, kết hợp với giá trị dựa trên cốt lõi của EDB,cho phép giảm tới 58% chi phí sử dụng toàn bộ (TCO) đặc biệt là đối với các tổ chức di chuyển từ các nền tảng độc quyền tốn kém hoặc các kho đám mây không thể đoán trước.
Lưu trữ lai và truy cập SQL vào hồ dữ liệu
Môi trường phân tích hiện đại ngày càng lan rộng qua nhiều tầng lưu trữ.cho phép truy cập trực tiếp SQL vào dữ liệu bên ngoài được lưu trữ trong các cửa hàng đối tượng và hệ thống tệp phân tán, chẳng hạn như Amazon S3 và Hadoop Distributed File System (HDFS).
Với PXF, các kỹ sư dữ liệu có thể truy vấn các định dạng như Parquet, AVRO, JSON và CSV mà không cần sao chép dữ liệu vào kho.Điều này làm giảm đáng kể sự phức tạp của ETL và dư thừa lưu trữ trong khi cho phép một chiến lược hỗn hợp: các bộ dữ liệu được truy cập thường xuyên ở trong bộ lưu trữ hiệu suất cao của WarehousePG, trong khi dữ liệu được sử dụng ít thường xuyên nằm trong bộ lưu trữ đối tượng chi phí thấp.
Từ quan điểm kỹ thuật, cách tiếp cận này bảo tồn ngữ nghĩa SQL trên các lớp lưu trữ khác nhau, cho phép các nhóm phân tích làm việc với một mô hình dữ liệu logic duy nhất.
Tiêu thụ thời gian thực với FlowServer
Các đường ống chỉ phân phối hàng loạt không còn đủ cho nhiều trường hợp sử dụng phân tích.
FlowServer hỗ trợ phát trực tuyến sự kiện hiệu suất cao từ các nền tảng như Apache Kafka và RabbitMQ, cho phép các trường hợp sử dụng như phân tích hoạt động, phát hiện gian lận và giám sát thời gian thực.Bằng cách hấp thụ dữ liệu trực tiếp vào kho, các tổ chức loại bỏ thời gian trễ giữa các hệ thống hoạt động và hiểu biết phân tích.
Kiến trúc này cho phép tải công việc phát trực tuyến và hàng loạt tồn tại cùng nhau trong cùng một nền tảng phân tích, đơn giản hóa cơ sở hạ tầng và giảm lưu lượng dữ liệu.
AI trong cơ sở dữ liệu, ML và xử lý vector
Một tính năng chính của EDB Postgres AI cho WarehousePG là hỗ trợ phân tích trong cơ sở dữ liệu và AI, loại bỏ sự cần thiết phải di chuyển các bộ dữ liệu lớn sang các nền tảng học máy bên ngoài (ML).
WarehousePG tích hợp MADlib cho học máy dựa trên SQL, cho phép người dùng đào tạo và đánh giá các mô hình trực tiếp trong cơ sở dữ liệu bằng cách sử dụng các cấu trúc quan hệ quen thuộc.Nền tảng hỗ trợ các khung Python ML trong cơ sở dữ liệu, cho phép các nhà khoa học dữ liệu hoạt động trên quy mô mà không cần xuất dữ liệu.
Hỗ trợ vector gốc thông qua phần mở rộng pgvector cho phép tìm kiếm sự tương đồng, tìm kiếm ngữ nghĩa và tải công việc phát triển tăng cường truy xuất (RAG) trực tiếp trong kho.Khả năng này đang ngày càng trở nên quan trọng đối với các ứng dụng dựa trên AI kết hợp dữ liệu doanh nghiệp có cấu trúc với nội dung không có cấu trúc như tài liệu và nhật ký.
Bằng cách tập trung dữ liệu, phân tích và AI, WarehousePG làm giảm sự phức tạp của đường ống dẫn và tăng tốc thời gian để hiểu biết.
Có sẵn cao và sẵn sàng của doanh nghiệp
WarehousePG được thiết kế cho độ tin cậy cấp sản xuất. Sự sẵn có cao được đạt được thông qua một điều phối viên chờ, đảm bảo hoạt động không bị gián đoạn nếu điều phối viên chính thất bại.Tính dung nạp lỗi ở cấp phân đoạn cho phép khối lượng công việc tiếp tục chạy ngay cả khi các nút riêng lẻ không có sẵn.
Các tính năng doanh nghiệp bao gồm quản lý khối lượng công việc, lập lịch truy vấn dự đoán và khả năng quan sát toàn diện, đảm bảo hoạt động ổn định dưới nhu cầu phân tích nặng.
Quan trọng nhất, các tổ chức có quyền truy cập vào hỗ trợ 24/7 từ các chuyên gia Postgres của EDB, thu hẹp khoảng cách giữa tính linh hoạt nguồn mở và nhu cầu hoạt động của doanh nghiệp.
Di cư không bị gián đoạn
Đối với các tổ chức hiện đại hóa từ các nền tảng phân tích cũ, WarehousePG cung cấp một con đường rủi ro thấp.cho phép hiện đại hóa nhanh chóng mà không cần viết lại các truy vấn hoặc đào tạo lại các nhóm. Tỷ lệ ngang SQL cao cũng đơn giản hóa việc di chuyển từ các kho dữ liệu độc quyền dựa trên SQL khác.
Cách tiếp cận này cho phép các doanh nghiệp hiện đại hóa dần dần, bảo vệ tính liên tục kinh doanh trong khi lấy lại quyền kiểm soát ngăn xếp phân tích của họ.
Xây dựng lại kho lưu trữ cho phân tích hiện đại
EDB PG AI cho WarehousePG chứng minh rằng phân tích quy mô petabyte, sẵn sàng AI và chủ quyền dữ liệu không yêu cầu nền tảng độc quyền hoặc khóa đám mây.Tính mở rộng MPP, lưu trữ lai, ăn uống thời gian thực, và trong cơ sở dữ liệu AI và ML khả năng, WarehousePG cung cấp một nền tảng kỹ thuật mạnh mẽ cho phân tích doanh nghiệp hiện đại.
Đối với các tổ chức tìm kiếm một kho dữ liệu ưu tiên kiểm soát kiến trúc, hiệu suất dự đoán và kinh tế nguồn mở, WarehousePG cung cấp một lựa chọn thay thế hấp dẫn, chắc chắn trong tương lai.
Công ty công nghệ Bắc Kinh Qianxing Jietong Co., Ltd.
Sandy Yang - Giám đốc chiến lược toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Trang web: www.qianxingdata.com/www.storagesserver.com
Tập trung kinh doanh:
Phân phối sản phẩm ICT / tích hợp hệ thống & dịch vụ / giải pháp cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
Sử dụng công nghệ để xây dựng một thế giới thông minh Nhà cung cấp dịch vụ sản phẩm ICT đáng tin cậy của bạn!