Thông số kỹ thuật DapuStor J5060
| J5060 | |
|---|---|
| Dung lượng (TB) | 61,44 |
| Yếu tố hình thức | U.2 15mm |
| Giao diện | PCIe 4.0 x4, NVMe 1.4a, Hỗ trợ cổng kép |
| Băng thông đọc/ghi (128K) MB/s | 7400 / 3000 |
| Đọc/ghi ngẫu nhiên (4KB) K IOPS | 1500 / 30 (16KB) |
| Độ trễ ngẫu nhiên 4K (Điển hình) R/W µs | 105 (4KB) / 33 (16KB) |
| Độ trễ tuần tự 4K (Điển hình) R/W µs | 7 (4KB) / 12 (16KB) |
| Nguồn điện điển hình (W) | 23 |
| Nguồn điện khi không hoạt động (W) | 5 |
| Loại Flash | 3D Enterprise QLC NAND Flash |
| Độ bền | 0,5 DWPD |
| MTBF | 2 triệu giờ |
| UBER | 1 sector trên 10^17 bit đọc |
| Bảo hành | 5 năm |
Hiệu suất DapuStor J5060
Tạo điểm kiểm tra
Để đánh giá hiệu suất thực tế của ổ SSD DapuStor J5060 trong môi trường đào tạo AI, chúng tôi đã sử dụng công cụ benchmark Data and Learning Input/Output (DLIO). Được phát triển bởi Argonne National Laboratory, DLIO được thiết kế đặc biệt để kiểm tra các mẫu I/O trong khối lượng công việc học sâu. Nó cung cấp thông tin chi tiết về cách các hệ thống lưu trữ xử lý các thách thức như tạo điểm kiểm tra, nhập dữ liệu và đào tạo mô hình. Biểu đồ dưới đây minh họa cách cả hai ổ đĩa xử lý quy trình trên 99 điểm kiểm tra. Khi đào tạo các mô hình học máy, các điểm kiểm tra là cần thiết để lưu trạng thái của mô hình định kỳ, ngăn ngừa mất tiến độ trong quá trình gián đoạn hoặc mất điện. Nhu cầu lưu trữ này đòi hỏi hiệu suất mạnh mẽ, đặc biệt là dưới các khối lượng công việc liên tục hoặc chuyên sâu.
Nền tảng được chọn cho công việc này là Dell PowerEdge R760 chạy Ubuntu 22.04.02 LTS của chúng tôi. Chúng tôi đã sử dụng benchmark DLIO phiên bản 2.0 từ bản phát hành ngày 13 tháng 8 năm 2024. Cấu hình hệ thống của chúng tôi được phác thảo dưới đây:
- 2 x Intel Xeon Gold 6430 (32 lõi, 2,1GHz)
- 16 x 64GB DDR5-4400
- Ổ SSD Dell BOSS 480GB
- Cáp nối tiếp Gen5 JBOF
- Dapustor J5060 61,44TB
- Solidigm D5-P5336 61,44TB
Để đảm bảo việc benchmark của chúng tôi phản ánh các tình huống thực tế, chúng tôi đã dựa trên bài kiểm tra của mình vào kiến trúc mô hình LLAMA 3.1 405B. Chúng tôi đã triển khai tính năng tạo điểm kiểm tra bằng torch.save() để ghi lại các tham số mô hình, trạng thái bộ tối ưu hóa và trạng thái lớp. Thiết lập của chúng tôi mô phỏng một hệ thống 8 GPU, triển khai chiến lược song song hóa lai với xử lý song song hóa tensor 4 chiều và song song hóa đường ống 2 chiều được phân phối trên tám GPU. Cấu hình này dẫn đến kích thước điểm kiểm tra là 1.636GB, đại diện cho các yêu cầu đào tạo mô hình ngôn ngữ lớn hiện đại.
Nhìn chung, Dapustor J5060 thể hiện sự nhất quán vững chắc trong giai đoạn đầu của quá trình kiểm tra, với thời gian dao động quanh mức 575,66 giây cho 33 điểm kiểm tra đầu tiên. 5060J có thể duy trì hiệu suất cao hơn trước khi ổ đĩa được lấp đầy lần đầu tiên. Mặt khác, Solidigm P5336, mặc dù ban đầu chậm hơn J5060, đã thể hiện hiệu suất nhất quán khi quá trình kiểm tra tiếp tục.
Khi xem xét các giá trị trung bình tổng thể, Dapustor J5060 đạt thời gian 769,44 giây, trong khi Solidigm P5336 hoàn thành trong 640,17 giây. Điều này đặt Solidigm P5336 ở vị trí dẫn đầu về tốc độ lưu điểm kiểm tra.
Nhìn chung, Dapustor J5060 xử lý tốt các hoạt động ngắn hơn nhưng gặp khó khăn với các thao tác ghi liên tục sau 30 phút. Trong khi đó, Solidigm P5336 là ổ đĩa tốt hơn cho hiệu suất nhất quán trong các tác vụ kéo dài. Hiệu suất ghi yếu hơn này từ Dapustor J5060 thể hiện rõ khi tốc độ tạo điểm kiểm tra của nó suy giảm khi bài kiểm tra tiếp tục.
GPU Direct Storage
GPU Direct Storage là một công nghệ cho phép truyền dữ liệu trực tiếp giữa các thiết bị lưu trữ và GPU, bỏ qua CPU và bộ nhớ hệ thống. Trong quá trình truyền dữ liệu truyền thống, dữ liệu được đọc từ bộ nhớ lưu trữ vào bộ nhớ của CPU và sau đó được sao chép vào bộ nhớ của GPU. Quá trình này liên quan đến nhiều bản sao dữ liệu, dẫn đến độ trễ tăng và hiệu suất giảm. CPU hoạt động như một điểm nghẽn, vì nó cần xử lý truyền dữ liệu giữa bộ lưu trữ và GPU. GDS loại bỏ điểm nghẽn này bằng cách cho phép các thiết bị lưu trữ truyền dữ liệu trực tiếp đến và đi từ bộ nhớ của GPU.
Chúng tôi đã kiểm tra có hệ thống mọi sự kết hợp của các tham số sau đây trong cả khối lượng công việc đọc và ghi:
- Kích thước khối: 1M, 128K, 16K
- Độ sâu I/O: 128, 64, 32, 16, 8, 4, 1
Khi xem xét kết quả GDSIO của chúng tôi, chúng tôi kiểm tra hiệu suất đọc và ghi của Dapustor J5060 61,44TB và Solidigm P5336.
Hiệu suất đọc tuần tự GDSIO
Dapustor J5060 đạt thông lượng đọc đỉnh 4,2 GiB/s ở kích thước khối 1M với độ sâu I/O là 64 và 128. Ở kích thước khối nhỏ nhất (16K), hiệu suất dao động từ 0,1 GiB/s đến 0,8 GiB/s khi độ sâu I/O tăng lên. Điều này cho thấy sự ưu tiên rõ ràng đối với các kích thước khối lớn với độ sâu I/O cao để có thông lượng tối ưu. Hiệu suất đỉnh đạt được ở các kích thước khối lớn, cho thấy hiệu quả của ổ đĩa trong việc xử lý truyền dữ liệu hàng loạt.
So với, Solidigm P5336 đạt thông lượng tối đa tương tự là 4,3 GiB/s ở cùng kích thước khối (1M) nhưng đạt được hiệu suất đó sớm hơn ở độ sâu I/O là 32 và duy trì nó một cách nhất quán ở các độ sâu I/O cao hơn. Điều này cho thấy hiệu quả cao hơn một chút trong việc xử lý các kích thước khối lớn ở phạm vi độ sâu I/O rộng hơn cho Solidigm P5336.
Để có cái nhìn so sánh tốt hơn, chúng tôi có một biểu đồ chênh lệch so sánh cả hai ổ đĩa. Một khối màu xanh lá cây cho thấy lợi thế của ổ SSD Dapustor, trong khi một khối chuyển sang màu đỏ cho thấy điểm yếu. Ở đây, J5060 vượt trội hơn P5336 ở kích thước khối 128K ngoại trừ độ sâu I/O từ 4 đến 8. Tuy nhiên, lưu ý sự sụt giảm thông lượng ở độ sâu I/O cao hơn với kích thước khối 16K và 1M, cho thấy hiệu quả kém hơn trong các tình huống đó.
Trong so sánh độ trễ đọc tuần tự, Solidigm P5336 duy trì độ trễ thấp hơn một cách nhất quán so với Dapustor J5060 trên hầu hết các kích thước khối và độ sâu I/O. Ở kích thước khối 16K, khoảng cách trở nên rõ rệt hơn khi độ sâu hàng đợi tăng lên: J5060 đạt đỉnh ở mức 2.329 μs ở độ sâu 128, trong khi P5336 vẫn thấp hơn ở mức 1.365 μs. Ở 128K, Solidigm lại dẫn đầu trên hầu hết các độ sâu, ngoại trừ tải cao (4.080 μs trên J5060 so với 5539 μs trên P5336) ở độ sâu 128. Ở kích thước khối 1M, cả hai ổ đĩa đều gặp phải sự gia tăng độ trễ như mong đợi, nhưng P5336 được kiểm soát tốt hơn một chút, với 29.138 μs so với 29.512 μs ở độ sâu hàng đợi cao nhất.
Hiệu suất ghi tuần tự GDSIO
Dapustor J5060 cho thấy thông lượng ghi nhất quán từ 2,7 đến 2,8 GiB/s cho kích thước khối 128K và 1M trên tất cả các độ sâu I/O (ngoại trừ 128K, kích thước 1 IO, đạt 2,2 GiB/s. Đối với kích thước khối 16K, hiệu suất dao động từ 0,5 GiB/s đến 1,4 GiB/s, tùy thuộc vào độ sâu I/O, đạt đỉnh ở mức 1,4 GiB/s ở độ sâu I/O cao hơn.
So với, Solidigm P5336 hoạt động tốt hơn trong các kích thước khối 128K và 1M, đạt đỉnh ở mức 3,2 GiB/s. Đối với các kích thước khối nhỏ hơn (16K), Solidigm P5336 cũng cho thấy hiệu suất cao hơn, đạt đỉnh 1,4 GiB/s ở độ sâu I/O từ 16 đến 64. Điều này cho thấy Solidigm P5336 hiệu quả hơn một chút với các kích thước khối nhỏ hơn trong các hoạt động ghi.
Chuyển sang chế độ xem chênh lệch, chúng tôi thấy một khoảng cách lớn hơn mở ra giữa Dapustor J5060 và hiệu suất ghi của Solidigm P5336. So sánh thông lượng của chúng tôi cho thấy J5060 kém hơn P5336 ở hầu hết các lĩnh vực, đặc biệt là với các kích thước khối lớn (1M) trên tất cả các độ sâu I/O. Sự sụt giảm thông lượng đạt tới -0,5 GiB/s ở độ sâu 4 I/O. Mặc dù có những cải thiện về hiệu suất ở độ sâu I/O cao hơn với kích thước khối 128K, chúng không đủ đáng kể để bù đắp cho hiệu suất kém rộng hơn.
Khi so sánh độ trễ ghi tuần tự giữa Dapustor J5060 và Solidigm P5336, cả hai ổ đĩa đều thể hiện hành vi tương tự ở các kích thước khối nhỏ hơn như 16K, với Solidigm chiếm ưu thế nhỏ ở độ sâu I/O thấp hơn, trong khi Dapustor thu hẹp khoảng cách ở độ sâu cao hơn (64 và 128). Ở kích thước khối 128K, Solidigm lại dẫn đầu ở độ sâu hàng đợi nông, nhưng Dapustor liên tục mang lại độ trễ thấp hơn khi độ sâu I/O tăng lên, cho thấy khả năng mở rộng tốt hơn dưới tải. Tuy nhiên, với kích thước khối 1M, Solidigm duy trì lợi thế độ trễ rõ ràng trên tất cả các độ sâu I/O, cho thấy thời gian phản hồi nhanh hơn đáng kể dưới các khối lượng công việc ghi tuần tự nặng. Nhìn chung, Solidigm hoạt động nhất quán hơn, trong khi thế mạnh của Dapustor rõ ràng hơn ở các khối kích thước trung bình và hàng đợi sâu hơn.
Tóm tắt Khối lượng công việc FIO
Flexible I/O Tester (FIO) là một công cụ benchmark tiêu chuẩn ngành được sử dụng để đo lường hiệu suất của các thiết bị lưu trữ trong nhiều tình huống khối lượng công việc khác nhau. Được tin cậy vì tính linh hoạt và độ tin cậy, FIO mô phỏng các điều kiện thực tế, cung cấp thông tin chi tiết về khả năng và giới hạn hiệu suất của SSD. StorageReview tận dụng FIO để cung cấp các phân tích toàn diện, đo lường thông lượng, độ trễ và IOPS trên các mẫu khối lượng công việc, kích thước khối và độ sâu hàng đợi.
Các khối lượng công việc được áp dụng:
- Đọc và ghi tuần tự 128K
- Đọc và ghi ngẫu nhiên 64K
- Đọc và ghi ngẫu nhiên 16K
- Đọc và ghi ngẫu nhiên 4K
Các khối lượng công việc này đại diện cho một phổ rộng các trường hợp sử dụng doanh nghiệp, bao gồm truyền dữ liệu tuần tự lớn, I/O ngẫu nhiên chuyên sâu điển hình của cơ sở dữ liệu và truy cập ngẫu nhiên khối nhỏ thường thấy trong môi trường ảo hóa.
Phần hiệu suất này tóm tắt hiệu suất của Dapustor J5060 trên các khối lượng công việc tổng hợp chính, bao gồm các hoạt động đọc/ghi tuần tự và ngẫu nhiên ở các kích thước khối và độ sâu hàng đợi khác nhau. Các chỉ số được trích xuất trực tiếp từ đầu ra fio đã phân tích và bao gồm băng thông (MB/s), IOPS và các phân vị độ trễ lên tới 99,9999%, cung cấp thông tin chi tiết về cả thông lượng và hành vi đuôi dưới tải.
Hiệu suất đọc tuần tự 128K và ghi
| Ổ đĩa | Luồng/Độ sâu I/O | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Đọc | 1T/64Q | 7.482 | 57.081 | 1,66 ms | 2,02 ms | 2,83 ms |
| Solidigm P5336 Đọc | 1T/64Q | 7.479 | 57.057 | 1,51 ms | 1,66 ms | 1,81 ms |
| Dapustor J5060 Ghi | 1T/16Q | 3.023 | 23.063 | 0,69 ms | 0,69 ms | 0,70 ms |
| Solidigm P5336 Ghi | 1T/16Q | 3.364 | 25.669 | 2,67 ms | 3,48 ms | 4,42 ms |
Dapustor J5060 mang lại hiệu suất đọc tuần tự ấn tượng ở 128K, đạt 7,48GB/s với khả năng kiểm soát độ trễ chặt chẽ, ngay cả ở các phân vị cao hơn. So với Solidigm P5336, thông lượng của J5060 về cơ bản là như nhau (7,48GB/s so với 7,47GB/s). Tuy nhiên, Solidigm chiếm ưu thế hơn một chút về tính nhất quán của độ trễ, thể hiện độ trễ đuôi thấp hơn một chút.
Ở các thao tác ghi tuần tự 128K (QD16), J5060 đạt hiệu suất vững chắc 3.023MB/s với độ trễ rất thấp. Tuy nhiên, Solidigm P5336 vượt trội hơn một chút, đạt 3.364MB/s, mặc dù có độ trễ cao hơn đáng kể, đặc biệt là ở phân vị 99,99% (4,42ms so với 0,70ms cực kỳ thấp của Dapustor). Điều này cho thấy J5060 là một ứng cử viên mạnh mẽ hơn cho các tình huống ghi tuần tự nhạy cảm với độ trễ.
Hiệu suất đọc và ghi ngẫu nhiên 64K
| Ổ đĩa | Độ sâu I/O | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Đọc | 8T/32Q | 7.475 | 114.058 | 20,05 ms | 21,89 ms | 25,82 ms |
| Solidigm P5336 Đọc | 8T/32Q | 7.472 | 114.014 | 21,36 ms | 21,89 ms | 22,68 ms |
| Dapustor J5060 Ghi | 8T/32Q | 534 | 8.151 | 574,6 ms | 708,8 ms | 742,39 ms |
| Solidigm P5336 Ghi | 8T/32Q | 857 | 13.070 | 196,1 ms | 208,6 ms | 221,24 ms |
Trong các thao tác đọc ngẫu nhiên 64K (QD256), Dapustor J5060 vượt trội với thông lượng gần 7,4GB/s và độ trễ được kiểm soát tốt. Kết quả của Solidigm gần như tương đương (7,47GB/s), với độ trễ phân vị tối đa tốt hơn một chút. Cả hai ổ đĩa đều hoạt động xuất sắc ở đây, với sự khác biệt thực tế tối thiểu.
Hiệu suất ghi ở 64K ngẫu nhiên là nơi J5060 gặp khó khăn rõ rệt, với thông lượng giảm mạnh xuống còn 534MB/s và độ trễ tăng đáng kể (742,39ms ở 99,99%). So với, Solidigm P5336 vượt trội đáng kể so với J5060, cung cấp 857MB/s và độ trễ thấp hơn đáng kể (221,24ms ở cùng phân vị), làm cho nó phù hợp hơn nhiều cho các ứng dụng nhạy cảm với độ trễ và thông lượng ghi liên tục.
Hiệu suất đọc và ghi ngẫu nhiên 16K
| Ổ đĩa | Độ sâu I/O | BW (MB/s) | IOPS | 99,0% | 99,9% | 99,99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Đọc | 8T/32Q | 7.430 | 453.461 | 5,28 ms | 6,39 ms | 8,16 ms |
| Solidigm P5336 Đọc | 8T/32Q | 7.431 | 453.527 | 5,01 ms | 5,21 ms | 5,47 ms |
| Dapustor J5060 Ghi | 8T/32Q | 531 | 32.404 | 143,65 ms | 149,94 ms | 181,40 ms |
| Solidigm P5336 Ghi | 8T/32Q | 847 | 51.724 | 57,9 ms | 65,8 ms | 71,8 ms |
Ở khối lượng công việc đọc ngẫu nhiên 16K (QD256), Dapustor đạt kết quả xuất sắc với 453K IOPS và độ trễ được kiểm soát. Solidigm P5336 gần như tương đương với hiệu suất này, nhỉnh hơn một chút so với Dapustor về độ trễ (5,47ms so với 8,16ms ở 99,99%), cho thấy tính nhất quán về độ trễ tốt hơn một chút cho Solidigm trong các tình huống đọc ngẫu nhiên nặng.
Hiệu suất ghi ngẫu nhiên 16K của ổ SSD Dapustor giảm đáng kể xuống còn 32K IOPS và độ trễ tăng lên 181,4ms (99,99%). Ở đây một lần nữa, Solidigm vượt trội đáng kể so với Dapustor, cung cấp 51,7K IOPS và hồ sơ độ trễ được cải thiện đáng kể (71,8ms ở 99,99%), nhấn mạnh lợi thế của Solidigm đối với các khối lượng công việc ghi ngẫu nhiên nhạy cảm với độ trễ.
Công ty TNHH Công nghệ Bắc Kinh Qianxing Jietong
Sandy Yang/Giám đốc Chiến lược Toàn cầu
WhatsApp / WeChat: +86 13426366826
Email: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com
Trọng tâm Kinh doanh:
Phân phối Sản phẩm ICT/Tích hợp Hệ thống & Dịch vụ/Giải pháp Cơ sở hạ tầng
Với hơn 20 năm kinh nghiệm phân phối CNTT, chúng tôi hợp tác với các thương hiệu hàng đầu toàn cầu để cung cấp các sản phẩm đáng tin cậy và dịch vụ chuyên nghiệp.
“Sử dụng Công nghệ để Xây dựng Thế giới Thông minh”Nhà cung cấp Dịch vụ Sản phẩm ICT Đáng tin cậy của Bạn!



