Những điểm chính cần ghi nhớ
- RAID NVMe ưu tiên Flash: PERC13 H975i hoàn toàn chuyển đổi khỏi SAS/SATA, được xây dựng trên Broadcom SAS51xx cho kiến trúc gốc NVMe, sẵn sàng cho AI.
- Bước nhảy thế hệ lớn: PCIe Gen5 x16 với tối đa 16 ổ NVMe mỗi bộ điều khiển (32 với hai) mang lại 52,5 GB/s và 12,5 triệu IOPS mỗi bộ điều khiển trong thử nghiệm, với mức tăng so với PERC12 bao gồm băng thông đọc tăng +88%, băng thông ghi tăng +318%, IOPS đọc 4K tăng +31% và IOPS ghi 4K tăng +466%.
- Phù hợp với máy chủ AI: Thiết kế tích hợp phía trước giải phóng các khe cắm PCIe phía sau cho GPU, rút ngắn đường chạy MCIO và cho phép đường truyền lưu trữ chuyên dụng cho mỗi bộ tăng tốc để có thông lượng ổn định, xác định rõ hơn mà không tốn chi phí CPU.
- Khả năng phục hồi dưới áp lực: Bộ nhớ đệm được bảo vệ bằng siêu tụ điện và khả năng khôi phục nhanh hơn cắt giảm thời gian xuống còn 10 phút/TiB trong khi vẫn duy trì hiệu suất cao trong quá trình khôi phục (đọc lên tới 53,7 GB/s, ghi 68 GB/s, IOPS 4K 17,3 triệu/5,33 triệu).
- Bảo mật đầu cuối: Hardware Root of Trust, nhận dạng thiết bị SPDM và mã hóa toàn phổ bao gồm ổ đĩa, dữ liệu đang truyền và bộ nhớ đệm của bộ điều khiển.
Thông số kỹ thuật Dell PERC12 H965i và PERC13 H975i
| Tính năng | PERC12 H965i Mặt trước | PERC13 H975i Mặt trước |
|---|---|---|
| Mức RAID | 0, 1, 5, 6, 10, 50, 60 | 0, 1, 5, 6, 10, 50, 60 |
| Không RAID (JBOD) | Có | Có |
| Loại Bus Máy chủ | PCIe Gen4 x16 | PCIe Gen5 x16 |
| Quản lý Side-band | I2C, PCIe VDM | I2C, PCIe VDM |
| Vỏ mỗi cổng | Không áp dụng | Không áp dụng |
| Bộ xử lý / Chipset | Broadcom RAID-on-Chip, SAS4116W | Broadcom RAID-on-Chip, SAS5132W |
| Gói Năng lượng / Hỗ trợ Nguồn | Pin | Siêu tụ điện |
| Bảo mật Quản lý Khóa Cục bộ | Có | Có |
| Trình quản lý Khóa Doanh nghiệp An toàn | Có | Có |
| Độ sâu Hàng đợi Bộ điều khiển | 8.192 | 8.192 |
| Bộ nhớ đệm Không bay hơi | Có | Có |
| Bộ nhớ đệm | 8 GB DDR4 3200 MT/s | Bộ nhớ đệm RAID tích hợp |
| Chức năng Bộ nhớ đệm | Ghi-trước, đọc-trước, ghi-thông, luôn ghi-trước, không đọc-trước | Ghi-trước, ghi-thông, luôn ghi-trước, không đọc-trước |
| Đĩa ảo Phức tạp Tối đa | 64 | 16 |
| Đĩa ảo Đơn giản Tối đa | 240 | 64 |
| Nhóm Đĩa Tối đa | 64 | 32 |
| VD mỗi Nhóm Đĩa Tối đa | 16 | 8 |
| Thiết bị Dự phòng Nóng Tối đa | 64 | 8 |
| Thiết bị có thể thay nóng được Hỗ trợ | Có | Có |
| Tự động Cấu hình (Chính & Thực thi một lần) | Có | Có |
| Động cơ XOR Phần cứng | Có | Có |
| Mở rộng Dung lượng Trực tuyến | Có | Có |
| Dự phòng Nóng Chuyên dụng & Toàn cục | Có | Có |
| Loại Ổ đĩa Hỗ trợ | NVMe Gen3 và Gen4 | NVMe Gen3, Gen4 và Gen5 |
| Kích thước Phần tử Dải VD | 64KB | 64KB |
| Hỗ trợ NVMe PCIe | Gen4 | Gen5 |
| Số ổ NVMe Tối đa Cấu hình | 8 ổ mỗi bộ điều khiển | 16 ổ mỗi bộ điều khiển |
| Kích thước Sector Hỗ trợ | 512B, 512e, 4Kn | 512B, 512e, 4Kn |
| Hỗ trợ Khởi động Lưu trữ | Chỉ UEFI | Chỉ UEFI |
Bộ điều khiển PERC13 H975i Mặt trước trong máy chủ Dell PowerEdge được thiết kế để tích hợp liền mạch vào kiến trúc hệ thống. Không giống như các thẻ bổ trợ truyền thống chiếm các khe cắm PCIe phía sau, H975i kết nối trực tiếp với mặt lưng ổ đĩa phía trước và giao tiếp với các đầu nối MCIO phía trước trên bo mạch chủ thông qua các giao diện PCIe 5.0 chuyên dụng. Thiết kế tích hợp này bảo tồn các khe cắm PCIe phía sau cho GPU hiệu suất cao và mở rộng PCIe bổ sung, đồng thời giảm đáng kể chiều dài cáp. Điều này giúp duy trì tính toàn vẹn tín hiệu, làm cho hệ thống đáng tin cậy hơn và dễ bảo trì hơn. Kết quả là bố cục bên trong gọn gàng hơn và luồng không khí được cải thiện cho các triển khai mật độ cao, chuyên sâu về tính toán.
H975i triển khai một kiến trúc bảo mật toàn diện trải dài từ xác thực phần cứng cấp silicon thông qua mã hóa dữ liệu toàn phổ tại chỗ với các ổ đĩa SED. Nền tảng của nó, Hardware Root of Trust, thiết lập một chuỗi xác minh mật mã không thể thay đổi từ ROM Khởi động Nội bộ qua từng thành phần firmware, đảm bảo chỉ firmware được xác thực do Dell chứng nhận mới có thể thực thi trên bộ điều khiển. Bảo mật dựa trên phần cứng này mở rộng thông qua việc triển khai Security Protocol and Data Model (SPDM), nơi mỗi bộ điều khiển chứa chứng chỉ Nhận dạng Thiết bị duy nhất cho phép iDRAC thực hiện xác minh xác thực theo thời gian thực. Bộ điều khiển mở rộng bảo vệ mật mã vượt ra ngoài các kịch bản dữ liệu tại chỗ truyền thống để bao gồm bộ nhớ đệm. Nó duy trì các khóa mã hóa trong các vùng bộ nhớ an toàn không thể truy cập bởi firmware trái phép. Do đó, dữ liệu nhạy cảm vẫn được bảo vệ cho dù nó nằm trên ổ đĩa hay đang được xử lý tích cực trong bộ nhớ đệm.
Bảo vệ nguồn trong H975i là một bước tiến đáng kể khác so với các hệ thống truyền thống được hỗ trợ bằng pin thông qua việc tích hợp siêu tụ điện. Siêu tụ điện cung cấp nguồn điện tức thời trong các sự kiện mất điện đột ngột, đảm bảo bộ nhớ đệm được mã hóa và hoàn chỉnh được làm sạch vào bộ nhớ không bay hơi, nơi dữ liệu vẫn được bảo vệ vô thời hạn. Ngoài ra, không giống như các hệ thống dựa trên pin yêu cầu 4-8 giờ cho các chu kỳ học hỏi, siêu tụ điện của H975i hoàn thành Chu kỳ Học hỏi Minh bạch trong vòng 5-10 phút mà không bị suy giảm hiệu suất trong quá trình hiệu chuẩn. Thiết kế này loại bỏ chi phí bảo trì và các mối lo ngại về suy giảm vốn có trong các giải pháp pin, đồng thời cung cấp độ tin cậy vượt trội cho việc bảo vệ dữ liệu quan trọng.
Giám sát và Quản lý Tích hợp
Bộ điều khiển RAID PERC13 của Dell, giống như nhiều giải pháp RAID của Dell, có thể được quản lý và giám sát theo nhiều cách, bao gồm cả trong quá trình khởi động nền tảng thông qua System Setup trong BIOS, thông qua giao diện web iDRAC, tiện ích PERC12 và thậm chí cả Dell OpenManage UI và CLI.
Quản lý Bộ điều khiển iDRAC
Khi xem giao diện quản lý iDRAC, tab bộ điều khiển cung cấp tổng quan về phần cứng lưu trữ của máy chủ. Bên cạnh thẻ BOSS, bạn sẽ thấy các bộ điều khiển PERC H975i kép, cùng với thông tin về phiên bản firmware, bộ nhớ đệm và tình trạng pin. Bản tóm tắt này cho phép bạn nhanh chóng xác minh sự sẵn sàng và cấu hình của bộ điều khiển mà không cần truy cập BIOS hoặc sử dụng các công cụ CLI.
Tab Đĩa ảo trong iDRAC hiển thị các mảng lưu trữ đã được tạo, bao gồm mức RAID, kích thước và chính sách bộ nhớ đệm của chúng. Trong hệ thống này, hai nhóm RAID-10 được liệt kê, tất cả đều được xây dựng trên SSD. Từ chế độ xem này, quản trị viên có thể xác nhận các ổ đĩa đang trực tuyến, tạo đĩa ảo mới hoặc sử dụng menu Hành động để điều chỉnh hoặc xóa cấu hình hiện có.
Tiện ích Cấu hình Bộ điều khiển RAID
Hình ảnh trên cho thấy một ví dụ về việc truy cập Tiện ích Cấu hình Hệ thống PERC H975i Mặt trước trên nền tảng PowerEdge R7715. Từ giao diện này, bạn có thể quản lý tất cả các cài đặt bộ điều khiển RAID chính, bao gồm Quản lý Cấu hình, Quản lý Bộ điều khiển, Quản lý Thiết bị, v.v. Tiện ích này cung cấp một cách hợp lý để thiết lập đĩa ảo và giám sát các thành phần phần cứng trực tiếp trong quá trình khởi động nền tảng.
Sau khi chọn mức RAID, chúng ta chuyển sang chọn các ổ đĩa vật lý cho mảng. Trong ví dụ này, tất cả các SSD NVMe có sẵn đều được liệt kê và đánh dấu là có khả năng RAID. Chúng tôi chọn nhiều ổ đĩa Dell DC NVMe dung lượng 3,2 TiB từ nhóm dung lượng chưa được cấu hình. Các bộ lọc như loại phương tiện, giao diện và kích thước sector logic giúp thu hẹp lựa chọn. Sau khi chọn các ổ đĩa mong muốn, chúng ta có thể tiếp tục bằng cách nhấp vào “OK” để hoàn tất việc chọn ổ đĩa và tiếp tục tạo Đĩa ảo.
Trước khi hoàn tất việc tạo đĩa ảo, hệ thống hiển thị cảnh báo xác nhận rằng tất cả dữ liệu trên các ổ đĩa vật lý đã chọn sẽ bị xóa vĩnh viễn. Để tiếp tục, chúng ta chọn hộp “Xác nhận” và chọn “Có” để ủy quyền hoạt động. Biện pháp bảo vệ này giúp ngăn ngừa mất dữ liệu do vô tình trong quá trình tạo RAID.
Sau khi đĩa ảo được tạo, nó sẽ xuất hiện trong menu “Quản lý Đĩa ảo”. Trong ví dụ này, đĩa RAID 5 ảo mới của chúng tôi được liệt kê với dung lượng 43,656 TiB và trạng thái “Sẵn sàng.” Chỉ với vài bước đơn giản, bộ nhớ lưu trữ đã được cấu hình và sẵn sàng sử dụng.
Trong khi Tiện ích Cấu hình BIOS PERC và giao diện iDRAC cung cấp các tùy chọn trực quan để quản lý cục bộ và từ xa, Dell cũng cung cấp một công cụ dòng lệnh mạnh mẽ có tên là PERC CLI (perccli2). Tiện ích này hỗ trợ Windows, Linux và VMware, làm cho nó trở nên lý tưởng cho việc viết script, tự động hóa hoặc quản lý các bộ điều khiển PERC trong môi trường không có màn hình. Dell cũng cung cấp tài liệu chi tiết về cài đặt và cách sử dụng lệnh cho PERC CLI trên trang hỗ trợ của họ.
Kiểm tra Hiệu suất Dell PERC13
Trước khi đi sâu vào kiểm tra hiệu suất, chúng tôi đã chuẩn bị môi trường của mình bằng cách sử dụng nền tảng Dell PowerEdge R7715 được cấu hình với các bộ điều khiển phía trước PERC H975i kép. Chúng được kết hợp với ba mươi hai ổ NVMe Dell dung lượng 3,2 TB, mỗi ổ có tốc độ đọc tuần tự lên tới 12.000 MB/s và tốc độ ghi tuần tự 5.500 MB/s sử dụng kích thước khối 128 KiB. Nền tảng hiệu suất cao này cho phép chúng tôi đẩy giới hạn thông lượng của bộ điều khiển PERC13 và đánh giá hành vi RAID ở quy mô lớn.
- Nền tảng: Dell PowerEdge R7715
- CPU: AMD EPYC 9655P 96 lõi
- RAM: 768GB (12 x 64GB) DDR5-5200 ECC
- Bộ điều khiển RAID: 2 x PERC13 H975i
- Lưu trữ: 32 x 3,2TB Ổ đĩa NVMe Dell CD8P
- Bộ tăng tốc PCIe: 2 x NVIDIA H100 GPU
NVIDIA Magnum IO GPU Direct Storage: AI Gặp gỡ Lưu trữ
Các quy trình AI hiện đại thường bị giới hạn I/O, không phải tính toán. Các lô dữ liệu, embedding và điểm kiểm tra phải được truyền từ bộ nhớ lưu trữ đến bộ nhớ GPU đủ nhanh để giữ cho bộ tăng tốc hoạt động. Magnum IO GDS của NVIDIA (thông qua cuFile) bỏ qua đường dẫn truyền thống “SSD → CPU DRAM → GPU” và cho phép dữ liệu DMA trực tiếp từ NVMe đến bộ nhớ GPU. Điều này loại bỏ chi phí bộ đệm trung gian của CPU, giảm độ trễ và làm cho thông lượng có thể dự đoán được dưới tải, tất cả đều chuyển thành tỷ lệ sử dụng GPU cao hơn, thời gian epoch ngắn hơn và chu kỳ lưu/tải điểm kiểm tra nhanh hơn.
Thử nghiệm GDSIO của chúng tôi được thiết kế để đo lường đường dẫn dữ liệu từ bộ nhớ lưu trữ đến GPU, quét kích thước khối và số lượng luồng để hiển thị tốc độ mà bộ NVMe được hỗ trợ bởi PERC13 có thể truyền vào bộ nhớ H100. Với mỗi H975i trên liên kết PCIe 5.0 x16 (lý thuyết ~64 GB/s mỗi bộ điều khiển, một chiều), hai bộ điều khiển đặt trần tổng hợp gần ~112 GB/s; nơi các đường cong của chúng đạt đến điểm bão hòa cho biết bạn đang bị giới hạn liên kết hay phương tiện. Đối với các chuyên gia, hãy đọc biểu đồ làm đại diện cho các khối lượng công việc thực tế: đọc tuần tự lớn tương ứng với truyền dữ liệu và khôi phục điểm kiểm tra; ghi tuần tự lớn tương ứng với lưu điểm kiểm tra; truyền nhỏ hơn với đồng thời phản ánh xáo trộn bộ nạp dữ liệu và tải trước. Nói tóm lại, khả năng mở rộng GDSIO mạnh mẽ có nghĩa là ít bị gián đoạn GPU hơn và hiệu suất ổn định hơn trong cả quá trình đào tạo và suy luận thông lượng cao.
Thông lượng Đọc Tuần tự GDSIO
Bắt đầu với đọc tuần tự, thông lượng bắt đầu khiêm tốn ở kích thước khối và số lượng luồng thấp hơn, bắt đầu khoảng 0,3 GiB/s ở khối 8K với một luồng. Hiệu suất tăng mạnh giữa các khối 16K và 512K, đặc biệt khi tăng số lượng luồng từ 4 lên 16. Mức tăng đáng kể nhất xảy ra ở kích thước khối 1M, 5M và 10M, nơi thông lượng tăng đột biến, đạt đỉnh 103 GiB/s ở kích thước khối 10M với 256 luồng. Sự tiến triển này cho thấy mảng PERC13 có lợi từ kích thước khối lớn hơn và song song đa luồng, với độ bão hòa tối ưu khoảng 64-128 luồng, sau đó mức tăng sẽ đạt điểm bão hòa.
Chênh lệch Thông lượng Đọc Tuần tự GDSIO
Trong thử nghiệm đọc tuần tự trên các kích thước khối từ 8K đến 10M, PERC13 (H975i) luôn vượt trội hơn PERC12 (H965i), với mức tăng phần trăm tăng mạnh ở kích thước khối lớn hơn và số lượng luồng cao hơn.
Ở kích thước khối nhỏ hơn (8K-16K), mức cải thiện khiêm tốn (thường dao động từ 0-20%), và trong một số trường hợp riêng lẻ, H975i hơi kém hơn do sự biến đổi của thử nghiệm ở độ sâu hàng đợi thấp. Đến kích thước khối 32K-64K, lợi thế trở nên nhất quán hơn, với H975i mang lại thông lượng cao hơn 30-50% trên hầu hết các số lượng luồng.
Sự khác biệt đáng kể nhất được quan sát ở kích thước khối lớn hơn (từ 128K đến 10M), nơi bộ điều khiển PERC13 mở khóa toàn bộ tiềm năng đọc tuần tự của hệ thống. Tại đây, H975i cho thấy mức tăng 50-120% so với H965i. Ví dụ, ở kích thước khối 1M với 8-16 luồng, thông lượng cao hơn hơn 55 GiB/s, tương đương với mức tăng khoảng 90%. Ở kích thước khối 5M và 10M, mức cải thiện thường xuyên vượt quá 100%, với một số cấu hình cho thấy hiệu suất gần gấp đôi so với thế hệ trước.
Nhìn chung, PERC13 (H975i) đã thiết lập một vị trí dẫn đầu vượt trội trong các khối lượng công việc đọc tuần tự, đặc biệt là khi kích thước khối và số lượng luồng tăng lên. Mặc dù kích thước khối nhỏ hơn cho thấy sự cải thiện gia tăng, nhưng ở mức 256K trở lên, bộ điều khiển mới hơn liên tục mang lại hiệu suất cao hơn 50-100%+, làm nổi bật rõ ràng những tiến bộ kiến trúc trong nền tảng RAID mới nhất của Dell.
Độ trễ Đọc Tuần tự GDSIO
Khi thông lượng đọc tuần tự tăng lên, độ trễ vẫn có thể quản lý được ở kích thước khối nhỏ hơn và số lượng luồng thấp hơn. Ví dụ, độ trễ dưới 100 µs ở khối 64K và 16 luồng, cho thấy khả năng xử lý đọc hiệu quả trong phạm vi đó. Khi kích thước khối và số lượng luồng tăng lên, đặc biệt là ở 5M và 10M với 64 luồng trở lên, độ trễ tăng nhanh, đạt đỉnh 211,8 ms ở kích thước khối 10M với 256 luồng. Điều này cho thấy các điểm nghẽn bộ điều khiển hoặc hàng đợi xuất hiện dưới các khối lượng công việc cực đoan, ngay cả khi thông lượng vẫn cao.
Sự cân bằng tốt nhất giữa hiệu suất và hiệu quả được quan sát ở kích thước khối 1M với 8-16 luồng, nơi mảng duy trì thông lượng 87,5-93,7 GiB/s trong khi giữ độ trễ trong khoảng 179-334 µs. Vùng này đại diện cho điểm ngọt để tối đa hóa băng thông trong khi giữ độ trễ dưới một mili giây.
Thông lượng Ghi Tuần tự GDSIO
Hiệu suất ghi cho thấy khả năng mở rộng sớm mạnh mẽ khi kích thước khối tăng lên, với thông lượng tăng từ 1,2 GiB/s ở 8K và 1 luồng lên 13,9 GiB/s ở 256K. Mức tăng trưởng đáng kể nhất xuất hiện giữa các kích thước khối 128K và 1M, nơi thông lượng đạt hơn 80 GiB/s ở 8 đến 16 luồng. Hiệu suất đỉnh cao đạt được ở kích thước khối 5M và 10M, duy trì 100 đến 101 GiB/s từ 8 luồng trở đi.
Hiệu suất ổn định trên 8 đến 64 luồng cho các khối lớn hơn này, cho thấy các bộ điều khiển đã đạt đến điểm bão hòa sớm trong đường cong mở rộng. Ở số lượng luồng cao hơn, đặc biệt là 128 và 256 luồng, độ ổn định thông lượng thay đổi, duy trì ổn định ở các khối lớn 5M và 10M ở mức 101 GiB/s nhưng giảm đối với các kích thước khối tầm trung, chẳng hạn như 256K, giảm từ 61,2 GiB/s ở 32 luồng xuống 45,3 GiB/s ở 256 luồng.
Chênh lệch Thông lượng Ghi Tuần tự GDSIO
Trong thử nghiệm ghi tuần tự, PERC13 (H975i) mang lại những cải thiện đáng kể so với PERC12 (H965i), đặc biệt là khi kích thước khối và số lượng luồng tăng lên. Ở kích thước khối nhỏ (8K-32K), mức cải thiện khiêm tốn, thường trong khoảng 0-10%, với nhiễu thử nghiệm không thường xuyên cho thấy sự khác biệt không đáng kể.
Từ 64K trở đi, lợi thế của H975i trở nên rõ rệt hơn. Ở kích thước khối 64K, mức cải thiện đạt 40-70%, với thông lượng tăng hơn 12-17 GiB/s so với H965i. Ở 128K-256K, mức tăng trưởng mạnh mẽ hơn, nơi H975i liên tục mang lại thông lượng cao hơn 50-70% ở số lượng luồng từ trung bình đến cao.
Khoảng cách hiệu suất ấn tượng nhất xuất hiện ở kích thước khối lớn hơn (từ 512K đến 10M). Ở 512K, H975i đạt mức tăng +31 đến +56 GiB/s, tương đương với cải thiện 60-80% so với H965i. Ở kích thước khối 1M, lợi thế còn mở rộng hơn nữa, với mức tăng thông lượng +40 đến +68 GiB/s, tương đương với mức tăng 70-90%. Cuối cùng, ở kích thước khối 5M và 10M, PERC 13 gần như tăng gấp đôi thông lượng so với PERC 12, với chênh lệch +75 đến +79 GiB/s, tương đương với cải thiện 100% trong một số trường hợp có nhiều luồng.
Nhìn chung, bộ điều khiển PERC 13 cho thấy một bước nhảy thế hệ rõ ràng về hiệu suất ghi tuần tự. Mặc dù sự khác biệt nhỏ ở kích thước khối nhỏ nhất, nhưng khi khối lượng công việc vượt quá 64K, H975i liên tục mang lại thông lượng cao hơn 50-100%, khẳng định rõ ràng sự vượt trội của nó so với H965i trong các khối lượng công việc tuần tự chuyên ghi.
Độ trễ Ghi Tuần tự GDSIO
Độ trễ trong quá trình ghi tuần tự vẫn thấp một cách ấn tượng ở kích thước khối nhỏ hơn và số lượng luồng thấp hơn, thường dưới 50 µs ở khối 128K với tối đa 8 luồng. Khi số lượng luồng tăng lên, độ trễ tăng đáng kể hơn. Ví dụ, độ trễ đạt 392 µs ở 512K với 32 luồng và vượt quá 1 ms ở kích thước khối 1M với 64 luồng.
Các hiệu ứng bão hòa trở nên rõ ràng hơn ở kích thước khối lớn nhất và mức độ đồng thời cao nhất. Độ trễ tăng lên 12,4 ms ở 5M với 128 luồng và đạt đỉnh 50,3 ms ở 10M với 256 luồng.
Điểm hoạt động hiệu quả nhất cho các khối lượng công việc ghi tuần tự xảy ra ở kích thước khối 1M hoặc 5M với 8 đến 16 luồng, nơi thông lượng đạt 87,9 đến 101,2 GiB/s trong khi độ trễ vẫn trong khoảng 178 µs – 1,7 ms, cung cấp hiệu suất ổn định mạnh mẽ mà không gây ra độ trễ hàng đợi ghi quá mức.
Hiệu suất MLPerf Storage 2.0
Để đánh giá hiệu suất trong thế giới thực trong môi trường đào tạo AI, chúng tôi đã sử dụng bộ kiểm tra MLPerf Storage 2.0. MLPerf Storage được thiết kế đặc biệt để kiểm tra các mẫu I/O trong các khối lượng công việc học sâu thực tế, mô phỏng. Nó cung cấp thông tin chi tiết về cách các hệ thống lưu trữ xử lý các thách thức như lưu điểm kiểm tra và đào tạo mô hình.
Benchmark Lưu điểm kiểm tra
Khi đào tạo các mô hình học máy, điểm kiểm tra là cần thiết để lưu trạng thái của mô hình một cách định kỳ. Điều này giúp ngăn ngừa mất tiến độ do gián đoạn, chẳng hạn như lỗi phần cứng, cho phép dừng sớm trong quá trình đào tạo và cho phép các nhà nghiên cứu phân nhánh từ các điểm kiểm tra khác nhau cho các thử nghiệm và phân tích.
So sánh thời gian lưu điểm kiểm tra cho thấy Dell PERC13 luôn vượt trội hơn PERC12 trên tất cả các cấu hình mô hình. PERC 13 đạt thời gian lưu từ 7,61 đến 10,17 giây, trong khi PERC12 yêu cầu 10,41 đến 20,67 giây cho các thao tác tương tự. Khoảng cách hiệu suất rõ rệt nhất với mô hình tham số 1T, nơi PERC13 hoàn thành việc lưu chỉ trong hơn 10 giây so với hơn 20 giây của PERC12. Điều này tương đương với việc giảm khoảng 50% thời gian lưu cho các mô hình lớn nhất.
Người liên hệ: Ms. Sandy Yang
Tel: 13426366826



