StorageReview đã giành lại vương miện tính toán danh giá bằng cách tính toán π đến 314 nghìn tỷ chữ số đáng kinh ngạc, phá vỡ kỷ lục thế giới trước đó. Cuộc đua hiện đại về độ chính xác của π đã phát triển từ các thử nghiệm đám mây ban đầu thành một màn trình diễn toàn diện về sức mạnh cơ sở hạ tầng và sự khéo léo trong kỹ thuật.
Trở lại năm 2022, Google Cloud đã gây chú ý khi tính toán π đến 100 nghìn tỷ chữ số. Tận dụng một đội ngũ lớn các phiên bản đám mây để chạy chương trình y-cruncher, dự án đã tiêu thụ hàng chục petabyte dữ liệu I/O. Tại thời điểm đó, cột mốc này là thước đo cuối cùng cho giới hạn trên của những gì cơ sở hạ tầng truyền thống có thể đạt được.
Sau đó, trọng tâm chuyển sang môi trường phòng thí nghiệm tại chỗ. Vào đầu năm 2024, chúng tôi đã nâng cấp hệ thống của mình để thiết lập kỷ lục mới 105 nghìn tỷ chữ số, được hỗ trợ bởi gần 1 petabyte ổ SSD QLC Solidigm. Thành tựu này đã thiết lập một thước đo quy mô mới, chứng minh rằng một máy tại chỗ duy nhất có thể mang lại hiệu quả đặc biệt. Chỉ vài tháng sau, chúng tôi đã đẩy giới hạn xa hơn lên 202 nghìn tỷ chữ số. Bước đột phá này đã xác nhận rằng bộ nhớ flash mật độ cao, kết hợp với việc tinh chỉnh hệ thống tỉ mỉ, có thể vượt trội hơn cơ sở hạ tầng đám mây quy mô lớn cho khối lượng công việc cụ thể đòi hỏi khắt khe này.
Tất nhiên, mỗi kỷ lục đều mời gọi một thử thách. Linus Media Group và KIOXIA sau đó đã giành được danh hiệu bằng cách tính toán π đến 300 nghìn tỷ chữ số. Thiết lập của họ dựa vào một cụm lưu trữ chia sẻ Weka lớn được trang bị 2PB bộ nhớ flash. Mặc dù điều này chứng tỏ tiềm năng của cơ sở hạ tầng truyền thống nặng về lưu trữ, nhưng nó đi kèm với những đánh đổi đáng kể: một giá đỡ phần cứng đầy đủ, mức tiêu thụ điện năng đáng kể và các yêu cầu làm mát phức tạp. Chúng tôi quyết tâm không để kỷ lục này đứng vững mà không bị thách thức.
Hôm nay, StorageReview tự hào công bố chiến thắng mới của chúng tôi: π được tính toán đến 314 nghìn tỷ chữ số. Thành tích này đạt được bằng cách sử dụng một máy chủ Dell PowerEdge R7725 2U duy nhất, được trang bị CPU AMD EPYC 192 lõi kép và bốn mươi ổ SSD Micron 6550 Ion 61,44TB. Chúng tôi đã hoàn thành việc xây dựng và tinh chỉnh hệ thống vào tháng 7, bắt đầu quá trình tính toán vào ngày 31 tháng 7 năm 2025. Tình cờ, quá trình này kết thúc vào ngày thứ hai của SC25, làm cho kỷ lục điện toán hiệu năng cao (HPC) mới này càng kịp thời hơn.
Mở rộng y-cruncher lên 314 nghìn tỷ chữ số
Khi quy mô tính toán vượt quá hàng trăm nghìn tỷ chữ số, y-cruncher biến đổi từ một phép đo điểm chuẩn truyền thống thành một bài kiểm tra căng thẳng cơ sở hạ tầng đường dài khắc nghiệt. Logic cốt lõi của chương trình vẫn đơn giản, nhưng sự tương tác của nó với phần cứng ở quy mô này trở thành yếu tố quyết định. Toàn bộ hoạt động phụ thuộc vào khả năng của hệ thống để giữ cho hàng nghìn phép toán đa độ chính xác chạy trơn tru mà không làm chậm CPU hoặc làm quá tải lớp lưu trữ. Trên thực tế, kỷ lục mới này thực sự đã giành được ở lớp lưu trữ.
Chúng tôi đã triển khai 40 ổ SSD NVMe Micron 6550 Ion Gen5, với 34 ổ được phân bổ riêng để chạy y-cruncher. Nhóm SSD này cung cấp khoảng 2,1 petabyte dung lượng khả dụng, cung cấp cho y-cruncher dung lượng lưu trữ dồi dào cần thiết để tính toán và xử lý 314 nghìn tỷ chữ số của π. 6 ổ SSD còn lại được cấu hình thành một ổ đĩa phần mềm RAID10, được sử dụng đặc biệt để lưu trữ kết quả 314 nghìn tỷ chữ số cuối cùng.
Các cải tiến thiết kế giữa thế hệ thứ 16 và 17 của máy chủ Dell PowerEdge cũng đóng vai trò quan trọng trong việc tăng hiệu suất cho lần chạy kỷ lục 314 nghìn tỷ chữ số này. Nỗ lực 202 nghìn tỷ chữ số trước đây của chúng tôi đã sử dụng Dell PowerEdge R760 24 khay, có bộ chuyển mạch PCIe trên bảng nối ổ đĩa - đánh đổi mật độ ổ đĩa để lấy hiệu suất nâng cao. Ngược lại, máy chủ PowerEdge thế hệ thứ 17, như R770 dựa trên Intel và R7725 dựa trên AMD, có bảng nối ổ đĩa với thiết kế chỉ kết nối trực tiếp, cung cấp 2 hoặc 4 làn PCIe cho mỗi khay.
PowerEdge R7725, được trang bị bảng nối ổ đĩa Gen5 E3.S 40 khay, cung cấp 2 làn PCIe cho mỗi khe cắm SSD. Mặc dù điều này có vẻ là một sự đánh đổi hiệu suất tiềm năng trên lý thuyết, nền tảng này vẫn có thể mang lại tốc độ ấn tượng: lên đến 280GB/s hiệu suất đọc và ghi đồng thời khi cả 40 khay được sử dụng hết.
Sử dụng điểm chuẩn lưu trữ y-cruncher nội bộ, chúng tôi đã đo lường hiệu suất lưu trữ của mỗi nền tảng trên cấu hình tương ứng của nó. Trên tất cả các khối lượng công việc, chúng tôi đã quan sát thấy hiệu suất lưu trữ cải thiện từ 72% đến 383%, với các chỉ số đọc và ghi được cân bằng tốt - củng cố sự vượt trội của máy chủ PowerEdge thế hệ thứ 17 cho tính toán chuyên sâu về lưu trữ quy mô lớn.
| Chỉ số | Hệ thống 202T (kỷ lục cũ) | Hệ thống 314T (kỷ lục mới) | Phần trăm chênh lệch (314T so với 202T) |
|---|---|---|---|
| Ghi tuần tự | 47,0 GiB/s | 107 GiB/s | +127,7% |
| Đọc tuần tự | 56,7 GiB/s | 127 GiB/s | +124,0% |
| Ghi theo ngưỡng | 62,2 GiB/s | 107 GiB/s | +72,0% |
| Đọc theo ngưỡng | 20,9 GiB/s | 101 GiB/s | +383,3% |
Dell PowerEdge R7725 không chỉ là một cỗ máy lưu trữ mạnh mẽ; nó tỏa sáng rực rỡ như một nền tảng AMD Turin hai ổ cắm với tiềm năng tính toán đặc biệt. Chúng tôi đã trang bị cho hệ thống của mình bộ xử lý AMD EPYC 9965 192 lõi, cung cấp tổng cộng 384 lõi. Để mở khóa hiệu suất này, chúng tôi đã nâng cấp giải pháp làm mát bằng không khí tiêu chuẩn lên các tấm làm mát bằng chất lỏng CoolIT SP5, được làm mát bởi CoolIT AHx10 Liquid-to-Air CDU (Bộ phân phối chất làm mát).
Nâng cấp làm mát chiến lược này mang lại ba lợi thế chính: nó cho phép CPU duy trì tốc độ xung nhịp cao bền vững, giữ cho quạt khung máy chủ chạy ở mức 30% PWM(Điều chế độ rộng xung) đáng kể thấp và đảm bảo mức tiêu thụ điện năng trung bình của hệ thống duy trì ổn định ở khoảng 1.600W.
Tối ưu hóa phần mềm & hệ thống
Đối với lớp phần mềm, chúng tôi đã đi chệch khỏi các phương pháp trước đây bằng cách chọn Ubuntu 24.04.2 LTS Server thay vì Windows Server. Quyết định này đã đóng vai trò quan trọng trong việc tối đa hóa sự ổn định của hệ thống và mở khóa những cải thiện đáng kể về hiệu suất khối lượng công việc.
Trước khi bắt đầu chạy kỷ lục, chúng tôi đã tiến hành các lần lặp thử nghiệm nghiêm ngặt và tinh chỉnh cấu hình. Một bước quan trọng là dành 4 trong số 384 lõi có sẵn cho các hoạt động hệ thống nền quan trọng, đảm bảo các luồng tính toán chính không bị cản trở. Kết quả? Chúng tôi không chỉ đánh bại kỷ lục pi trước đó - chúng tôi đã phá vỡ nó trên mọi chỉ số có thể đo lường. Quá trình chạy của chúng tôi không có đối thủ về hiệu suất, hiệu quả năng lượng và quan trọng nhất là độ tin cậy hoàn hảo. Chúng tôi đặc biệt tự hào khi giữ danh hiệu là nỗ lực lập kỷ lục thế giới về pi quy mô lớn duy nhất được hoàn thành với không có thời gian chết; quá trình tính toán chạy liền mạch từ đầu đến cuối mà không cần phải tiếp tục.
Hiệu quả năng lượng phá kỷ lục
Một nguyên tắc cốt lõi đằng sau mỗi nỗ lực lập kỷ lục pi của StorageReview là giảm thiểu sự phức tạp của hệ thống và tối ưu hóa hiệu quả năng lượng. Kỷ lục 300T trước đó dựa vào một cụm lưu trữ phân tán với mạng tốc độ cao, vốn đòi hỏi ngân sách năng lượng và làm mát lớn hơn.
Chúng tôi đã thực hiện một cách tiếp cận hoàn toàn khác. Bằng cách tập trung vào mật độ lưu trữ cực cao, chúng tôi đã hợp nhất cả không gian hoán đổi và lưu trữ đầu ra bền vững trên một máy chủ 2U duy nhất. Lựa chọn kiến trúc này là yếu tố then chốt trong việc giảm đáng kể dấu chân năng lượng và làm mát tổng thể của chúng tôi.
Trong suốt quá trình tính toán 314 nghìn tỷ chữ số đầy đủ, Dell PowerEdge R7725 của chúng tôi đã tiêu thụ tổng cộng 4.304,662 kWh. Điều này tương đương với 13,70 kWh mỗi nghìn tỷ chữ số đáng kinh ngạc - đặt giải pháp của chúng tôi vào nhóm các phép tính pi quy mô lớn hiệu quả năng lượng nhất từng được thực hiện. Sự tương phản rõ rệt giữa cách tiếp cận máy chủ đơn lẻ hiệu quả của chúng tôi và phương pháp cụm tiêu tốn năng lượng là rõ ràng ngay lập tức, như được nêu bật trong bảng so sánh dưới đây.
| Chạy | Tổng kWh | Chi phí @ $0,12/kWh | Chi phí @ $0,20/kWh |
|---|---|---|---|
| Chạy cụm Weka 300T | 33.600 kWh (ước tính) | 4.032 đô la | 6.720 đô la |
| Chạy máy chủ đơn 314T | 4.304,662 kWh | 517 đô la | 861 đô la |
Điều quan trọng cần nhấn mạnh là trong quá trình tính toán 314 nghìn tỷ chữ số của chúng tôi, chúng tôi đã sử dụng ổ SSD ở cấu hình JBOD (Just a Bunch of Disks), không bao gồm khả năng phục hồi dữ liệu tích hợp. Quyết định này được thúc đẩy bởi hai ưu tiên cốt lõi: tối ưu hóa mức tiêu thụ điện năng và tối đa hóa hiệu suất hệ thống tổng thể. Tuy nhiên, nó cũng khơi dậy một cuộc thảo luận quan trọng về việc điều chỉnh các giải pháp lưu trữ cho phù hợp với các yêu cầu cụ thể của khối lượng công việc hiện tại. Mỗi khối lượng công việc là duy nhất - một số có thể được khởi động lại với tác động tối thiểu đến hoạt động và do đó không yêu cầu mức độ chịu lỗi cao như các tác vụ quan trọng. Trong trường hợp của chúng tôi, chúng tôi tập trung vào việc bảo vệ đầu ra dữ liệu cuối cùng thông qua thiết lập RAID phần mềm truyền thống, đảm bảo tính toàn vẹn của các chữ số π phá kỷ lục mà không làm ảnh hưởng đến hiệu quả của hệ thống.
110 ngày hoạt động liên tục
Mặc dù tính toán nhiều chữ số hơn bất kỳ nỗ lực kỷ lục π trước đó nào, thời gian chạy đồng hồ tường của chúng tôi ngắn hơn đáng kể so với điểm chuẩn trước đó. Kỷ lục 300 nghìn tỷ chữ số trước đó cần khoảng 225 ngày để hoàn thành - tương đương với 175 ngày tính toán thực tế khi loại trừ thời gian ngừng hoạt động. Ngược lại, lần chạy 314 nghìn tỷ chữ số của chúng tôi đã đạt được 110 ngày hoạt động liên tục. Sự ổn định đặc biệt này có thể được quy cho bốn yếu tố chính: một hệ điều hành mạnh mẽ và ổn định, khối lượng công việc nền được giảm thiểu để tránh tranh chấp tài nguyên, cấu trúc liên kết NUMA (Truy cập bộ nhớ không đồng nhất) cân bằng để giao tiếp CPU-bộ nhớ tối ưu và một mảng tạm thời được thiết kế đặc biệt để xử lý các mẫu truy cập dữ liệu độc đáo do y-cruncher tạo ra ở quy mô chưa từng có này.
Điểm nổi bật về kỹ thuật
- Tổng số chữ số được tính toán: 314.000.000.000.000
- Phần cứng đã sử dụng: Dell PowerEdge R7725 với 2x CPU AMD EPYC 9965, 1,5TB DRAM DDR5, 40x Micron 61,44TB 6550 Ion
- Phần mềm và thuật toán: y-cruncher v0.8.6.9545, Chudnovsky
- Mòn SSD theo SMART: 7,3PB được ghi trên mỗi ổ đĩa hoặc 249,11PB trên 34 ổ SSD được sử dụng cho hoán đổi
- Điểm kiểm tra lớn nhất logic: 850.538.385.064.992 (774 TiB)
- Sử dụng đĩa đỉnh logic: 1.605.960.520.636.440 (1,43 PiB)
- Byte đĩa logic đã đọc: 148.356.635.606.263.504 (132 PiB)
- Byte đĩa logic đã ghi: 126.658.805.195.776.600 (112 PiB)
- Ngày bắt đầu: Thứ Năm ngày 31 tháng 7 lúc 17:16:41 2025
- Ngày kết thúc: Thứ Ba ngày 18 tháng 11 lúc 05:57:08 2025
- pi: 8793223,144 giây, 101,773 Ngày
- Tổng thời gian tính toán: 9274878,580 giây
- Thời gian tường từ đầu đến cuối: 9463226,454 giây
Suy nghĩ cuối cùng
Trong nhiều thập kỷ, các phép tính π cực đoan đã đóng vai trò là một màn trình diễn sức mạnh tính toán, với "máy tính lớn" của mỗi thời đại chiếm vị trí trung tâm. Các kỷ lục ban đầu dựa vào máy tính để bàn hiệu năng cao và mảng lưu trữ bên ngoài; sau đó trọng tâm chuyển sang thiết bị doanh nghiệp tại chỗ. Gần đây hơn, cuộc đua đã di chuyển lên đám mây, nơi các sáng kiến như chạy 100 nghìn tỷ chữ số của Google đã chứng minh rằng sức mạnh thô - được trang bị hàng nghìn phiên bản và thông lượng I/O khổng lồ - có thể đảm bảo một kỷ lục. Sau đó, chúng tôi đã chứng kiến sự xuất hiện của các cụm lưu trữ chia sẻ lớn, ưu tiên song song hóa thô hơn là sự đơn giản, nhưng phải trả giá bằng mức tiêu thụ điện năng đáng kể và nhu cầu làm mát phức tạp.
Hành trình của chúng tôi đã đi theo con đường ngược lại. Qua các lần chạy thiết lập kỷ lục liên tiếp, chúng tôi đã coi khối lượng công việc y-cruncher là một tác vụ HPC dài hạn, quan trọng - không phải là một trò diễn một lần. Các chiến dịch 105T và 202T đã đóng vai trò quan trọng trong việc xác định các nút thắt cổ chai cốt lõi: tối ưu hóa dung lượng lưu trữ tạm thời, đảm bảo khối lượng công việc CPU ổn định mà không làm quá tải lớp I/O và củng cố hệ thống để mang lại hiệu suất đáng tin cậy trong nhiều tháng. Lần chạy 314T là đỉnh cao của chuyên môn khó khăn đó. Đây không chỉ đơn thuần là một con số lớn hơn; nó đại diện cho một thiết kế trưởng thành hơn, cấp độ sản xuất.
Dữ liệu tự nói lên điều đó. Chúng tôi đã phá vỡ rào cản 300 nghìn tỷ chữ số trên một máy chủ Dell PowerEdge R7725 2U duy nhất, được trang bị 40 ổ SSD Micron 6550 Ion và CPU AMD EPYC 192 lõi kép. Hệ thống chạy hoàn hảo trong 110 ngày liên tục, hoàn thành phép tính mà không bị gián đoạn hoặc khởi động lại. Thông lượng lưu trữ tăng gấp đôi so với nền tảng 202T của chúng tôi, nhưng máy chủ vẫn duy trì mức tiêu thụ điện năng trung bình khiêm tốn là 1.600W, với tổng mức tiêu thụ năng lượng chỉ 4.305 kWh. Điều này tương đương với 13,70 kWh mỗi nghìn tỷ chữ số hiệu quả đáng kinh ngạc - chỉ bằng một phần nhỏ so với ước tính năng lượng được sử dụng bởi cụm 300T trước đó. Nói tóm lại, chúng tôi đã đạt được nhiều công việc hơn với ít nút hơn, ít phức tạp hơn và chi phí năng lượng thấp hơn.
Ý nghĩa của kỷ lục này vượt xa quyền khoe khoang. Nếu một máy chủ 2U thương mại duy nhất có thể duy trì khối lượng công việc có quy mô này với độ tin cậy và hiệu quả như vậy, thì các nguyên tắc kiến trúc tương tự sẽ được áp dụng trực tiếp cho điện toán khoa học trong thế giới thực. Các mô hình khí hậu chạy dài, mô phỏng vật lý có độ chính xác cao, các đường ống gen, và các công việc đào tạo AI quy mô lớn đều phụ thuộc vào các yếu tố nền tảng giống nhau: hiệu suất I/O cân bằng, quản lý nhiệt dự đoán được, firmware ổn định và kiến trúc được xây dựng để hoạt động liên tục trong nhiều tháng. Nền tảng của chúng tôi hiện đã chứng minh rằng nó có thể đáp ứng các yếu tố cơ bản này trong các điều kiện đòi hỏi khắt khe nhất.
Chi tiết liên lạc
Beijing Qianxing Jietong Technology Co., Ltd.
Người liên hệ: Ms. Sandy Yang
Tel: 13426366826



