東京工業大学、理化学研究所、株式会社フィックスターズ、日本電信電話株式会社、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[用語1]を用いた測定結果を大幅に向上させ、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において世界第1位を獲得しました。「富岳」としては9期連続で世界第1位となります。
このランキングは、現在ドイツ ハンブルクのコングレス・センター・ハンブルクおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「ISC High Performance 2024」に合わせて、Graph500 Committeeからウェブサイトにて発表されました。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標です。共同研究グループは、「富岳」を用いた大規模グラフ処理技術の開発を引き続き進めていきます。
※ 共同研究グループ
理化学研究所 計算科学研究センター
- 佐藤三久 量子HPC連携プラットフォーム部門 部門長
- 山本啓二 運用技術部門 ユニットリーダー
- 児玉祐悦 運用技術部門 上級技師
- 中尾昌広 運用技術部門 技師
東京工業大学 科学技術創成研究院 デジタルツイン研究ユニット
藤澤克樹 教授
株式会社フィックスターズ
- 上野晃司 エグゼクティブエンジニア
- 高木瞭 ディレクター
- 井上雄登 シニアエンジニア
- 柴田敦也 シニアエンジニア
- 大野真暉 シニアエンジニア
- 寺西寛人 シニアエンジニア
- 鈴木浩介 シニアエンジニア
- 阪本哲郎 エンジニア
- 南規楽 エンジニア
日本電信電話株式会社 コンピュータ&データサイエンス研究所
- 高橋寛幸 主幹研究員
- 及川一樹 主任研究員
- 新井淳也 主任研究員
- 尾形嵐士 研究員
- 今西遼人 社員
「富岳」測定結果
共同研究グループは、「富岳」の152,064ノード[用語2](全体の約95.7%)を用いて、約4.4兆個の頂点と70.4兆個の枝から構成される超大規模グラフに対する幅優先探索問題を平均0.42秒で解きました。「Graph500」のスコアは166,029 GTEPS(ギガテップス)[用語3]で、前回(2023年11月)の性能から27,162 GTEPS(約20%)向上しました。この性能向上は、BFSの結果に影響を与えずに不要な頂点を削除する前処理を新規に導入したことで得られました。また、グラフデータの新しい圧縮技術を開発したことで、利用メモリ量を大幅に削減することができました。
Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービス(SNS)などでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[用語4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[用語5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」です。
「Graph500」は2010年に始まり、BFS(Breadth-First Search:幅優先探索)、SSSP(Single-Source Shortest Path:単一始点最短路)、Green(BFSの電力効率)の3部門それぞれのランキングが年に2回更新されます。BFSおよびGreen部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱い、単位時間(1秒)当たりの処理数でランキングします。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)~(5)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています[注釈]。
- 1.
- 複数のノード間におけるグラフデータの効率的な分割および圧縮
- 2.
- 冗長なグラフ探索を削減するアルゴリズム
- 3.
- BFSの結果に影響を与えずに不要な頂点を削除する前処理
- 4.
- スーパーコンピュータの大規模ネットワークにおける通信性能の最適化
- 5.
- 探索アルゴリズムの動作を制御するパラメータの自動チューニング
「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。現在、共同研究グループでは「富岳」で処理可能なグラフデータの規模を倍増させるための改良を進めており、今回の測定で得たデータを基に性能改善を加速させていきます。
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
[1] 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
[2] 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
[3] 日本学術振興会
科学研究費助成事業「自動性能チューニング機能を持つ高性能グラフライブラリの開発(研究代表者:中尾昌広、研究分担者:藤澤克樹、児玉祐悦)」
[4] 大規模グラフ解析プログラムのGitHubレポジトリ
World championship code for Graph500 | GitHub
参考文献
[1] Masahiro Nakao, Koji Ueno, Katsuki Fujisawa, Yuetsu Kodama, and Mitsuhisa Sato. "Performance of the Supercomputer Fugaku for Breadth-First Search in Graph500 Benchmark". ISC High Performance, June 2021, pp. 372-390. DOI : 10.1007/978-3-030-78713-4_20
[2] Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, "Efficient Breadth-First Search on Massively Parallel and Distributed Memory Machines", Data Science and Engineering, Springer, March 2017, Volume 2, Issue 1, pp 22-35, 2017.
[3] Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka , "Extreme scale breadth-first search on supercomputers". 2016 IEEE International Conference on Big Data (Big Data): 1040–1047. 2016.
用語説明
[用語1] スーパーコンピュータ「富岳(ふがく)」 : スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザーの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAIの加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年3月に共用を開始した。 現在「富岳」は日本が目指すSociety 5.0を実現するために不可欠なHPCインフラとして活用されている。
[用語2] ノード : スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、一つのCPU(中央演算装置)と32GiB(ギビバイト)のメモリから構成される。
[用語3] GTEPS(ギガテップス) : TEPSはTraversed Edges Per Secondの略であり、「Graph500」ベンチマークの実行速度を表すスコア。「Graph500」ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。「Graph500」におけるコンピュータの速度は1秒間当たりに処理した枝の数として定義されている。GTEPSのGは10の9乗を表し、GTEPSは1秒当たりに処理した枝の数を10の9乗で割った値である。GTEPS値の計算には、64試行における調和平均が使用されている。
[用語4] Society 5.0 : 狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において日本が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI(人工知能)、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指す。
[用語5] 持続可能な開発目標(SDGs) : 2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴールと169のターゲットで構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本も積極的に取り組んでいる。(外務省ホームページから一部改変して転載)
- プレスリリース スーパーコンピュータ「富岳」を用いてGraph500の世界第1位を獲得 —9期連続、ビッグデータ処理で重要なグラフ解析性能で首位—
- スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開|東工大ニュース
- スーパーコンピュータ「富岳」政策対応枠における大規模言語モデル分散並列学習手法の開発について|東工大ニュース
- スーパーコンピュータ「京」がGraph500において9期連続で世界第1位を獲得|東工大ニュース
- Graph 500 - The Graph 500 List
- 藤澤克樹 Katsuki Fujisawa|研究者検索システム 東京工業大学STARサーチ
- 未来産業技術研究所
- 科学技術創成研究院
- 情報理工学院 数理・計算科学系
- 理化学研究所 計算科学研究センター
- 株式会社フィックスターズ
- NTTコンピュータ&データサイエンス研究所|NTT R&D
- スーパーコンピュータ「富岳」|富士通株式会社
- 研究成果一覧
お問い合わせ先
理化学研究所 神戸事業所 計算科学研究推進室
アウトリーチグループ
Email r-ccs-koho@ml.riken.jp
理化学研究所 広報室 報道担当
Email ex-press@ml.riken.jp
Tel 050-3495-0247
東京工業大学 総務部 広報課
Email media@jim.titech.ac.jp
Tel 03-5734-2975
株式会社フィックスターズ 広報担当
Email press@fixstars.com
Tel 03-6420-0751
日本電信電話株式会社 サービスイノベーション総合研究所 企画部広報担当
Email nttrd-pr@ml.ntt.com
富士通株式会社 広報IR室
Tel 044-754-3338(直通)
富士通株式会社 富士通コンタクトライン(総合窓口)
Tel 0120-933-200
受付時間: 9時~12時および13時~17時30分
(土曜・日曜・祝日・富士通指定の休業日を除く)