スーパーコンピュータ「京」がGraph500において5期連続で世界1位を獲得
―ビッグデータの処理で重要となるグラフ解析で最高の評価―
概要
九州大学と東京工業大学、理化学研究所、スペインのバルセロナ・スーパーコンピューティング・センター、富士通株式会社による国際共同研究グループは、2017年6月21日(水)(米国ソルトレイクシティ現地時間)に公開された最新のビッグデータ処理(大規模グラフ解析)に関するスーパーコンピュータの国際的な性能ランキングであるGraph500において、スーパーコンピュータ「京(けい)」[用語1]による解析結果で、2016年11月に続き5期連続(通算6期)で第1位を獲得しました。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析において重要となるもので、「京」は正式運用開始から5年以上が経過していますが、今回のランキング結果によって、現在でもビッグデータ解析に関して世界トップクラスの極めて高い能力を有することが実証されました。今後本成果の広範な普及のため、プログラムをオープンソース化し、大規模高性能グラフ処理のグローバルスタンダードを確立して行く予定です。
本研究の一部は、科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出」(研究総括:佐藤三久 理化学研究所 計算科学研究機構)における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤」(研究代表者:藤澤 克樹 九州大学、拠点代表者:鈴村豊太郎 バルセロナ・スーパーコンピューティング・センター)および「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」(研究総括:喜連川優 国立情報学研究所)における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」(研究代表者:松岡聡 東京工業大学)の一環として行われました。
2017年6月21日に公開されたGraph500上位5位
順位 |
システム名称 |
設置場所 |
ベンダー |
国名 |
|||
---|---|---|---|---|---|---|---|
1 |
京 |
理研 計算科学研究機構 |
富士通 |
日 |
82,944 |
40 |
38,621 |
2 |
神威太湖之光 (Sunway TaihuLight) |
無錫国立スーパーコンピューティングセンター |
NRCPC |
中 |
40,768 |
40 |
23,756 |
3 |
Sequoia |
ローレンス・リバモア研究所 |
IBM |
米 |
98,304 |
41 |
23,751 |
4 |
Mira |
アルゴンヌ研究所 |
IBM |
米 |
49,152 |
40 |
14,982 |
5 |
JUQUEEN |
ユーリッヒ研究所 |
IBM |
独 |
16,384 |
38 |
5,848 |
Graph500とは
近年活発に行われるようになってきた実社会における複雑な現象の分析では、多くの場合、分析対象は大規模なグラフ(節と枝によるデータ間の関連性を示したもの)として表現され、それに対するコンピュータによる高速な解析(グラフ解析)が必要とされています。例えば、インターネット上のソーシャルサービスなどでは、「誰が誰とつながっているか」といった関連性のある大量のデータを解析するときにグラフ解析が使われます。また、サイバーセキュリティや金融取引の安全性担保のような社会的課題に加えて、脳神経科学における神経機能の解析やタンパク質の相互作用分析などの科学分野においてもグラフ解析は用いられ、応用範囲が大きく広がっています。こうしたグラフ解析の性能を競うのが、2010年から開始されたスパコンランキング「Graph500」です。
規則的な行列演算である連立一次方程式を解く計算速度(LINPACK[用語2])でスーパーコンピュータを評価するTOP500[用語3]においては、「京」は2011年(6月、11月)に第1位、その後、2017年6月19日に公表された最新のランキングでも第8位につけています。一方、Graph500ではグラフの幅優先探索(1秒間にグラフのたどった枝の数(Traversed Edges Per Second; TEPS[用語4]))という複雑な計算を行う速度で評価されており、計算速度だけでなく、アルゴリズムやプログラムを含めた総合的な能力が求められます。
今回Graph500の測定には、「京」が持つ88,128台のノード[用語5]82,944台を用いています。約1兆個の頂点を持ち16兆個の枝から成るプロブレムスケール[用語6]の大規模グラフに対する幅優先探索問題を0.45秒で解くことに成功しました。ベンチマークのスコアは38,621 GTEPS(ギガテップス)です。Graph500第1位獲得は、「京」が科学技術計算でよく使われる規則的な行列演算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い能力を有していることを実証したものであり、幅広い分野のアプリケーションに対応できる「京」の汎用性の高さを示すものです。また、それと同時に、高いハードウェアの性能を最大限に活用できる研究チームの高度なソフトウェア技術を示すものと言えます。「京」は、国際共同研究グループによる「ポストペタスケールシステムにおける超大規模グラフ最適化基盤」および「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術」の2つの研究プロジェクトによってアルゴリズムおよびプログラムの開発が行われ、2014年6月に17,977 GTEPSの性能を達成し第1位、また「京」のシステム全体を効率良く利用可能にするアルゴリズムの改良が行われ2倍以上性能を向上させ、2015年7月に38,621 GTEPSを達成し第1位でした。そして今回のランキングでもこの記録は神威太湖之光等の新しいシステムに比べても大幅に高いスコアであり、世界第1位を5期連続(通算6期)で獲得しました。
今後の展望
大規模グラフ解析においては、アルゴリズムおよびプログラムの開発・実装によって性能が飛躍的に向上する可能性を示しており、研究グループでは今後も更なる性能向上を目指していきます。また、上記で述べた実社会の課題解決および科学分野の基盤技術へ貢献すべく、スーパーコンピュータ上でさまざまな大規模グラフ解析アルゴリズムおよびプログラムを研究開発していきます。
用語説明
[用語1] スーパーコンピュータ「京(けい)」 : 文部科学省が推進する「革新的ハイパフォーマンス・コンピューティング・インフラ(HPCI)の構築」プログラムの中核システムとして、理研と富士通が共同で開発を行い、2012年に共用を開始した計算速度10ペタフロップス級のスーパーコンピュータ。「京(けい)」は理研の登録商標で、10ペタ(10の16乗)を表す万進法の単位であるとともに、この漢字の本義が大きな門を表すことを踏まえ、「計算科学の新たな門」という期待も込められている。
[用語2] LINPACK : 米国のテネシー大学のジャック・ドンガラ博士らによって開発された規則的な行列計算による連立一次方程式の解法プログラムで、TOP500リストを作成するために用いるベンチマーク・プログラム。ハードウェアのピーク性能に近い性能を出しやすく、その計算は単純だが、応用範囲が広い。
[用語3] TOP500 : TOP500は、世界中のコンピュータシステムの、連立一次方程式の処理速度上位500位までを定期的にランク付けし、評価するプロジェクト。1993年に発足し、スーパーコンピュータのリストを年2回発表している。
[用語4] TEPS(Traversed Edges Per Second) : Graph500ベンチマークの実行速度をあらわすスコア。Graph500ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。Graph500におけるコンピュータの速度は1秒間あたりに調べ上げた枝の数として定義されている。G(ギガ)は10の9乗(=10億)を表す接頭辞。
[用語5] ノード : スーパーコンピュータにおけるオペレーティングシステム(OS)が動作できる最小の計算資源の単位。「京」の場合は、ひとつのCPU(中央演算装置)、ひとつのICC(インターコネクトコントローラ)、および16GBのメモリから構成される。
[用語6] プロブレムスケール : Graph500ベンチマークが計算する問題の規模をあらわす数値。グラフの頂点数に関連した数値であり、プロブレムスケール40の場合は2の40乗(約1兆)の数の頂点から構成されるグラフを処理することを意味する。
- プレスリリース スーパーコンピュータ「京」がGraph500において5期連続で世界1位を獲得―ビッグデータの処理で重要となるグラフ解析で最高の評価―
- Graph500
- スーパーコンピュータ「京」がGraph500において4期連続で世界1位を獲得 | 東工大ニュース
- スーパーコンピュータ「京」がGraph500で世界第1位を獲得―ビッグデータの処理で重要となるグラフ解析で最高の評価― | 東工大ニュース
- 2期連続でスーパーコンピュータ「京」がGraph500で世界第1位を獲得 | 東工大ニュース
- スパコン「京」がGraph500で世界1位 -ビッグデータの処理で重要となるグラフ解析でも最高の評価- | 東工大ニュース
- 松岡研究室
- 研究者詳細情報(STAR Search) - 松岡聡 Satoshi Matsuoka
- 学術国際情報センター
- 情報理工学院 数理・計算科学系
- 研究成果一覧
問い合わせ先
九州大学 広報室
Email : koho@jimu.kyushu-u.ac.jp
Tel : 092-802-2130 / Fax : 092-802-2139
東京工業大学 広報・社会連携本部 広報・地域連携部門
Email : media@jim.titech.ac.jp
Tel : 03-5734-2975 / Fax : 03-5734-3661
理化学研究所 広報室 報道担当
Email : ex-press@riken.jp
Tel : 048-467-9272 / Fax : 048-462-4715
富士通株式会社 富士通コンタクトライン(総合窓口)
Tel : 0120-933-200
受付時間:9時~17時30分
(土曜日・日曜日・祝日・年末年始を除く)
株式会社フィックスターズ マーケティング担当
Email : press@fixstars.com
Tel : 03-6420-0758
科学技術振興機構 広報課
Email : jstkoho@jst.go.jp
Tel : 03-5214-8404 / Fax : 03-5214-8432