クラウド型グリーンスーパーコンピュータ 一式
基本情報
- 調達機関および所在地
- 国立大学法人 (東京都)
- 公示日
- 2009年01月16日
- 公示の種類
- 資料提供招請に関する公表
- 機関名詳細および所在地詳細
- 国立大学法人東京工業大学 事務局長 吉川 晃
詳細情報
次のとおり物品の導入を予定していますので、当該導入に関して資料等の提
供を招請します。
平成 21 年1月 16 日
国立大学法人東京工業大学
事務局長 吉川 晃
◎調達機関番号 415 ◎所在地番号 13
○第1号
1 調達内容
(1) 品目分類番号 14
(2) 導入計画物品及び数量
クラウド型グリーンスーパーコンピュータ 一式
(3) 調達方法 借入
(4) 導入目的
本システム(総称TSUBAME2)は、本学学術国際情報センター(
GSIC)が2006年4月1日に設置・運用を開始し、2年間に渡り我が国
最速となったスーパーコンピューティング・キャンパスグリッド基盤システム
(総称「みんなのスパコン」TSUBAME1)のソフトウェア・運用・広範
なユーザベース等の資産を生かし、我が国初のペタフロップス級のスーパーコ
ンピュータを目指すものである。また、今回は学内に対しては単なる研究用だ
けでなく、全学教育や種々の学内サービスのホスティングを行い、学外に対し
ては全国共同研究・共同利用の基盤センターとしての我が国のリーディングス
ーパーコンピュータとして、企業利用を含み広くそのサービスを提供するもの
である。
(5) 導入予定時期
平成22年度4月以降
(6) 調達に必要とされる基本的な要求要件
現在本センターが使用しているスーパーコンピュータTSUBAMEは
、x86―64命令セットを有するOpteronベースのサーバ群SunF
ire x4600(16CPUコア)が655ノード(総計10480CP
Uコア)、そのうち360ノードにはClearSpeedアクセラレータが
挿入されており、42ノードのSunFire x4500を含む1.1ペタ
バイトのストレージシステムらが全てInfinibandネットワークによ
って相互結合されており、約80TeraFlopsのピーク性能を誇る。各
計算ノードではSuse Linux 10が動作し、Sun N1GEによ
り資源制御が行われている。また、毎年別システムではあるものの、ストレー
ジやGPUなどが追加され、センターのシステム全体として強化が行われてい
る。TSUBAME2はTSUBAME1の基本的な構成を踏襲し、今までの
ユーザのプログラムがほぼ全て再コンパイルなしに動作し、かつホスティング
サービスなどのサービス群もそのまま継続されることを必要条件とする。のみ
ならず、全学の教育システムのバックエンドとしても動作し、教育用アカウン
トと研究用アカウントの統合を行う基盤システムとする。TSUBAME2は
、TSUBAME1に加え、以下のような基本技術要件を備える:(1)GP
U型アクセラレータによる1ペタフロップ以上の演算性能の確保とコモディテ
ィHPC環境との連続性の確保 (2)「グリーンスパコン」として、冷却系
を含む省エネ設計および運用によるTSUBAME1と同レベルのエネルギー
消費量の維持 (3)「クラウド型スパコン」として、LinuxおよびWi
ndows HPCという二つ以上のOSの選択肢を含む、動的なプロビジョ
ニングを行える資源配分やチェックポイント・マイグレーション・仮想化機構
さらに、アプリケーションやユーザによって異なるTSUBAME2は、CP
Uの命令セットおよびGPUの種類
を同一とするも、異なるCPU・GPU数やメモリサイズを有する3つの
クラス(thin, medium, fat)の計算ノード群によって構成
される。全てのノードにおいては同バージョンのLinuxおよびWindo
ws HPCが動作し、相互にバンド幅8GByte/s以上でかつ1μs以
下の低レーテンシな相互結合網により結合され、かつアクセラレータなどが装
備されている同一のプログラム実行環境でなくてはならない。A.全計算ノー
ド(Thin, Medium, Fat)共通仕様 (a)ノード内ではO
penMP, MPIによる分散並列演算を提供すること。(b)ノード内の
全てのCPUは、x86―32およびx86―64ビットの命令体系(ISA
)を有すること。(c)単体のCPUコア性能は、SpecINT2006(
peak)で20.0、SpecFP2006(peak)で23.0以上で
あること。(d)GPUアクセラレータの性能は、単精度のピーク性能が1.
5TeraFlops、倍精度が500TeraFlops程度以上であるこ
と。(e)GPUアクセラレータはCUDA, OpenCLなどの広く普及
し、かつ一般的な並列アルゴリズムが容易かつ効率よく実装できる言語が提供
されること。(f)RAID0構成が可能なSSDあるいは相当のI/O機能
を有するフラッシュメモリを備えること。そのノード当たりの総容量は500
GB程度以上、合算リード性能が400MB/s、ライト性能が300MB/
s以上であること。(g)8GB/s以上のバンド幅のネットワークを備える
こと。ネットワーク線がDual rail構成以上の場合は、トランキング
などによる同時利用によって8GB/s以上の達成が可能であること。各ra
ilに接続するPCI―express I/Oはそれぞれのrailの理論
ピーク転送性能以上で接続されていること。(h)OSとしてLinux2.
6以上の商用ディストリビューションあるいはそれと同等なもの、およびWi
ndows HPCの実行ライセンスを有し、実際にインストール・実行が可
能であること。(i)現行のTSUBAME1が有するバッチキュー
全ての主たる機能を満たすスケジューラで有効にマルチユーザ環境で資源
配分がされること。(j)ネットワーク経由で、(j.1)ノードを完全休眠
状態(hibernation)にできること、(j.2)吸気温度・排気温
度を観察できること、(j.3)PXEブート等により、ディスクレスでブー
トとできること。B.Thin計算ノード仕様(a)各計算ノードは総計12
コア以上のx86―64CPUコアが全メモリを共有できること。(b)コア
あたり2GByte以上のメモリを有すること。また、ノード全体の理論メモ
リバンド幅が60GByte/s以上であること。(c)各計算ノードは1枚
以上のGPUアクセラレータが装着されていること。また、将来もう一枚のア
クセラレータが装着可能であること。装着されているアクセラレータには4G
Byte以上のメモリが装備されていること。(d)各アクセラレータへはそ
れぞれ独立にPCI―Express generation2 x16以上
のバンド幅(8GB/s)のI/Oにて接続されること。(e)各計算ノード
は標準の19インチラックで2U以下のあるいはそれに相当する以下の表面積
および体積を占めること。C.Medium計算ノード仕様 (a)各計算ノ
ードは総計32コア以上のx86―64CPUコアが全メモリ共有できること
。(b)コアあたり2GByte以上のメモリを有すること。また、ノード全
体の理論メモリバンド幅が160GByte/s以上であること。(c)各計
算ノードは2枚以上のGPUアクセラレータが装着されていること。また、将
来もう2枚のアクセラレータが装着可能であること。装着されているアクセラ
レータには4GByte以上のメモリが装備されていること。(d)各アクセ
ラレータへはそれぞれ独立にPCI―Express generation
2 x16以上のバンド幅(8GB/s)のI/Oにて接続されること。(e
)各計算ノードは標準の19インチラックで4U以下のあるいはそれに相当す
る以下の表面積および体積を占めること。(f)全計算ノード群の台数に対し
て最低5%のノードはMedium計算ノードであること。D.Fat計算ノ
ード仕様 (a)各計算ノードは総計32コア以上のx86―64CPUコア
が全メモリ共有できること。(b)ノード全体で256GByte以上のメモ
リを有すること。また、ノード全体の理論メモリバンド幅が200GByte
/s以上であること。(c)各計算ノードは4枚以上のGPUアクセラレータ
が装着されていること。装着されているアクセラレータには4GByte以上
のメモリが装備されていること。(d)各アクセラレータへはそれぞれ独立に
PCI―Express generation2 x16以上のバンド幅(
8GB/s)のI/Oにて接続されること。(e)最低8台のノードはFat
計算ノードであること。E.マルチペタバイト級ストレージ (a)非フォー
マット時で8PB以上の物理容量を有すること。(b)RAID6などの、三
重のデータ保護機能を有すること。(c)LUSTREなどの高速かつ高信頼
な並列ファイルシステムを有すること。並列ファイルシステムはメタデータサ
ーバなど各部分がハード的・ソフト的に多重化され、single poin
t of failureを持たないこと。(d)ファイルシステム全体のス
ループットが100GB/s以上であること。(e)GridFTPおよびG
Farm2などのグリッドのファイル転送手段・およびグリッドのファイル複
製共有システムを有すること。(f)2000以上のNFSあるいは同等の遠
隔ファイルシステムのマウントポイントをサポートすること。(g)非圧縮時
の容量がディスク全体の容量
と同等以上のテープシステムを持つこと。テープシステムの全体の転送ス
ループットが5GB/s以上であること。F.ノード間相互結合網 (a)全
ての計算ノード群、およびマルチペタバイト級ストレージを接続すること。(
b)計算ノード群へはそれぞれ理論最高値8GByte/sのバンド幅が確保
できること。また、MPI通信時の計算ノード群のend−to−endの最
長レーテンシは1μs以下であること。(c)マルチペタバイト級ストレージ
には合算で100GByte/sの接続が可能であること。(d)ネットワー
クプロトコルとして、RDMA、TCP/IP、MPI over RDMA
をサポートすること。(e)ネットワーク全体のバイセクションバンド幅は、
((計算ノード数×8)÷2)GByte/s以上であること。(f)既存の
キャンパス内ネットワーク(SuperTitanet)及び外部グリッドネ
ットワーク(SuperSINET3)に対して複数の10Gbps以上の通
信性能で直接接続できること。G.全体性能に関する要件 (a)計算ノード
群全体のピーク合算性能は1.1PetaFlops以上であること。(b)
計算ノード群のピーク合算性能のうち、CPUの性能寄与はピークで300T
eraFlops以上であること。(c)計算ノード群のメモリの合算容量は
50TeraByte以上であること。H.グリーンスーパコンピュータとし
ての要求要件以下の(a)―(d)を満たす技術要件の達成法およびその妥当
性を示すこと。(a)ピーク消費電力(W)―これは、全システムが「想定し
うる最高の」高負荷となるときにおいて、システム全体が消費する電力である
。TSUBAME1に続き、今回の調達において、設置場所であるGSIC情
報棟建物の容量以下に抑えることが重要である。具体的には、単一のノード上
でCPUおよびGPUとも高度に最適化され70%以上の計算効率を出してい
るLinpack実行をベースとした全体の実測あるいは予想される消費電力
の値が1.1MegaWatt以下である必要がある。(b)平均消費電力お
よびエネルギー値―これはシステム全体が単位時間当たりに消費する電力の(
長時間の)時間平均である。実際のシステムは、高負荷から低負荷まで時間的
・季節的に変動するが、理想的な姿としては、システムの平均消費のPeak
に対する割合が、平均負荷率と丁度それにマッチする(たとえば、平均負荷7
0%のシステムならば、使用電力はPeakの70%となる)ことである。T
SUBAME2においては、(a)の状況を100%として、50%負荷時に
Peakの50%の平均消費電力であることを示す必要がある。(c)Pea
kの動的な制御抑制―近年特に夏季において、全学の電力需要が、契約電力の
供給を上まりそうになり、電力抑制の警戒警報が発令されることが頻発してい
る。現行のGSICにおける計算機はどれも電力抑制のための動的かつすみや
かなPeak抑制の手段がないため、そのような要請に応じられる体制にない
。今回の調達においては、そのような警報が発令された場合、すみやかに現行
のユーザのジョブの実行を直接的に妨げることなく、Peakを抑制する縮退
運転に移行することにより、Peakを数%〜数十%削減する機構を必須とす
る。(d)冷房効率の最大化―本調達においては、落札者が必要な追加の冷却
設備を設置する必要があるが、その際の(b)時の平均PUEを1.25以下
とする効率を達成する必要がある。I クラウド型スーパコンピュータとして
の要求要件 (a)Linux kernel 2.6以上をベースとし、ス
ーパコンピューティングで実績のあるディストリビューション、およびWin
dows HPCという二つ以上のOSが動作し、また適切な稼働ライセンス
を有すること。
(b)各計算ノードにおいて、仮想マシンが動作し、(a)の二つのOS
もその上で動作可能であること。(c)Linux、Windowsともバッ
チスケジューラと連動した動的なプロビジョニングが可能であること。(d)
チェックポイント・マイグレーションの機能をサポートすること。(e)上記
のサービスの仕様は、標準的なWeb ServicesのAPIとして与え
られること。
2 資料及びコメントの提供方法 上記1(2)の物品に関する一般的な参考
資料及び同(6)の要求要件等に関するコメント並びに提供可能なライブラリ
ーに関する資料等の提供を招請する。
(1) 資料等の提供期限 平成21年2月26日 (2009年2月26日)17時00分(郵送の場
合は必着のこと。)
(2) 提供先 〒152―8550東京都目黒区大岡山2丁目12番1 📍
号 東京工業大学財務部契約課 大久保富久 電話03―5734―2350
3 説明書の交付 本公表に基づき応募する供給者に対して導入説明書を交付
する。
(1) 交付期間 平成21年1月16日 (2009年1月16日)から平成21年2月26日 (2009年2月26日)まで。
(2) 交付場所 上記2(2)に同じ。
4 説明会の開催 本公表に基づく導入説明会を開催する。
(1) 開催日時 平成21年1月27日 (2009年1月27日)10時00分
(2) 開催場所 東京工業大学学術国際情報センター2階会議室
5 その他 この導入計画の詳細は導入説明書による。なお、本公表内容は予
定であり、変更することがあり得る。