FOCUSスパコン利用者各位
平素よりFOCUSスパコンシステムをご愛顧賜り厚く御礼申し上げます。
現在非常に多くのご利用者が期間占有(日・月・年度単位の予約)利用されており、従量利用に割り当てるノード数が
減少しております。
特にAシステムに期間占有利用が集中しており、11月下旬まで全224ノードに対し従量利用への割り当てが半分以下の
状態が続く見込みです。
参考 Aシステム共用計算資源予約状況カレンダー
http://www.j-focus.jp/cal/asys.html
加えて年明け1月からはFOCUSスパコン繁忙期に入り、さらに需要が高まる見込みです。
以下、弊財団から推奨する繁忙期対策をご参照の上、計画的にFOCUSスパコンをご利用いただきたく存じます。
1. 計算資源予約の推奨
2. 予約可能ノード数の確認方法
3. 従量利用にて実行可能なノード数・キューの確認方法
4. 長時間キューの割当ノード数の縮小について
5. 短時間キューの活用について
6. Eシステム(短時間キューを含む)の利用について
記
【1. 計算資源予約の推奨】
期間占有利用に割り当てられたノードが多くなりますと、従量利用の割り当てノード数が減少し、標準キューでの
ジョブの実行機会も減少します。
ある期間にジョブを確実に実行したい場合は後述する「2. 予約可能ノード数の確認方法」を参照の上、
計算資源予約をお願いします。
計算資源予約は下記予約システムより承ります。
http://fl01.j-focus.jp/reservation/
予約システム利用の手引き
http://www.j-focus.jp/reservation/
予約システムの利用にはSSL-VPN接続が必要です。
SSL-VPN利用の手引き
http://www.j-focus.jp/sslvpn/
予約は利用開始予定日4業務日前の9時までに済ませることを推奨します。
利用直前に予約を申請していただいたとしてもノードの利用状況により予約を承ることが出来ない場合がございます。
【2. 予約可能ノード数の確認方法】
各システムにて従量利用可能なノード数は「予約状況カレンダー」
にてご確認ください。
Aシステム http://www.j-focus.jp/cal/asys.html
Dシステム http://www.j-focus.jp/cal/dsys.html
「 日付
予約済ノード数
提供ノード数 」
提供ノード数と予約済ノード数の差が、予約可能なノード数となります。
【3. 従量利用にて実行可能なノード数・キューの確認方法】
システム毎の空きノード数はfreenodesコマンドにて、各キューの空き状況は、squeuesコマンドにて
コマンド実行時の状況が確認できます。
適宜確認の上ジョブを投入してください。
freenodesコマンド:
システム毎のジョブの実行状況を確認できます。
コマンド実行時点での「空きノード数 / 従量利用にて利用可能なノード数」が表示されます。
$ freenodes
Number of free nodes in A sys. with QDR-IB connected is 1/ 74.
Number of free nodes in B sys. with QDR-IB connected is 2/ 2.
Number of free nodes in C sys. with GbE connected is 2/ 6.
Number of free nodes in D sys. with FDR-IB connected is 70/ 79.
Number of free nodes in E sys. with FDR-IB connected is 29/ 29.
Number of free nodes in G sys. with GbE connected is 4/ 4.
squeuesコマンド:
キュー毎のジョブの実行状況を確認できます。
「FREE」(実行可能なノード数)
「PEND」(実行待ちのジョブが要求しているノード数) から込み具合を判断してください。
$ squeues
QUEUE_NAME TIMELIMIT STATUS MAXNODES NNODES PEND RUN FREE
a024h 1-00:00:00 up 74 88 15 73 1
a096h 4-00:00:00 up 66 0 0 0 1
b024h 1-00:00:00 up 2 0 0 0 2
b096h 4-00:00:00 up 1 0 0 0 1
c024h 1-00:00:00 up 4 1 0 1 0
c096h 4-00:00:00 up 4 3 0 3 0
c006m 6:00 up 2 0 0 0 2
d006h 6:00:00 up 108 0 0 0 100
d012h 12:00:00 up 108 0 0 0 100
d024h 1-00:00:00 up 79 0 0 0 71
d072h 3-00:00:00 up 39 2 1 1 31
d144h 6-00:00:00 drain 39 7 0 7 31
e024h 1-00:00:00 up 29 0 0 0 29
e072h 3-00:00:00 up 15 0 0 0 15
e144h 6-00:00:00 drain 29 0 0 0 29
g006m 6:00 up 4 0 0 0 4
※「MAXNODES」が0の場合はジョブのサブミットもできません
【4. 長時間キューの割当ノード数の縮小について】
A及びDシステムの長時間キューの実行可能最大ノード数を下記のとおり縮小しました。
a096h 16ノード (変更前 100ノード)
d072h 16ノード (変更前 40ノード)
(注)最大ノード数は計算資源の予約状況により変動します。
上記設定数以上のノード数で24時間以上のジョブ実行を希望される場合は、
期間占有(日単位/月単位)にて計算資源を予約し利用してください。
最大ノード数の縮小に伴って長時間キューに投入したジョブの待ち時間が長大化します。
最大ノード数未満の利用であっても特定期日までに実行完了が必要な24時間以上のジョブの実行には期間占有で
計算資源を予約し利用してください。
【5. 短時間キューの活用について】
実行時間が短いと見込まれるジョブは、Dシステム短時間キュー(d006h,d012h)の利用をご検討ください。
各システムの24時間キューや長時間キューよりもジョブ実行のスループットが向上します。ただし、短時間キューへの
投入ジョブが非常に多い場合はジョブ実行までの待ち時間が長くなりますのでご了承ください。
また、当該短時間キューでは適用先システムとして、Dシステムに加えEシステムを割り当てております。
D,Eどちらのシステムで実行されるかはシステムの空き状況に依存します。
キュー名 最長実行時間 最大ノード数 システム /work容量
---------------------------------------------------------
d006h 6時間 111ノード D 2TB
d012h 12時間 111ノード D 2TB
(注)最大ノード数は計算資源の予約状況により変動します。
利用料金はDシステムの料金(並列割引あり)が適用されます。
【6. Eシステム(短時間キューを含む)の利用について】
下記のソフトウェアにてEシステム上(短時間キューを含む)でジョブを実行した際にジョブが正常に実行されない
場合があるとの報告があります。
各ソフトウェアをご利用の際は下記のとおりご対応ください。
・FLUENT : 回避策をベンダーにお問い合わせください。
・STAR-CCM+ : Eシステム(短時間キューを含む)の利用を回避してください。
その他ソフトウェアのEシステムでの稼働状況につきましては提供ベンダーにお問い合わせください。
以上、よろしくお願いいたします。
<本件に関するお問い合わせ先>
公益財団法人計算科学振興財団 業務運用グループ
E-mail アドレス:unyo[at]j-focus.or.jp([at]を@に変更して下さい)