Intel MPI 4.1.1 mpirun コマンドの不具合について
FOCUSスパコン利用者各位
平素は弊財団事業並びにFOCUSスパコンをご愛顧賜り厚く御礼申し上げます。
このたび、Intel MPI 4.1.1 に含まれる mpirun コマンドに不具合があることが判明いたしました。
FOCUSスパコン環境での最新版の Intel MPI 5.0.2 では不具合は修正されておりますのでこちらをご利用ください。
Intel MPI 4.1.1 を利用される場合は、下記の回避方法をご参照ください。
なお、今後、本件のように財団の責によらないソフトウェアの不具合については、課金免除対象となりませんのでご留意ください。
・障害の概要
ジョブ内で Intel MPI 4.1.1 に含まれる mpirun を使用すると、計算処理が進まずジョブが完了しないことがある。
・期間
平成27年4月9日(木) 10:00 ~
・原因
Intel MPI 4.1.1 に含まれる mpirun コマンドの不具合。
mpirunコマンドのノード名を処理する箇所に不具合が存在する。
・影響範囲
Intel MPI 4.1.1 に含まれる mpirun コマンドを使用するジョブの一部。
ジョブの処理内容やジョブに割り当てられたノードによって影響の有無は異なる。
・障害の回避方法
(方法1) FOCUSスパコン環境での最新版の Intel MPI を利用する。
※プログラムの再ビルドが必要となる場合がございます。
環境設定する際のコマンドを次のように変更する。
module load impi411
↓
module load impi
(方法2) ノード一覧を明示的に指定する。
Intel MPI 4.1.1 を使う必要がある場合、ノードの一覧を明示的に指定することで本障害を回避することが可能。
ジョブスクリプトの module load から mpirun までを以下のように変更する。
module load PrgEnv-intel
module load impi411
NODEFILE=`generate_pbs_nodefile`
mpirun -hostfile ${NODEFILE} -np ${SLURM_NTASKS} 実行ファイル
ジョブ実行について本障害の影響を受けたとみられるユーザについては、個別にご連絡いたします。
このたびは本障害のためご迷惑をおかけしましたことをお詫び申し上げます。
<本件に関する問い合わせ先>
公益財団法人 計算科学振興財団 業務運用グループ
E-mail アドレス:unyo[at]j-focus.or.jp([at]を@に変更して下さい)