メニュー

障害復旧についてのお知らせ

(2020.11.11)
 

本日発生しておりました障害が解消し、現在、ログイン可能な状態です。
また、ジョブ実行も通常どおり可能です。

本日発生の障害についての概要を以下にて報告いたします。
 

経緯

2020/11/11(水)
00:13 NASサーバ再起動・NFSサービス停止(home1へのアクセス(NFS)不可※1)
09:28 NFSサービス起動(home1へのアクセス(NFS)再開)
12:27 ジョブ新規実行不可設定実施
15:13 復旧、ジョブ新規実行再開
※1 home1アクセス不可の間ログイン不可

 

原因

/home1 障害
Active-Standby構成をとっている/home1において、Active側 NFS サービスの異常を検知。
Standby側への切り替えは本来手動で実行する設計であったが、設定不備によりActive側のサービスを全停止するプロセスが
 自動実行された。
 

影響

/home1アクセス不可、実行ジョブ障害※2、新規ログイン不可、既存ログイン強制排除
※2 障害の影響を受けたジョブの実行ユーザには別途連絡いたします。
 

対策

/home1冗長構成の現状設定の確認と見直し
 

このたびはご迷惑おかけし申し訳ありませんでした。
対策について検討、実施するとともに、今後も安定運用に努めてまいります。
 

本件に関するお問い合わせ

OKBizからお問い合わせください


  • 産業用スパコン利用相談センター
  • 賛助会員募集中
  • 「富岳」 利用研究課題の募集
  • ファーストタッチオプション「富岳」
  • 計算科学研究センター (R-CCS)