【解消】ジョブが投入しづらい状況の発生 (8/2 16:45 解消済)
(2024.8.5)
8月2日(金)、以下の時間帯でジョブが受け付けられない(投入できない)事象が頻発しました。
本事象の影響で投入できなかったジョブがある場合、お手数ですが、再度ジョブの投入をお試しください。
【期間】 2024/08/02 09:05 〜 16:45
【事象】 sbatchコマンド実行時に以下のエラーメッセージが表示され、ジョブが受け付けられない
「sbatch: error: Slurm temporarily unable to accept job, sleeping and retrying.」
【原因】短期間での大量ジョブ投入により、システム全体で設定されている一定期間内に保持できるジョブの最大件数に達したため
【対応】一定期間内に保持できる最大ジョブ件数の設定値引き上げ
現在は通常どおりジョブ投入していただけます。
また、共用/専用資源にかかわらず、1日に2,000以上のジョブを投入/実行することをご検討の場合は、事前にヘルプデスクへご連絡いただきますようお願いいたします。
安定運用のためご協力いただきますようお願い申し上げます。
このたびはご不便おかけし申し訳ございませんでした。
引き続き、よろしくお願いいたします。