auのメール障害、KDDIが原因を正式発表。 手順書の誤りによる人的ミス、障害への対策不足が明らかに。

 KDDIは、iOS端末で起きたEメールリアルタイム送受信の障害について、発生した事象とその影響、および原因について発表しました。

 発生した事象は大きく分けて以下の3つとなります。直前に起きた、200人に影響する1時間の障害も新たに公表され、事象1として区分されていることがわかります。全国のユーザーに大きく影響していたのは事象2~3です。しかし事象1~3は全て関連した障害であることがわかってきました。

 まず事象1。バージョンアップ作業の途中で、ユーザー認証サーバーにおいて、ユーザー情報の不一致が発生。この原因は、手順書記載ミスによるコマンド誤りであったとのこと。事前検証試験の不足によるものであると言えます。

 続いて事象2。そしてこの事象1を解消したため、作業を続行。新サーバーへの切り替えを実施するも、エラーが発生。予期せぬエラーのため現行設備への切り戻しを実施。しかし切り戻し作業を実施中に、新サーバーの片方がハードウェア障害によりダウン。新サーバーのもう片方も過負荷によりダウン。これによりEメールの送受信が不可能となります。

 そして事象3。この事象2により、再起動を実施。しかし62台の中24台のサーバーで高負荷状態が継続。結局解消されたのが4月19日02時54分となったようです。

 つまり、原因は以下の通りです。

  1. 手順書記載ミスによるコマンド誤り(事前検証試験不足)
  2.  HW障害(片系)と二重障害時の対策準備不足
  3. メールBOXサーバ再起動手順の考慮不足

 こうした原因について、KDDIの発表した対策の多くが5月末までに完了する見込みです。メールサーバーの増強、ストレージの負荷対策のみ8月末までに行われる予定です。

 今年は業績こそ好調ではあるものの、障害続きのKDDIですが、このような障害を二度と起こさないよう、通信事業者として責任ある態度が望まれます。

情報元:KDDI

 

【メール障害に関する記事 (時系列順)】

  1. KDDI通信設備で不具合発生 iPhone・iPadでEメールの送受信ができない障害、全国288万人に影響
  2. KDDIに1万件の苦情殺到、その後も障害継続し実質19時間… 総務省もau版iPhoneのメール障害は「重大事故」として追及の構え
  3. 速報:KDDI、再びメール障害発生 19時間の障害復旧後、わずか2時間で同じ症状が再発、現在も継続中
  4. 2日連続の障害、復旧発表後も発生か。抗議数は3万件に… 業界内では「障害多いイメージ付いたら挽回困難」の声も
  5. auメール障害、前代未聞の3日目に突入。原因はメンテナンス中の「人為的ミス」と販売数に見合わない脆弱な設備インフラか
  6. auの障害、ようやく完全復旧か。 未曾有の不祥事にユーザーへの補償はあるのか?
  7. auメール障害:今でも症状が改善されない、連絡先が消失したまま…という場合の対処方法。
  8. au版iPhoneやiPadの「連絡先が正常に表示されない」不具合に対してKDDIが対策方法を公表。気になる方はチェック!

【それ以前の最近の障害】

  1. 総務省、KDDIに行政指導。連日の通信障害への対応不足で
  2. 年末年始のau通信障害、総務省が「行政指導」の可能性 これで二年連続か

この記事にコメントする

comments powered by Disqus