週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

auがiPhone、iPadメール障害を説明「新サーバー切り替えが原因」

2013年04月25日 12時42分更新

 KDDI株式会社は、4月16日~19日に発生したau携帯電話サービスでのメール(@ezweb.ne.jp)送受信障害についての原因を発表。トラブルの概要とその対策状況について説明した。

●au携帯電話 Eメール送受信サービス通信障害の概要

<事象1>
発生時間:2013年4月16日0時35分~1時41分(1時間6分)
影響事象:サービスが利用不可
影響人数:最大200人
影響エリア:全国

<事象2>
発生時間:2013年4月16日8時8分~13時29分(5時間21分)
影響事象:サービスが利用不可
影響人数:最大288万人
影響エリア:全国

<事象3>
発生時間:2013年4月16日13時29分~4月19日2時54分(2日13時間25分)
影響事象:サービスが利用しづらい状況、連絡先・カレンダー・リマインダーが表示できない状況あり
影響人数:最大127万人
影響エリア:全国


 同社によると、通信トラブルの事象は3回発生しており、その全ての原因はEメールリアル送受信システムのバージョンアップ作業時に発生したものだという。

■事象1の原因
 バージョンアップは新機能提供のために実施し、サービスを中断しないよう新サーバーを事前に構成して準備し、接続を変えるだけの作業を計画。しかし、認証サーバーでのユーザー情報不一致が発生。サービスが利用できない状況となった
 この原因は、手順書ミスによるコマンドの誤りによるもので、現行サーバーを新サーバーとして接続。その結果、ユーザー情報が一部欠損となったという。
 その後、新サーバーへの切り替えを続行し、認証エラーを解消させた。

KDDI 事象1


■事象2の原因
 最初のトラブルを解決し、新サーバーへの切り替えを続行。途中でタイムアウトエラーが発生したため現行サーバーへの切り戻しを決断。その作業中に新サーバー側でハードウェア障害が発生しダウン。残っていた片系も過負荷となりEメール送受信ができない状況になった。
 現行ユーザーサーバーへの接続変更と、メールBOXサーバーの再起動を実施し、トラブルを解消した。

KDDI 事象2


■事象3の原因
 事象2でのメールBOXサーバーの再起動で対応が完了したが、再起動手順中のメールが中継サーバーに滞留、62台中24台のサーバーで高負荷状態が続いたため利用しづらい状況になった。
 端末からメールBOXサーバーのサーバー単位の流量調整で高負荷状態を解消させた。

KDDI 事象3


 同社は、今回の障害トラブル発生の原因について「事前検証試験不足」「二重障害発生時の対策準備不足」「サーバー再起動手順の考慮不足」とし、対策を発表。5月末までに実施完了するとした。また、8月末までにサーバー/ストレージの増強対策、負荷対策も行なうという。

●関連サイト
KDDI

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう