二次対応
二次対応は、障害の再発防止を目的に行います。
監視および一次対応でサービスを復旧させることが可能です。しかし、同様の問題が発生する可能性があります。問題の原因を調査し、再発防止策を打つことで、より安定した環境へ改善していくことが可能です。
対応によっては、無償で出来る設定変更、費用が発生するサーバスペックアップ、サービス停止を伴うものなどがあります。それらのメリットデメリットを踏まえ、お客様と相談しながら対応内容を決めていきます。
二次対応例
アクセス集中でサービスが停止してしまった
サーバ上に保存されているログや統計情報を確認し、原因調査を行います。判明した原因に応じて次のような対策を行います。
データべースが原因の場合
データベースパラメータのチューニングや、サーバスペックをアップさせるスケールアップを行います。
状況によっては、データベースサーバをマスタ・スレーブ構成へ変更し、参照系クエリの負荷分散をはかります。参照クエリの負荷分散を行うためには、アプリケーション側の改修も必要となるため、お客様と状況を確認しつつ進めていきます。
ウェブサーバが原因の場合
パラメータのチューニングや、サーバのスケールアップを行います。
ウェブサーバはサーバ台数を増やすスケールアウトが効果的なことが多いため、ロードバランサを導入し、複数台構成へ変更することもあります。
ロードバランサの帯域が原因の場合
ロードバランサの帯域を向上させます。
極力低コストで運用したい場合は、自動化の仕組みを導入し、ロードバランサの帯域設定を動的に変更させます。
脆弱性をついた攻撃を受けてしまった
なんらかのバグに起因する場合
バグフィックスバージョンの提供状況を確認し、バグフィックスを適用させます。
バグフィックスの適用が難しい場合は、仮想パッチやWAFなどのセキュリティソリューションの導入を検討します。