3分でわかる!AWSにおける障害対策【後編】
~AWS Backup(バックアップ)とHAクラスタソフトウェア~

前編では、アマゾン ウェブ サービス(以降、AWSと略す)における4つの障害対策のうち、「Amazon CloudWatch(監視サービス)」と「Auto Recovery(HA機能)」をご紹介しました。
後編では、「AWS Backup(バックアップ)」と「HAクラスタソフトウェア」について解説します。前編をご覧になっていない方は、ぜひ「AWSにおける障害対策【前編】~Amazon CloudWatch(監視サービス)とAuto Recovery(HA機能)~」をご覧ください。

1. 障害対策の種類

AWSにおける障害対策には、次の4種類があります。このうち、前編では「Amazon CloudWatch(監視サービス)」と「Auto Recovery(HA機能)」について、後編では「AWS Backup(バックアップ)」と「HAクラスタソフトウェア」について解説します。

前編

  • Amazon CloudWatch(監視サービス)
  • Auto Recovery(HA機能)

後編【本記事】

  • AWS Backup(バックアップ)
  • HAクラスタソフトウェア

1.1 AWS Backup(バックアップ)

データを退避していれば、トラブルが発生しても過去のデータに巻き戻すことができ、結果、RPOを短くすることができます。フルマネージド型のAWS Backupでは、Amazon EBSスナップショット、Amazon RDSスナップショットなど、各サービスの既存バックアップ機能をサポートしており、例えば、1日1回深夜0時にバックアップを取って7日間保持するといったことができるので、バックアップの自動化や効率的なストレージの利用に役立ちます。
Amazon EBSを例に、AWS Backupでバックアップする手順は以下のとおりです。

  • AWS Backupでバックアッププランを作成
  • バックアップルールで、スケジュールやライフサイクル、Backup vaultを設定(1日1回のバックアップ、保持期限は7日など)
  • 作成したバックアッププランに、リソース(Amazon EBS)を割り当て

これで、指定した日時にAmazon EBSスナップショットが作成されてAmazon S3に保存されます。また、AWS Backupでは、作成したバックアップはBackup vaultに復旧ポイントという単位で保存されます。

AWS BackupでAmazon EBSをバックアップする
図1:AWS BackupでAmazon EBSをバックアップする

ここで、Amazon EBSスナップショットは増分バックアップのため、スナップショット作成にかかる時間とコストを抑えることができます。増分バックアップの概要は以下のとおりです。

  • ボリュームに10GBのデータがある(状態1)。最初のスナップショットAでは、10GBのデータ全体をコピー。
  • 10GBのうち4GBが変更(状態2)。スナップショットBでは、変更された4GBのみ保存。残り6GBはスナップショットAを参照。
  • 2GBがボリュームに追加(状態3)。スナップショットCでは、追加の2GBのみ保存。残り6GBと4GBは、スナップショットAとスナップショットBを参照。

3つのスナップショットに必要なストレージの合計は、16GBです。

Amazon EBSスナップショットのしくみ
図2:Amazon EBSスナップショットのしくみ

Amazon EBSのリストア手順の概要は以下のとおりです。

  • リストアするスナップショットを検討・判断
  • AWS Backupで復元するリソースを選択してバックアップを復元
  • ボリュームを置き換えるAmazon EC2インスタンスを選択
  • Amazon EC2インスタンスに接続されているボリュームをアンマウントしてデタッチ
  • 2.で復元したボリュームをAmazon EC2インスタンスにアタッチしてマウント

リストアは予め手順を策定しておかなければ、いざというときに復旧に時間がかかってしまいます。また、バックアップを保存するためにストレージをどれだけ使ったかによってコストが変わってくるため、注意が必要です。

1.2 HAクラスタソフトウェア

RTOとRPOをどちらも最小化したい場合、おすすめするのがHAクラスタソフトウェアです。HAクラスタソフトウェアのポイントは2つあります。

Point1:トータルな監視により、復旧時間を最小化

HAクラスタソフトウェアは、物理サーバーなどのインフラ基盤に加えて、ディスク、ゲストOS、ミドルウェアやアプリケーション、さらにAvailability Zone(アベイラビリティーゾーン)までトータルに監視しています。このため、Availability Zoneが丸ごとダウンしても異常を即座に検出、予備のAmazon EC2インスタンスにアプリケーションを引き継ぐことで復旧時間を最小化できるのです。HAクラスタソフトウェアなら、Availability Zoneがダウンしてもサービスを自動で継続できます。

HAクラスタソフトウェアによるトータルな監視
図3:HAクラスタソフトウェアによるトータルな監視

Point2:最新データを複製することでデータ喪失量を最小化

予備のAmazon EC2インスタンスで業務を再開するためには、トラブル直前のデータをもとにアプリケーションを動作させる必要があります。そこで、HAクラスタソフトウェアでは、通常運転時にアプリケーションが書き込んだデータをネットワーク経由で予備のAmazon EC2インスタンスのディスクに複製するしくみを備えています。このしくみにより、予備のAmazon EC2インスタンスは最新データをもとに業務を再開できる、つまりデータ喪失量を最小化できるのです。また、AWSのファイルストレージサービスに対応しているHAクラスタソフトウェアでは、Availability Zone間でのデータの複製をファイルストレージサービスに任せる構成にすることもできます。

HAクラスタソフトウェアによるデータ共有
図4:HAクラスタソフトウェアによるデータ共有

HAクラスタソフトウェアを使うためには、別途、ライセンス費用が必要ですが、上で解説したようなトータルな監視や最新データを複製するしくみを利用者側で考える必要はなく、HAクラスタソフトウェアに任せることができます。また、AWSが提唱している、複数のAvailability Zoneでアプリケーションを稼働させるというベストプラクティスにも則ることができます。
さらに、前編でご紹介したAmazon CloudWatchの復旧アクションの1つであるAmazon EC2 Auto Scalingでは、オートスケールに対応していないアプリケーションは復旧できません。そして、Auto Recoveryでは、Availability Zone障害時は自動で復旧できません。HAクラスタソフトウェアなら、この2つの課題が解決できるのです。

2. まとめ

前編と後編にわたって、AWSにおける4つの障害対策を解説しました。RTOを短くするための手法としてAmazon Cloud Watch(監視サービス)とAuto Recovery(HA機能)、RPOを短くするための手法としてAWS Backup(バックアップ)があります。そして、RTOとRPOをどちらも短くするための手法として、HAクラスタソフトウェアがあります。業種や業務のシステム特性によって、RTOやRPOは異なります。それぞれの手法には特徴があり、どれを使うかはコストとのバランスもあります。この中からどれか1つを選べばよいわけではなく、バックアップとHAクラスタソフトウェア、バックアップと監視サービス、監視サービスとHA機能、といったように、システム特性によって併用することがポイントです。

ユースケースに応じた障害対策
図5:ユースケースに応じた障害対策

解決への次のステップ

【無料オンラインデモ 申し込み受付中】人々の暮らしを豊かにするために!AWSでの業務継続をリアルタイムで体験

HAクラスタリング・ソフトウェアを使用しシステムの信頼性を高めたい方におすすめ。AWSで障害が発生してもシステムが止まらない様子をリアルタイムでご覧いただける無料オンラインデモの申し込み受付中。
街のビルからつながるクラウドサービスのイラスト

よろず相談会 / オンラインデモ

クラウドでのシステムトラブル回避に対する秘策とは?オンラインデモや無料のよろず相談会で皆様の疑問にお答えします。
ノートPCにはしごをかけたり大きな虫眼鏡でのぞく小人のイラスト

クラウドでも起こりうる大規模障害「止まる」を前提に障害対策をしていますか?

オンプレミスからクラウドへ移行で障害対策に疑問や不安を抱えていませんか?HAクラスタリング・ソフトウェア「PRIMECLUSTER」が解決します。
クラウド環境のまわりで困り顔の人のイラスト

備考
Amazon Web Services、AWS、Amazon EC2、Amazon EBS、Amazon CloudWatch、AWS Management Console、Amazon SNS、Amazon EC2 Auto Scalingは、Amazon.com, Inc. またはその関連会社の商標です。
記載されている会社名、システム名、製品名、サービス名などの固有名詞は一般に各社の登録商標または商標です。
また、本文および図表中に記載されている会社名、システム名、製品名、サービス名などには必ずしも「TM」、「®」を付記しておりません。

関連情報

ガラス張りのオフィスで仕事をする人々のグループ。

クラウド上のシステム運用にお悩みの方必見!

システムを安定稼働させるためには、システムの可用性、状態監視、業務運用管理が重要なポイントになりますが、従来のオンプレミスとクラウドとで設計や運用は異なるのでしょうか。重要なポイントは変わりませんが、クラウドの機能・特徴を意識した設計や運用が必要です。
特集「クラウド運用管理」ではクラウド運用の基本的な考え方を解説するとともに、システムを安定稼働させる方法についてわかりやすくご紹介します。