永田 正樹 (株)アバンセシステム/静岡大学 教育研究支援員 |
[背景]災害時,安否確認システムの無停止稼働が重要
[問題]システム配置のロケーションおよびリソース調整が困難
[貢献]広域冗長化で可用性向上およびアクセス予測モデルで適切なリソース調整実現
[問題]システム配置のロケーションおよびリソース調整が困難
[貢献]広域冗長化で可用性向上およびアクセス予測モデルで適切なリソース調整実現
本研究は,災害時に市民の安否情報を収集および公開するWeb安否確認システムを対象としている.本国はこれまで多数の大規模災害が発生しており,被災者安否確認を目的とする安否確認システムの重要度が増している.2013年から内閣官房が進める「国土強靭化計画」の対象分野には情報伝達に関するものもあり,被災者安否確認を共有する安否確認システムは,災害時の迅速な情報伝達を提供する情報インフラ基盤として重要といえる.
安否確認システムの実装手法は,Webシステムでの実装が主流であり,昨今では多くのITベンダからサービス提供されている.安否確認システムに求められる課題として,ユーザ側立場からは災害時の確実な稼働が挙げられ,ベンダ側立場からは状況に適したシステムリソース調整が挙げられる.特に後者は災害時/平常時でシステムへのアクセス流量に差がある安否確認システムの特性上,状況に応じた必要リソースを都度調整できればコストダウンが可能となる.本研究は安否確認システムに対するこの2点の課題解決を目的とする.具体的な手法は,世界規模の複数拠点でシステムを構成する広域冗長化機構と,アクセス状況に適したサーバ数で運用するアクセス予測モデル機構である.
広域冗長化とは,システムを構成するサーバなどのリソースを地理的に離れた広域拠点に分散配置することで,ある拠点の障害によるシステム全体停止を回避する可用性向上のアプローチである.東日本大震災時の津波被害は,データセンター施設倒壊の可能性を示唆した.つまり,閉域地域内や国内だけでの冗長化では災害時の持続稼働を求められる安否確認システムの仕様としては不十分といえる.そこで,安否確認システムの稼働基盤を構成するサーバ群を世界規模で冗長化し,複数社のクラウドベンダを連携したインタークラウドアーキテクチャを用いた.また,データストアに分断耐性に強い分散データ管理システムCassandraを採用し,インタークラウドおよびCassandra基盤での基礎評価から安否確認システムの可用性向上を示した.
アクセス状況に応じたサーバ数での運用とは,発生した災害に対してどの程度のユーザがどの程度の時間間隔でアクセスするのかを予測することで,時間経過ごとの必要サーバ数をスケールアウト/インする機能である.アクセス予測は,過去の災害や訓練時における安否確認システムへのアクセスログ分布を分析し,アクセス分布傾向に適した確率密度関数に当てはめてモデル化することで行う.本研究では,安否確認システムへのアクセス分布特性は対数正規分布に類似した分布特性を持つことが調査の結果分かったため,アクセス予測モデルには対数正規分布を用いてモデル化した.対数正規分布モデルを用いたアクセス予測モデルにて,災害発生からの経過時間ごとの必要サーバ数の算出が可能となり,状況に適したサーバ数で運用することでサーバ費用のコストダウンを実現した.
本研究では,上記2つの機能を安否確認システムに実装することで,利用ユーザの側面だけでなく提供ベンダ側の課題も同時に解決し,災害時の持続稼働およびリソース伸縮性を持つ安否確認システムを実現した.
安否確認システムの実装手法は,Webシステムでの実装が主流であり,昨今では多くのITベンダからサービス提供されている.安否確認システムに求められる課題として,ユーザ側立場からは災害時の確実な稼働が挙げられ,ベンダ側立場からは状況に適したシステムリソース調整が挙げられる.特に後者は災害時/平常時でシステムへのアクセス流量に差がある安否確認システムの特性上,状況に応じた必要リソースを都度調整できればコストダウンが可能となる.本研究は安否確認システムに対するこの2点の課題解決を目的とする.具体的な手法は,世界規模の複数拠点でシステムを構成する広域冗長化機構と,アクセス状況に適したサーバ数で運用するアクセス予測モデル機構である.
広域冗長化とは,システムを構成するサーバなどのリソースを地理的に離れた広域拠点に分散配置することで,ある拠点の障害によるシステム全体停止を回避する可用性向上のアプローチである.東日本大震災時の津波被害は,データセンター施設倒壊の可能性を示唆した.つまり,閉域地域内や国内だけでの冗長化では災害時の持続稼働を求められる安否確認システムの仕様としては不十分といえる.そこで,安否確認システムの稼働基盤を構成するサーバ群を世界規模で冗長化し,複数社のクラウドベンダを連携したインタークラウドアーキテクチャを用いた.また,データストアに分断耐性に強い分散データ管理システムCassandraを採用し,インタークラウドおよびCassandra基盤での基礎評価から安否確認システムの可用性向上を示した.
アクセス状況に応じたサーバ数での運用とは,発生した災害に対してどの程度のユーザがどの程度の時間間隔でアクセスするのかを予測することで,時間経過ごとの必要サーバ数をスケールアウト/インする機能である.アクセス予測は,過去の災害や訓練時における安否確認システムへのアクセスログ分布を分析し,アクセス分布傾向に適した確率密度関数に当てはめてモデル化することで行う.本研究では,安否確認システムへのアクセス分布特性は対数正規分布に類似した分布特性を持つことが調査の結果分かったため,アクセス予測モデルには対数正規分布を用いてモデル化した.対数正規分布モデルを用いたアクセス予測モデルにて,災害発生からの経過時間ごとの必要サーバ数の算出が可能となり,状況に適したサーバ数で運用することでサーバ費用のコストダウンを実現した.
本研究では,上記2つの機能を安否確認システムに実装することで,利用ユーザの側面だけでなく提供ベンダ側の課題も同時に解決し,災害時の持続稼働およびリソース伸縮性を持つ安否確認システムを実現した.

(2017年5月30日受付)