IBM Spectrum Copy Data Managementによる複雑・多様化するコピー管理の解決策

 

 企業内のデータに関する操作をよく見ると、データの読み書き以外に、データを複製する作業が多いことに気づく。そもそもデータは、何のためにコピーされるのであろうか。

 たとえばデータにダメージがあった場合、そのデータを元の形に戻さねばならない。そのために行われるのがバックアップ・コピーである。また大事な、しかし頻繁には利用されないデータを廉価なストレージへ移動させることもある。これはアーカイブと呼ばれている。言葉では「移動」と書いたが、操作としてはコピーして削除するので、これもコピー作業の仲間であると言える。災害対策のための遠隔コピーも、大きな意味でデータ保護を目的としたバックアップ・コピーの仲間である。

 しかし今回取り上げるのは、データ保護を目的とした複製ではない。ある業務で利用しているデータを別の処理で使うための複製作業についてだ。開発環境での利用、テスト環境での利用、レポート作成やデータ解析での利用など、さまざまなシーンで複製されたデータは利用されている。

 

多様化・複雑化する
データの複製ニーズ

 たとえば、テスト環境での利用を見てみよう。適用業務プログラムを新しくしたり、OSやミドルウェア製品のバージョンアップや修正プログラムの適用前に、一度テストしておきたいと、誰もが考えるであろう。

 バッチ処理のテストの場合、毎日行うバッチ処理なら、数日前の複製されたデータがあれば、それを用いて実行テストを行い、出た結果がまったく同じかどうかを見ればよい。しかし、バッチ処理には月次バッチという1カ月に1回だけ実施されるものもある。このテストを行うには、前月末日のデータが必要だ。同じように四半期(3カ月)に1回のバッチ処理や1年に1回しか実施されない年次バッジ処理なども存在する。これだけでも、結構な数の複製されたデータが必要となる。

 ボリューム数が全部で1つだけなら何とかなるかもしれないが、企業におけるボリューム数は数十から数百に及ぶことも多いので、複製されたデータのコピーを管理することは結構厄介である。この確認テストを行う場合、同じ名前のボリュームの複製が5個も6個も必要になるからだ。

 これとは別の目的で、データを複製する場合もある。たとえばデータを分析する際、今得られた分析結果は去年の今日のデータでも同じことが言えるのかを検証しようとした場合、去年の今日のデータを保持している必要がある。同じように半年前、3年前のデータに当てはめたらどうなるかも、できることなら確認したい。

 こう考えていくと、元は同じデータ、同じボリューム名であった複製が、1つではなく10個も20個も存在し、その対象となるボリューム数は数百に及ぶという途方もない数のコピーを管理しなければならない。

 

ハードウェアの高速化が
データの複製化を加速

 これに加えて、近年では用途自体はあまり変わらないものの、コピーの作成頻度が以前に比べて非常に増えている。それは、アプリケーション開発に求められる開発スピードの向上、ハードウェアの高速化などに起因している。

 たとえばハードウェアの高速化の具体例として、ストレージ・メディアのフラッシュ化が挙げられる。これまでのHDD環境では何日も時間を要していた処理が、フラッシュでは数分で完了するほど性能が向上するケースがある。処理時間が数日、数時間かかるようなレベルでは、頻繁にデータのコピーを作成できないが、フラッシュ化により処理時間が数分になるなら、1日に何回も実行したくなる。

 また、ストレージ装置のコピー処理時間もフラッシュ化により向上している。コピーにそれほど時間を要さないのであれば、1日にデータのコピーを頻繁に行い、その時々のデータをいろいろな角度から解析し、データを加工できる。

 こうした複雑化するコピー管理を、人に代わって間違いなく管理するのが、今回紹介する「IBM Spectrum Copy Data Management(以下、CDM)」である(図表1)

 

 

コピーの作成・提供・更新・削除
CDMで自動化する

 データ・コピーの頻度が上がることで、さまざまな価値を生み出せるが、それを管理する困難さも増える。そこで、これらデータ・コピーの作成、提供、更新、削除を自動化するのが、CDMのコピー・データ管理機能である。

 CDMは、必要なときに必要な場所にデータのコピーを作成し、ポリシーに基づいて必要なコピーだけを完全に管理する。作成したコピーは、カタログと呼ばれるデータベースで管理され、無用なコピーを作成したり、使われていないコピーによって貴重なストレージが無駄に占有されるのを防ぐ。いつでも、どこでも、必要なときにコピーを作成し、利用者に提供できるので、昨今のビジネス形態に合った形のデータ活用をサポートする(図表2)

 

 

 

さまざまなストレージ装置の
コピー・サービス機能に対応

 データのコピー作成方法はいろいろあるが、主に利用されているのはストレージ装置のコピー・サービス機能だろう。SnapShotやFlashCopy、Remote Copyと言ったほうがわかりやすいかもしれない。

 ユーザーがコピー・サービス機能を利用する場合、まずスクリプトを作成し、そのなかでストレージ装置にコピー作成の命令を組み込む。それをスケジューラに登録し、定期的に実行させるのが一般的だ。ストレージ装置の種類が1つであれば、それほど困難ではない。

 しかし、異なる種類のストレージ装置を保有している場合は、その種類の数だけ区別してスクリプトを作成せねばならない。マルチベンダーのストレージ環境であれば、ベンダーによってコピー作成の作法(コマンド体系)が異なるため、なおさら困難さは増す。CDMはソフトウェアの力でそういった負担を軽減する。

 CDMは非常に多くのストレージをサポートする。もちろんIBMストレージだけでなく、他ベンダーのストレージにも対応している。また、アプリケーションやプラットフォームも幅広くサポートすることで、ほとんどの環境に適用できる(図表3)

 

 まずは、CDMのストレージ装置への対応を見ていこう。

 ストレージ装置の機能を使うデータ・コピーの作成は、スナップショットやクローンなど、ベンダーによってそれぞれ異なる形態で実装される。またストレージ間でのデータ複製も考慮に入れると、より多くの実装形態がある。それに各ベンダーはそれぞれ独自のインターフェース(APIやコマンド)を備えているので、マルチベンダー環境で多数のコピーを取得する場合、ユーザーは多くの困難に直面することになる。

 しかし、CDMを利用するとこの苦労は解消される。CDMには各ベンダーのストレージ装置に対応したAPI(操作コマンド)が備わっており、ローカル・コピーやリモート・コピーのコマンド生成も自動的に実行できる。ユーザーは対象のデータを選択し、ローカル・コピーを作成するのか、リモート・コピーを作成するのか、などを選択し実行するだけでよい。

 CDMはサポートするストレージ装置の作法を理解しているので、内部で各ベンダーのAPIを呼び出し、ストレージ装置と勝手にやり取りする。それによりローカル・コピーはもちろん、リモート・コピーの作成までをサポートする。

 

 

静止点状態を確保する
多様な“作法”にも対応

 コピー・データの作成で困難なのは、静止点状態の確保である。単純に1つのボリュームのみをコピーするのであれば考慮点はないのだが、業務に関わるデータが多数のボリュームにまたがって存在する場合、それら複数のボリュームを取得した状態が同じ時間であることが必要だ。これが静止点である。

 ボリューム数が多数になると、最初のデータをコピーし終えた時間と最後のデータをコピーし終えた時間に数秒〜数十分の時間差が出てしまう。これが静止点状態を確保する難しさの理由である。

 静止点状態でデータをコピーする意義は、それを利用するユーザーにとって意味のあるコピーを作成するためだ。データの静止点の確保も、アプリケーションやプラットフォームごとにそれぞれ作法がある。

 DBMSを例にすると、Oracle、SQL、Db2のそれぞれで静止点状態の確保には異なる作法が採用されている。VMなどのハイパーバイザーによっても作法は異なる。CDMはそれらに対しても各アプリケーションやプラットフォームへのAPIを備えるので、ユーザーは容易に設定し実行できる。CDMを使うことでユーザーは煩雑なコピーに関する諸問題に悩む必要がなくなり、迅速かつ容易にコピー・データの作成や管理が行える。

 

インストール・設定が容易
90日間の無償評価版も

 ここからは、CDMを稼働させるまでの準備について紹介しよう。

 CDMは仮想アプライアンスとして実装されるため、VMware環境が必要である。インストールは簡単で、vSphere Clientを起動し、OVAファイルを指定してOVFテンプレートをデプロイするだけである。OVFテンプレートのデプロイも、仮想マシン名や配置する場所、データストアを指定しネットワーク情報を入力するだけで完了する。仮想マシン起動後もタイムゾーンを設定する程度で、30分もあればインストールが完了する。

 インストール後、Webブラウザ経由でCDMサーバーにアクセスすると、ユーザーフレンドリーなホーム画面が現れる(図表4)。続けて行うのは個々の設定・登録作業で、大きく分けて3つある。

 

 

 最初は、コピー対象として使用するストレージ装置の選択である。CDMの世界ではこれを「プロバイダーの登録」という(図表5)。プロバイダーの登録ではストレージ装置へのアクセス先、アクセスするためのユーザーIDとパスワードを設定する。

 

 次はSLAポリシーの作成である(図表6)。SLAポリシーは、どういうデータを複製するのか、その複製をどのような頻度で実行し、どれくらいの期間保管するかなどを指定する。いわゆるデータ複製方法のテンプレートである。たとえばゴールド、シルバー、ブロンズなどのように、レベル分けしてテンプレートとして作成しておくと便利である。

 

 最後はジョブの作成である(図表7)。データを複製する対象を選択し、SLAポリシーを指定してスケジュールを設定することでジョブが作成される。あとはジョブを実行することで、レベルに合わせたデータ複製を簡単に実施できる。筆者も実際に稼働させてみたが、時間をかけずに容易に構成できた。CDMは無償評価版を90日間使用できる。実際に導入・操作すれば、その容易性を体感できるに違いない。

 

 CDMは、バックアップなどデータ保護を目的としたコピーの取得もできるが、主たる存在理由はデータ保護ではない。本体として存在する1次データに対する2次データのユースケース、たとえばDevOps、テスト環境の構築、各種レポートの作成やデータ分析などを同時並行的に実現するために生み出された。本番と同じデータを用い、さまざまなユーザーが段階的に新しい価値を創出する。CDMは、ほかのIBMストレージ・ポートフォリオと連携して運用することにより、さらに多様なビジネスの敏捷性をユーザーに提供するだろう。

・・・・・・・・

著者|奥田 章 氏

日本アイ・ビー・エム株式会社
システム製品事業部
ストレージ・テクニカル・セールス
シニアITスペシャリスト

1999年、日本IBM入社。ストレージ製品やバックアップ・システムを中心とした導入支援サービスを担当した後、2004年よりストレージ製品のプリセールスに従事している。西日本を拠点に全業種のユーザーを担当している。

[IS magazine No.20(2018年7月)掲載]

More Posts