Home ストレージ IBMオブジェクト・ストレージの特徴とメリット ~ストレージ最前線

IBMオブジェクト・ストレージの特徴とメリット ~ストレージ最前線

by kusui

オブジェクト・ストレージが
生まれた背景

 昨今、多くの企業がIoTやAI分野で企業競争力を高める活動を実施し始めている。データは増え続けるという予想は以前からあるが、IoTやAIを使い始めると、想像以上にデータは増える。2020年のデバイス数、たとえばPCやスマートフォンは70億台と予測される。一方で電気メーターや自動車、冷蔵庫などと適用分野が幅広いIoTデバイスは、それを超える300億台になる見込みだ。データ総容量に換算すると、40ゼタバイトにまで膨れ上がると予想されている。IoTやAI分野で正しく、賢く、データを分析するには、これらの膨大なデータを正しく、確実に保管する必要がある。

 企業が競合他社より有利な付加価値サービスを提供するには、開発のスピードが大事だ。開発者はこれまで以上に開発のスピードを上げなくてはならない。このためにはトライ&エラーを繰り返せるアジャイル開発に向いたインフラが必要になってくる。

 グローバル化の進展により、開発者が同一事業所内や国内にいるとは限らない。この場合、海外の複数の拠点からでもアクセスしやすいよう、WANを超えてローカルでの使い勝手と同様に使えるインフラがあると大変便利だ。

 従来型のストレージ・アーキテクチャでこれらを実施しようとすると、容量のスケール・アウト性や、離れたロケーションからのアクセス、管理面での課題点が数多く発生する。これらを解決するための手段の1つとして、新しいストレージのあり方であるオブジェクト・ストレージが誕生した。

 

ストレージの種類と
構造上の違い

 ストレージは大きく分けて3種類ある。

 1つ目は、ブロックと呼ばれる単位にSCSIコマンドなどを使ってアクセスし、SCSI/FC/iSCSI/FCoEなどの接続方式で直接サーバーに接続して使うタイプのストレージで、パソコンに内蔵されたHDDやSSDがこのタイプだ。2つ目のファイル・ストレージは、ファイル単位でアクセスを行い、主にネットワーク経由でCIFSやNFSといった接続で使うタイプのストレージで、ファイル・サーバーやNAS装置がこれに該当する。そして最後に紹介するのがオブジェクト・ストレージである。オブジェクト・ストレージはファイル・システムをもたず、ネットワーク経由で接続し、インターネットのWebサーバーのようにPUT/GET/DELETEなどのREST API命令で使うタイプである(図表1)。

 

 それぞれのストレージをユーザーが使う際のイメージとしては、ブロック・ストレージでは“/dev/sdb”や“Dドライブ”として使い、ファイル・ストレージの場合は“\\サーバーIPアドレス\ディレクトリ名\ファイル名”でマウントして使う。オブジェクト・ストレージの場合は、“http://アカウント名@IPアドレス/バケット名/オブジェクトID”を指定して使う。

 オブジェクト・ストレージの最大の特徴は、ファイル・システムをもたない点である。ディレクトリの階層構造も存在しない。通常のストレージはマウントして利用するが、OSなどにマウントする必要もない。Webサーバー同様、直接データ(ストレージ)にアクセスできる。これにより、たとえユーザーが外出していたとしてもHTTPやHTTPSでアクセスできるモバイル端末さえあれば、モバイル端末からオブジェクト・ストレージへ直接アクセスし、データを読み書きできる環境を手に入れられる。

 

IBM Cloud Object
Storageの3つの特徴

 オブジェクト・ストレージは、すでに多種多様な製品・サービスがベンダーから提供されている。パブリック・クラウド上のサービスやオンプレミス用のソフトウェア製品、アプライアンスなどいろいろある。ここではIBMのオブジェクト・ストレージ製品である「IBM Cloud Object Storage」(以下、IBM COS)に焦点をあて、その特徴や従来のストレージと比較した利用上のメリットを紹介する。

 

◆ アプリケーション・プログラムとの親和性のよさ

 従来ユーザーがデータを保管し読み書きするには、システム管理者に対してどれくらいのストレージ容量(GB)が必要かをリクエストし、必要な容量を割り当ててもらわなければならなかった。サーバー管理者やストレージ管理者は、要求された容量をどのストレージ装置のどこのRAIDから工面してくるかを探し出さなければならなかった。その後、サーバーへデバイスのデータをマウントし、ファイル・システムとしてフォーマットしてから、ユーザーはデータ領域を使えるという流れになる。

 ファイル・ストレージ(NAS)の場合もほぼ同じだが、ストレージ管理者のほかにネットワーク管理者が必要になることもある。システム管理者(サーバー/ネットワーク/ストレージ)が不在の場合、必要なときに必要なストレージ容量を手に入れられないこともありうる。

 一方、オブジェクト・ストレージは、ファイル・システムをもたないので、アプリケーション開発者はプログラム・コードのなかで直接オブジェクト・ストレージを指定し、REST APIでアクセスできる。さらに、その開発にどれくらいの容量が必要になるかを事前に予約する必要がない。使えば使った分だけ容量が自動で拡張される。つまり、アプリケーション開発者にとっては開発のスピードが上がり、トライ&エラーを繰り返しやすい環境が手に入るのだ。さらに、システム管理者にとってはストレージ作業が減り、マウントなどの運用負担を大幅に減らすことができる(図表2)。

 

 

◆ 限りない拡張性

 次の大きな特徴として、スケーラビリティが挙げられる。オブジェクト・ストレージは、IDとデータというフラットな構造で管理されている。IDさえわかれば、どこに格納されているのかを意識しなくてよい。

 たとえば、ホテルのサービス・カウンターで手荷物を預かってもらうことを考えてみてほしい。手荷物を預けると係員は引換券を渡してくれる。引換券には引き換え番号が書かれているが、荷物はどこに置かれている、というような位置情報は書かれていない。私たちは自分の手荷物がホテル内のどこに預けられているかを意識する必要はない。引換券さえあれば必要なときにすぐに取り出せるからだ。これが引き換え番号ではなく、荷物の保管先の棚番号などが書かれている方式だとすると、ホテル側の都合や手違いで荷物が別の場所に移動されてしまったら、もう荷物がどこへ行ったかわからないということになってしまう。

 話をストレージに戻す。データ容量が増えてくると、データをどのストレージに保管したかを管理することは、運用上、大きな負担となる。もしストレージ自体に限りない拡張性があれば、別のストレージに移動させる必要がなくなるので、この課題は解決できる。またデータがストレージ内のどこに保管されているかというID(引換券番号)さえあれば読み書きができるので、データ保管の場所を気にしなくてよい。この点がオブジェクト・ストレージのよさの1つである(図表3)。

 

 パブリック・クラウド上で提供されるオブジェクト・ストレージ・サービスとしてはAmazon S3が有名だ。しかしS3では1ファイル5TB、1回のアップロードは5GBまでという制約がある。これに対してIBM COSはファイル数やアップロードに制限はない。

◆ バックアップを不要にする高可用性

 IBMのオブジェクト・ストレージはErasure Coding(イレイジャー・コーディング)方式を使ってデータを分散配置している。これはたとえば8個のデータがあった場合、8個のデータとして記録するのではなく、あえて付加的な計算を行い、12個のデータとして再生成し記録するやり方だ。12個になったデータは、単に8個のデータを足して12で割ったのではなく、データを復元するための追加情報を付加している。

 仮に8個のデータを読みたいと思った場合、12個中の8個が読めればデータを復元できる。つまり12個中4個までは障害などで読めなくなったとしても、データは問題なく復元される。この例で、元の8個を「Threshold(k):しきい値」、後から大きくなった12個を「Width:幅(n)」と呼ぶ。

 この例で、必要となる保管容量は12÷8=1.5倍となる。つまり元のデータより1.5倍の容量があれば、高可用性を維持した保管ができるということになる。

 IBMのオブジェクト・ストレージはこれだけにとどまらず、Slicestor(スライス・ストアー)と呼ばれるデータ保管用のノードを離れた地域に分散して配置できる。局所的な災害が発生しても離れた地域に分散配置された各ノードが生き残っていれば、データを問題なく読み出すことが可能だ。つまりあらためてバックアップや災害対策のために別の仕組みを構築する必要がないのだ。

 従来型のストレージ装置で利用されているRAID方式に比べても、これは非常に容量効率のよい方式であると言える。たとえばRAID方式でデータを保護する場合、RAID 6であれば9本のデータ用HDD、もしくはSSDに対して2本のパリティ分とスペア1本分が必要となるため、合計12本分のドライブが必要となる。最低限の1世代バックアップを考えた場合でも、同容量で同数の12ドライブを用意することになるので、合計で24本、さらに災害対策を考えた場合、遠隔地にも同様に12ドライブ分必要となるため、都合36本のドライブが必要となる。これは元のドライブ数から見ると3倍のドライブ数(容量)となっている(図表4)。全体の容量が多くなればなるほど、そのインパクトは大きい(図表5)。

 

 

 Erasure Codingで分散された各ノードは地理的に離れた場所に配置可能なので、災害対策のためにあえて遠隔コピーの設定をする必要はない。サイト障害に耐え得る構成なのである。仮に1サイトで障害があった際は、別のサイトで立ち上げるためのオペレーションも不要であり、ユーザーからは透過的に切り替えが可能だ(図表6)。

 

 

IBMオブジェクト・ストレージの便利な使い方

 オブジェクト・ストレージはこれまでのストレージとは接続方式が違うので、どうやって使うのかというイメージをつかみにくいかもしれない。ここではIBM COSを使って、データを読み書きする方法をいくつか紹介したい。

◆ Curlコマンドベースでアクセス

 オンプレミス環境でIBM COSを用意した場合は、システム管理者は事前にVault (Amazon S3ではバケットに相当)と呼ばれる大枠の入れ物を作り、ユーザーにアクセス権をつけておく。ユーザーはVaultに対してCurlコマンドでオブジェクトをアップロード/ダウンロードすることができる。図表7-1図表7-2に一連の操作画面を示す。オブジェクト・ストレージへCurlコマンドでデータをアップロードし、HTTPアクセスしてWebブラウザで読み出し可能なことを確認できる。

 

◆ CloudBerryツールでアクセス

 現状ではWindows Explorerから直接オブジェクト・ストレージにアクセスすることはできない。その代わり各種ツールを用いて似たようなことを実現するのは可能だ。

 たとえば、CloudBerry Explorer for Amazon S3というツールがCloudBerry Lab(*1)から無償で提供されている。IBM COSではS3と互換性のあるアクセス方式でデータを読み書きさせる方法を選択できる。これを使ってS3アクセスを選択することでWindow Explorerと同じようなイメージでの使用が可能になる。

・・・・・・・・

(*1)CloudBerry。http://bit.ly/is16_cos001

・・・・・・・・

 図表8に示すように、Access key とSecret keyを入力し、ユーザーアカウントを登録する。接続、認証が成功すると左に自分のローカルストレージ情報、右にオブジェクト・ストレージのVault(バケット)が表示される。ファイルの作成・削除・表示だけでなく、ローカルストレージからオブジェクト・ストレージのコピーもドラッグ&ドロップの操作だけで実施できる。

 

◆ TNTdriveツールでアクセス

 上記の方法以外でもTNTdrive(*2)というツールを使うと、ネットワークドライブとしてオブジェクト・ストレージをマウントして使うこともできる。これもS3互換としてのアクセス例である。こちらは評価版用として30日間無償版が用意されているので試してみるとよい(図表9)。

・・・・・・・・

(*2)TNTdrive。http://bit.ly/is16_cos002

・・・・・・・・

 

 

WatsonとIBM COSの先進的な活用例

 先進的な活用例として、雹ひょうなどの自然災害で受けた屋根のダメージを査定するのに開発された、保険業界の損害金額把握のためのシステムを紹介する。

 災害が発生し屋根にダメージがありそうな場合、今までは屋根がどういう状態なのかを保険検査員が屋根に昇って確認し、証拠となる写真を取っておかねばならなかった。これを最近話題の民間無人機(ドローン)を使って上空から屋根を撮影し、画像をIBM COSへ保存する。保管された画像データはWatson Visual Recognition Serviceによって分析され、被害ポイントの特定と被害対象の屋根の大きさから修復に必要な費用が算出される。この一連のプロセスがシステム化されたことによって、住宅保険請求処理プロセスを効率化することができた。システム導入以前は検査員を派遣し手作業で行わなければならなかった作業が、安全にかつ迅速に対応できるようになった(図表10)。

 

IBM COSの提供方法

 IBM COSは、オンプレミス環境とパブリック・クラウド環境の両方で提供されている。前者では、ソフトウェア組み込みのアプライアンスとして使う方法と、認証されたサーバーにインストール可能なソフトウェア(Software Defined Storage)として使う方法とが選択できる。後者の場合は5つのメニューがあり、占有型のDedicatedと共有型のStandard/Vault/Cold/Flexのメニューから選べる。

 パブリック・クラウドの場合、月額GB単価で提供されているので、数GBの小さい容量からスタートできる。またユニークな特徴として、オンプレミス環境とパブリック・クラウド環境を組み合わせたハイブリッド・クラウドも選べる点が挙げられる。ユーザーのデータセンターが国内に1カ所しかない場合、パブリック・クラウドのサービスと組み合わせることで海外拠点を利用先として選べるため、拠点障害にも耐え得るシステムを構築することもできる(図表11)。

 

今後の展望・まとめ

 IBM COSは、増え続ける膨大なデータを保管するのに適したストレージである。デジタル・カメラの4K/8K対応など高解像度化によるデータの増大、ゲノム・データの利用の高まり、AIやIoT分野での取り組みが強化されるなか、オブジェクト・ストレージの利用が急速に伸びている。

 オンライン・ファイル・サービスとして提供されているBox Zonesには、オブジェクト・ストレージ層にIBM COSが使われている。北米にのみデータセンターをもつBox社は、ヨーロッパ・アジア地域での展開のためにIBMとのパートナーシップを強化した。

 また、オンライン・フォト・サービスを提供しているShutterfly社では、200PB以上、500億以上の映像、画像データをIBM COSに保管している。ほかにも、自転車競技のチーム・パシュートの米国女子チームでは、IBM COSとWatson IoT Platform Serviceやスマートフォン・アプリを活用してリアルタイムにトレーニング分析を実施し、リオ五輪のメダル獲得に必要な4.5%の成績改善に成功したという。IBM COSは、さまざまな用途で利用が進んでいる。

[IS magazine No.16(2017年7月)掲載]

・・・・・・・・

著者|竹田 千恵 氏

日本アイ・ビー・エム株式会社
システムズ・ハードウェア事業本部
ソリューション事業部
シニアITスペシャリスト

2003年、日本IBM入社。これまでストレージSEとして製造・流通・通信・金融など幅広い業界のITインフラ基盤提案に携わり、主にストレージ・テクニカル・セールスとして提案活動に従事してきた。現在、SDIテクニカルセールスとして、IBM Cloud Object Storageを中心に普及活動に努めるかたわら、IBM女性技術者コミュニティ「COSMOS」のコアメンバーとしても活動中。

related posts