グラフデータベースは、ほかに代わるものがない|人気記事の著者に聞く②

 

 

日本IBMシステムズ・エンジニアリングの岡本茂久氏に執筆いただいたグラフデータベースの解説記事が、この2年半あまり、常にアクセス・ランキングのトップ5にランクされ、非常に多くの方々に読まれている。岡本氏にグラフデータベースとの関わりと現在の状況についてうかがった。

記事はこちら→「グラフデータベースとは何か ~ネットワーク状のデータ構造から瞬時に情報を検索するDBを解説」

 

 

岡本 茂久 氏 

日本アイ・ビー・エム システムズ・エンジニアリング株式会社
DXソリューション
Innovation Lab.
シニアITスペシャリスト

 

 

 

ほかに代わるものがない
ユニークな存在

 

-- 岡本さんは、グラフデータベースにどのように出会ったのですか。

岡本 記事(2018年9月)を執筆する1年ほど前に、あるプロジェクトでグラフデータベースを検討しているので調べてほしいというオファーが来たのが最初です。そのプロジェクトでも適用を試行し、後の別のプロジェクトで構築した、製品情報をグラフデータベースで構成して関連製品を提案するというシステムは、今も実際に運用されています。

-- グラフデータベースの最近は、どのような状況なのですか。

岡本 少し前はガートナーのハイプサイクルに登場したりして注目を集めましたが、現在は一時ほどの盛り上がりはないものの、継続して関心を持たれていると思います。グラフデータベースは、ほかに代わるものがない、ユニークな存在です。

-- 今はどのような関わり方ですか。

岡本 最近は「Neo4jユーザーグループ」の勉強会に参加したり、大学で教えたりしています。Neo4jの勉強会は、最新情報を入手できるのと、たまにNeo4j社の人が来てくれて生で話を聞けるのが刺激です。勉強会には20名ほどの人がコンスタントに集まっています。初心者向けのハンズオンもあるので、関心のある方はぜひ覗いてみるとよいと思います。

Neo4jユーザーグループ
Neo4j

-- Neo4j勉強会の最近の話題は何ですか。

岡本 新バージョンのほかは、可視化ツールですね。Neo4jにも管理者用の描画ツールがあるにはあるのですが、ユーザー向けに画面を工夫したい、もっと表現力豊かに表示したいというニーズがあるので、Neo4jと連携する可視化ツールに関心が集まっています。グラフ上のあるポイントに触れるとアクションが起きるといった、インタラクションなUIへの関心です。ツールとしては、「yWorks」という豊富なレイアウトがあるものや、オープンソースの「Cytoscape.js」などが話題になっています。

yWorks
Cytoscape.js

-- Neo4jは、IBM Cloudでも提供されていますね。

岡本 Neo4j社はIBMのパートナーなので、IBM Cloud上でも使えます。IBM Cloud上のサービスとしては、以前はApache Titanベースの「IBM Graph」があり、今はその後継の「JanusGraph」(ベータ版)で提供されていますが、個人的には、IBM Cloud上ではNeo4jのほうが使い勝手がよいのではと思っています。

 

AIとの連携に注目
ナレッジグラフとディープラーニングへの適用

 

-- グラフデータベースは今後、どのように展開していくと見ていますか。

岡本 ソーシャル分析の分野では、グラフ理論に基づくアルゴリズムがいくつか出ているので、今後いろいろな形で使われていくと思います。たとえば、「重要人物の友達は重要人物」という考え方に基づくアルゴリズムがあります。これを使うと、ネットワーク・コミュニティの中の重要人物や話題のテーマを分析できます。最近では新型コロナの感染の分布にも適用され、感染の恐れが高いのはどこかといったことにも使われています。グラフデータベースによる可視化のインパクトは大きく、かつ分かりやすいので、いろいろな分野で使われていくと思います。

-- その中で、注目している動きはありますか。

岡本 AIとの連携です。グラフデータベースとAIの連携では、2つの方向があるのではないかと思っています。

1つは、「ナレッジグラフ」と呼ばれるAIで分析した結果のグラフ化です。自然言語処理では膨大なデータを対象にテキストマイニングして重要な単語を抽出したり、語と語の関係性を分析したりしますが、その結果データの格納や表示にグラフデータベースを適用する使い方で活用が進んでいます。

もう1つは、ディープラーニングへのグラフ理論の適用です。画像系の畳み込みニューラル・ネットワークでは、データを小さなピクセルに分けて畳み込みを行い特徴を抽出します(CNN:Convolutional Neural Network)が、それだけだと「犬が写っている写真」というような類似画像の検出はできるものの、犬小屋やドッグフードなどの「関連する画像」の検索は困難です。

そこにグラフデータベースの、隣り合うデータの特徴を見つけて圧縮するという機能を合わせることによってグラフデータとしての畳み込みができ(GNN:Graph Neural Network または GCN:Graph Convolutional Network)、類似画像だけでなく関連データの検出も可能になります。すると元の画像が不明な時に、断片の画像を集めて元の画像を推定するといったことも可能になるわけです。畳み込みニューラル・ネットワークの応用範囲を大きく広げる使い方だろうと考えています。

 

[i Magazine・IS magazine]

 


 

◎人気記事の著者に聞く

①小栗 直樹 氏|Infrastructure as Codeの留意点とメリット ~サーバー更改プロジェクトへの適用で得られた知見・実感

②岡本 茂久 氏|グラフデータベースとは何か ~ネットワーク状のデータ構造から瞬時に情報を検索するDBを解説