Home IT研 「JGS研究2019」プロジェクト論文_地方創生に向けた観光施策の立案・実施におけるクラウド AI の活用可能性

「JGS研究2019」プロジェクト論文_地方創生に向けた観光施策の立案・実施におけるクラウド AI の活用可能性

by iida
[チーム名]クラウド AI の活用術(IA-005)

チームメンバー
(株)インテック 増田 浩士
NDIソリューションズ(株) 金澤 優太
カリツー(株) 高木 浩行
SOMPOシステムズ(株) 山崎 義則(サブリーダー)
第一生命情報システム(株) 中村 亮一
パーソルテクノロジースタッフ(株) 安田 遼平
みずほ情報総研(株) 大熊 正浩(リーダー)
三菱総研DCS(株) 林田 祐樹(サブリーダー)

チームアドバイザー
日本アイ・ビー・エム(株) 鈴木 博和

JGS(日本GUIDE/SHARE)はIBMユーザー研究会の活動です


論文概要 

 近年、日本は人口減少・超高齢化という問題に直面しており、政府は地方自治体と一体となって地方創生を推進し、なかでも観光振興は重要な政策の1つとされている。

 観光振興には観光動向の把握が不可欠であり、多くの場合、統計を活用した手法が取られるが、時間とコストを要するなど、いくつかの問題がある。

 そこで本稿ではクラウドAIを活用し、観光施策の立案・実施における観光動向の把握について、問題解決の手法を検討する。

 

観光施策に関する課題

 各地域の観光施策に統計が活用されているが、統計には、2つの問題がある。

 1つは統計をまとめるのに時間とコストがかかる問題、もう1つは統計では定性的かつ詳細な情報が見えなくなる問題である。

 これらの問題を解決するには、タイムリーかつ低コストにデータを分類・集計できる手法、あるいは定性的で解像度の高い情報を取得可能な手法が必要と考える。

 そのような手法を実現する手段として、SNSから得た旅行画像をクラウドAIにより解析することで有用な知見を得る手法を検討し、検証する。

 

画像解析を用いた
観光に関する傾向の把握 

 各都道府県の観光入込客統計(以下、「観光庁統計」)に示された観光地点ごとの入込客数から把握できる傾向を、クラウドAIを活用した画像解析から把握することが可能かどうかを検証する。

 東京都、福岡県、神奈川県の3つについて、観光地点分類に従った画像の分類を行った。

 画像がどの観光地点分類に該当するかの判定は、Amazon Rekognitionによる画像解析から得られた物体名と、観光地点分類の小分類との類似度を測定することで実施した。

 具体的な分類手順は、以下のとおりである。

(1)画像共有SNS「Flickr」から各都道府県の画像(平成29年撮影)を400枚取得
(2)Amazon Rekognitionにて画像解析し、解析結果から物体名を抽出
(3)Word2Vecを用い、1枚の写真の解析結果に含まれbる物体名ごとの特徴ベクトルの平均

 Word2Vec を用い、1 枚の写真の解析結果に含まれる物体名ごとの特徴ベクトルの平均(A)と、観光地点小分類(図表1)の単語ごとの特徴ベクトルの平均(B)を算出し、AとBのコサイン類似度を算出。最も類似度の高かった観光地点分類を当該画像の属する分類とする。

図表1 観光地点小分類

 

 分類結果をレーダーチャート化しのが、図表2である。

図表2 観光庁統計と分類比較結果

 

 東京都、福岡県、神奈川県のいずれでも、観光庁統計と画像分類結果との間で傾向が一致するのは、1つもしくは2つであった。

 これでは観光地としての傾向を精緻に把握可能とは言い難く、観光庁統計を代替できるものではない。一方で、定義となる単語群により画像を分類することには成功した。例として件数上位の「自然」および「都市型観光」の画像を図表3に示す。

 

図表3 神奈川県の「自然」および「都市型観光」の画像

 

画像集合のクラスタリングによる
観光資源の発掘 

 特定の都道府県の旅行画像を画像解析AIで解析し、その結果を用いて画像群をクラスタリングする。得られたグループの特徴を見出し、統計では把握できない埋もれた観光資源が発掘可能かを検証する。

 検証は鳥取県を対象に実施した。同県は平成27年に「鳥取県観光振興指針」を取りまとめ、県として魅力ある観光資源を整理している。そこで、ここに記載されていない観光資源の発掘を試みた。

 具体的なクラスタリング手順は、下記のとおりである。

(1)「Flickr」から鳥取県の画像を500枚取得
(2) Google Cloud Vision APIにて画像解析し、解析結果から物体名を抽出
(3) m個の物体名に対し、各物体名をベクトル要素W1~Wmとして定義する。このとき、i番目の画像Piに対し、物体名Wj(1 ≦ j ≦ m)の確信度cijとするとき、cijを用いて以下の特徴ベクトルを定義

 Pi=( ci1、ci2、・・・cim  )

(4) 上記により定義したベクトルのコサイン類似度により、任意の2つの画像Px、Py(1 ≦ x、y ≦ n)の類似度を算出

(5) すべての画像をノードとした無向グラフを作成。類似度の高い他のノードとエッジで結びグラフを作ることで、ノード(画像)をグループ化

 図表4は、画像をクラスタリングした結果である。

図表4 画像集合のクラスタリング効果

 

 観光振興指針には、下記の観光資源を積極的に発信していくと述べられている。

①鳥取砂丘、②山陰海岸ジオパーク、③大山、④かに・食、⑤まんが

 図表4に示したA~Hの各グループと、上記観光資源①~⑤を対応づけたのが図表5である。

図表5 各グループと観光資源との関係

 

 グループCおよびHは、観光振興指針には記載されていないものの、旅行者の興味を引く観光資源と考えられる。これは、観光振興指針では見出せなかった埋もれた観光資源の発掘といえる。

 

まとめ

 1つ目の検証では、観光庁統計から得られる各都道府県の傾向を、クラウドAIを活用した旅行画像の解析から把握可能かを検証した。画像解析から得られた傾向は、統計から把握した傾向と一致度が高いとは言い難く、統計の一部を代替するには至らなかった。しかし、画像解析と自然言語処理の組み合わせによる旅行画像の分類に成功した。

 2つ目の検証では鳥取県を対象に、クラウドAIを活用した旅行画像の解析から、埋もれた観光資源が発掘可能かを検証した。結果として、県の観光施策では見出せなかった観光資源を2つ発見できた。

 総評として、クラウドAIの活用が観光動向の把握に対し一定の有用性を持ち、観光施策立案、実施に役立つ可能性があることを確認できた。

・・・・・・・・・

研究活動を終えて

AIは思ったより手軽に使えた
大熊正浩(リーダー)

チームとしての目標

 「クラウドAIの活用術」というテーマでは過去に2回の取り組みがあるが、いずれも活用プロセスに焦点を当てた研究成果であるため、自分たちの研究ではクラウドAIを実際に使って何らかの課題を解決できることを示したいと考えた。

苦労した点

 論文テーマの絞り込みには苦労した。アドバイザーの支援を受けつつデザインシンキングの要素を取り込み、メンバー各自が検討したテーマ案を「有用性」「実現可能性」「新規性」の3つの評価軸で評価していった。

 いくつかの案が高く評価され、論文テーマの候補となったが、それらをもとに具体的な論文ストーリーを考えていくと、いずれも説得力に欠けるものとなってしまった。

 さらに議論を重ね、ようやく「クラウドAIを使った観光地の特性分析」に着地したが、当初計画よりも1カ月遅れのテーマ決定となり、進捗に響いた。

力を入れた点

 合宿とslackのコミュニケーションに力を入れた。

 我々のチームは合宿を4回実施した。いずれも朝10時に集合し、夜8時に解散。昼休みを除いておよそ9時間、メンバーがひざ詰めで議論し、その結果を成果物にまとめることを繰り返した。9時間×4回で36時間。これだけ時間をかけたことが、論文の品質を高めることができた最大の要因だった。

 また、slackを使ったオンラインの議論も活発だった。論文テーマを選定し、具体的な仮説検証の作業に入ってからは、slackへの投稿数が飛躍的に増え、議論が活性化した。リアルタイムのオンライン会議も2回実施した。

 検証プログラムの作成やデータ分析といった中間成果物の作成についても、アウトプットをタイムリーにslackにアップロードして、メンバーの意見を募ったことで、品質を大いに向上させられた。

想像以上にAIは身近な存在に 

 クラウドAIは思ったより手軽に使えた。大手4社(AWS、Microsoft、IBM、Google)のクラウドサービスを比較したが、いずれも思っていたより手軽に利用できた。APIを使って、一連の画像解析を自動化することもできたが、それを簡易なPythonスクリプトを書くことで実現できた。

 我々はクラウドAIの解析結果をさらに自然言語処理の手法を応用することで分析したが、その自然言語処理でも公開された学習済みモデルを利用でき、さらにサンプルコードも数多く公開されていたので、当初思っていたよりも容易に作業を進められた。

 想像以上に、AIが身近になっていることを実感した。

 

大熊 正浩氏(リーダー)
みずほ情報総研株式会社

 

使うことよりも活用することが大切 
林田佑樹(サブリーダー)

 本研究活動での最も印象的な気づきは、「AI利用の敷居の低さ」と「得たデータの活用の大切さ」である。

 チーム9名は当初、AIの経験も知識もなく、アドバイザーからAIの仕組みや概要を学ぶことからスタートした。

 それにも関わらず、クラウドAIを用いて画像認識する仕組みを実装する際には、4社のクラウドサービスに対して各メンバーがPythonスクリプトでAPIを実行し、データを取得・分析できた。クラウドAIはすでに膨大な画像データを学習しており、AI自体の開発が不要なので、経験のない我々も活用できる手軽さ、敷居の低さが印象的であった。

 その半面、取得した結果をどう活用するかのほうが、はるかに難しいと感じた。

 たとえば画像認識の分析結果は、画像データに映る対象の名称と確からしさが数値で表現される。分析結果の名称も、カテゴリレベルから固有名詞まで多様である。こういった不確定要素、かつ粒度の異なる結果に対し検証を繰り返すなかで、活用する結果の取捨選択と確率の閾値のチューニングをしながら最適解を導き出すことが最も重要であると実感した。

 我々エンジニアは、AIの仕組みなどの技術やAIを活用すること自体に目を向けがちである。しかしAIによって得られるデータや結果を、どの業務や分野に対してどのように活用するかが重要であり、それに向けた最適なチューニング、データクレンジングを行えることこそが真のAIエンジニアなのだと理解した。

論文後提出後の活動や追加事項

 本研究活動の取り組んだ内容やAIの活用方法を事例として、社内向けに本研究成果発表を実施した。

 また、本研究活動でAIの初歩的な部分に触れ知識を得たとき、AI技術の面白さを実感したので、社内メンバーにも興味を持ってもらうことを目的に、活動で得たAI技術(学習方法、ニューラルネットワーク等)の社内勉強会を実施した。

 業務面ではAIなどの新技術を取り入れたプロジェクトが増加すると予想しており、業務改善の提案活動の中でAIを活用したサービス・対応案を項目として取り入れている。

林田 祐樹氏(サブリーダー)
三菱総研DCS株式会社

related posts