Home Watson-AI Watson APIを活用しリアルタイムな議事録作成や多言語翻訳を実現する「AI Minutes for Enterprise」

Watson APIを活用しリアルタイムな議事録作成や多言語翻訳を実現する「AI Minutes for Enterprise」

by kusui

 

 

会議の音声をテキスト化し
多言語に翻訳する

「AI Minutes for Enterprise」は、Watson APIを活用した会議支援ソリューションである。もともとは、IBM東京基礎研究所による聴覚障害者に向けたアクセシビリティ研究から生まれた技術を活用して開発された。イグアスはそれに独自オプションとして「Meeting Activator」を開発し、2018年6月から「AI Minutes for Enterprise」の本格展開をスタートさせた。

「AI Minutes for Enterprise」の狙いは、会議や発言の内容をリアルタイムにテキストへ変換すること、そして議事進行中にそのテキストをリアルタイムに多言語へ翻訳することである(図表1)。たとえば英語で行われるミーティング中に、日本語の字幕が目の前の画面に刻々と表示されていくとイメージすればよい。複数の同時通訳者がいるような感覚で、多言語会議も開催できる。

 

 

 機能は、大きく3つに分けられる。(1)音声認識・翻訳機能、(2)音声認識エンジンのカスタマイズ機能、(3)データの管理機能、である。

 

音声認識・翻訳機能

 Watson APIである「Speech to Text」を使って、会議中の音声をテキストに変換する。さらに、同じくWatson APIの「Language Translator」を使って、多言語へリアルタイムに翻訳する。PCの画面には、発言時間、発言者名とともに、設定された言語で発言内容を表示する。

 音声認識の対象言語は英語(米国、英国)、スペイン語、フランス語、ポルトガル語、日本語、中国語、アラビア語の8カ国語。翻訳の対象言語は、上記にアラビア語2種(エジプト口語、正則アラビア語)、ドイツ語、イタリア語、韓国語を加えた合計13カ国語になる。  

 

音声認識エンジンのカスタマイズ機能

 業界・業種、あるいはその企業独自で使われる専門用語などを登録し、学習させることで、音声認識の精度を高めるカスタマイズ機能が搭載されている。

 人の手作業による辞書登録であれば、今までのシステムにも見られたが、AIを利用する最大のメリットは、学習機能を備えることだ。Watsonはディープラーニング機能により、過去データを参照し学習するので、手作業による登録や専門家による個別チューニングを行うことなく、音声認識の精度を向上させられる。カスタマイズは言語モデル(文書登録や辞書登録の学習)、音響モデル(音声データの学習)の2つがある。

 

データの管理機能

 変換したテキストデータの保存・編集・書き出しが可能である。テキストデータだけでなく、CSVファイルへも出力。会議進行中、あるいは会議後に、会話録のテキストを編集し、必要に応じて録音データを聞き返しながら修正できる。

 

Meeting Activator

 「AI Minutes for Enterprise」をエンジンとした議事録サマリーを作成支援する、イグアスが独自に開発中の製品である。「AI Minutes for Enterprise」からのアウトプットデータを、Watson APIである「Natural Language Understanding」(NLU)を使って構文解析し、サマリーの作成や会議の分析に活用する(図表2)

 

図表2 Meeting Activatorの画面

 

 

 たとえば主語・述語・目的語を自動抽出したり、多頻度で使用される単語を分析し、その結果から抽出テキストと元テキストを照らし合わせて会議内容を要約した議事録を作成したり、話題の遷移を確認できる。長時間にわたる議事内容をテキスト化すると膨大な量になるが、こうした機能を使えば、要点をまとめた的確な議事録の作成が可能だ。

 これらの機能はIBM Cloud上で利用するが、クライアント側には、PCに内蔵もしくは外付けのマイク、ブラウザ、それに音声認識・閲覧・編集を実行する小サイズのJavaプログラムをインストールする必要がある。クライアントソフトを搭載したPCでログインすれば、発言者の特定が可能。

 利用料金は5回線(5個のID)分で年額300万円から。これにはサーバー費用、Watson APIの利用料、年間保守費用が含まれる。

 

働き方改革の推進を掲げ
多様な活用領域へ

「AI Minutes for Enterprise」では、こうした機能を利用して、議事録作成が必要な重要会議、多国籍な参加者によるミーティングへの対応のみならず、コールセンターでの通話ログの作成、インタビューでの文字起こし、バリアフリーなコミュニケーションの支援、クリティカルな作業現場での証跡ログの管理など、多様な活用が期待されている。すでに多くの引き合いが寄せられているようだ。

「たとえばコールセンターの通話ログをテキスト化し、それをWatsonの学習用データとして活用することもできます。Watsonのトレーニングには、実際の問い合わせを利用するのが最適です。こうしたトレーニングデータを整備するために、AI Minutes for Enterpriseを用いて、過去の通話ログから短時間で準備するなどの利用方法が考えられます」と語るのは、イグアスの木村文部長(プラットフォーム製品事業部 IBMソフトウェア営業部)である。

 イグアスではすでに、「AI Minutes for Enterprise」の本格展開に向けてビジネスパートナー向けのコンソーシアムを結成している。パートナーソリューションへの組み込み、マイクなど音声機器との連携、アクセシビリティを考慮すべき環境への展開、会議録の作成が重視される官公庁への提案など、導入に向けたさまざまなアプローチが進んでいる。

「なかでも関心が高いのは、働き方改革を実現するソリューションとしての活用です。重要な全体会議から部署単位での小ミーティングまで、企業では毎日、多種多様な会議が開催されていますが、議事録作成に費やされる労力を解消するだけでも、働き方改革推進の大きな効果が得られるはずです」と、イグアスの青木寿人執行役員(プラットフォーム製品事業部長)は指摘する。

 変換されたテキストデータをさらに2次加工、3次加工することで、活用の可能性が大きく広がることになるだろう。

[IS magazine No.20(2018年7月)掲載]

related posts