一見すると結び付きそうもない2つの言葉であるが、近年、進化を続けるAIチャットボットが、さまざまな場面で利用されることが増えてきた。本ブログでも、新たなAIチャットボットの事例を紹介してきたが、今回は、リーガルテック、なかでもフォレンジックなどの現場でのAIチャットボットの応用事例を紹介したい。
なお、本稿は、2016年10月21日に開催された、第4回リーガルテック展におけるAOSリーガルテック代表取締役社長・佐々木隆仁氏の講演をベースに再構成したものである。

フォレンジックとは何か?

さて、いきなりリーガルテックやフォレンジックといわれても、何のことかよくわからないといった方も少なくないであろう。まず、リーガルテックであるが、法律に関わるITテクノロジの総称ともいえる。一般的な企業では、総務・労務・経理・法務・知財といった分野がすべて関連するといってもいいだろう。一方、司法や操作機関なども法律とは無縁ではない。こういった幅広い領域に対して、関わる技術や手法がリーガルテックである。これまでも、PCなどの利用が浸透してきたが、もう少し高いレベルから、俯瞰したものともいえる。
フォレンジックは、リーガルテックの1つである。警察などの捜査過程、司法による裁判審理などで、デジタルデバイスに残された電子的情報を収集・分析し、法的な証拠を提供することが目的となる。語源の「forensics」には、科学捜査や鑑識といった意味がある。その由来から、デジタル鑑識などとも訳されることもある。
具体的に見ていくと、たとえば、PCなどでは、HDD内のデータなどが対象になる。

・Webサイトの閲覧履歴
・作成されたファイルやユーザーデータ
・通信履歴
・メールとメール履歴
・アドレス帳

つまり、そのPCを使用したユーザーが行ったすべての行動を調べることといってもいいだろう。これらは、デジタルデータであるがゆえに、一般的な裁判証拠と異なる性格を持つ。それは、データの廃棄や改ざんがきわめて容易である点である。犯罪者や容疑者が、事件の発覚を恐れ、意図的に削除をしたり、ハードウェアの破壊などを行うこともある。そこで、フォレンジックでは、破壊・消去された記憶媒体からの証拠データの復元、データがねつ造されたことの確認といった作業までが含まれる。
さらに、最近では、SNSなどのコミュニケーションツールの普及、スマートフォンなどの携帯端末の普及により、事件・犯罪ではフォレンジックはほぼ確実に行われる作業ともいえる。

チャットボットにAI機能が追加

近年、チャットを使ったメッセージ交換は多くのユーザーが利用している。ここまで普及した理由であるが、以下のような理由が考えられる。

●メールにはない情報の即時性
●情報共有が速い
●負担の少ないインターフェイス
●スタンプを使ったコミュニケーション

こうして普及したチャットであるが、ここに新たにボットによる自動応答が加わった。これにより、現状の多くのアプリが、チャットボットに置き換わる可能性を持っている。さらに、ビジネスにおいては、新たな顧客やターゲットの掘り起こしなども期待されている。
上述のチャットボットによる自動応対に、AI機能が加わったことで、さらに進化が期待できる。現在もいくつかの試みがあるが、学習機能によって、より効率的に望む情報の取得やニーズにマッチした対応が可能になると予想される。

AIリーガルボットでフォレンジック調査

AIリーガルポットは、AOSモバイルのInCircle上で動作するAIチャットボットである。実際にどのようなことができるかを見ていきたい。まず。今回の設定として、以下のような状況を想定した。

●社員の1人(山田太郎さん)の残業時間が多い。しかし、それに見合った成果が得られていない
●業務中に、私的な行動をしているのであれば、その証拠を押さえたい

一般的な会社であれば、就業規則などを定め、その内容に従って勤務する。しかし、深夜残業などでは、監視の目も届きにくい。そこで行われた不正行為に対し、明確な証拠を押さえることで、適切な処分や訴訟を維持できる。
まずは、不正調査に関わるメンバーの選定を行う。具体的には、InCircleのトークルームを作成し、このメンバーとして、調査に関わる関係者などを登録する。この例ではデモなので、AIチャットボットのAIリーガルボットとデモを行った佐々木氏の2名だけである。実際には、適切にメンバー編集を行う

f01

図1 トークルームのメンバー編集

まず、ここで「山田太郎さん」の調査データに何があるかを表示させる。チャットなので「山田太郎さんの調査データは、何がありますか?」と、まるで人に尋ねるようにトークする。

f02

図2 調査データの確認

すると、AIリーガルボットは、保存された調査データから「山田太郎さん」に関する調査データの概要を表示する。

f03

図3 「山田太郎」さんの調査データ

まず、ここで見てほしいのは、膨大なデータがあることだ。具体的には、

●メールデータが約25万7000件
●チャットが約14万5000件
●ファイルが約7万2000件
●Webの閲覧履歴が約3万9000件

といったぐあいである。これ以外にも、位置情報、写真、USB接続履歴、通話履歴、電話帳もある。実際の情報流出では、USBメモリを使いPCから機密情報をコピーするといったことも多い。そこで、USB接続履歴は、情報流出などの調査に使われることが多い。
こういった履歴情報を収集するのであるが、きわめて膨大になることがわかる。最近では、チャットが非常に普及しており、メールデータに比べて、圧倒的にデータ量が多くなってきている。AOSリーガルテックが調べた事例では、ある人と1日に10回メールをやりとりしているケースでは、チャットはその10倍、多いと100倍くらいのやりとりが行われていた。ここでも、調査データが爆発的に増加している。
また、電話やスマートフォンなどでは、通話履歴、電話帳などを調査する。AOSリーガルテックでは、フォレンジックや不正調査を行う場合、見掛け上の残されたデータだけが対象ではない。消去されたデータの復元も行う。通話履歴は、たいていのユーザーが直近の履歴の数十件しか保存していないことが多い。しかし、スマートフォンの記憶装置には、購入したときから今までのすべての通話履歴が残っていることもある。
通常は、そこまでたくさんの履歴を表示する必要はない。そこで、見た目の削除を行い、表示されないようにしている。ところが、特殊な解析技術を使うことで、そのような履歴もすべて取得することができる。結果、5年間や7年間といった長期間の通話履歴が調査データとして、収集される。
これらの調査データを、人間が1つ1つ見て、チェックしていくことは、あまり現実的ではない。そこで、AIリーガルボットの登場となる。次は「山田太郎さんのWeb閲覧履歴に不正なアクセスはありますか?」とトークする。

f04

図4  Web閲覧履歴から不正アクセスを調査

ここでいう不正なアクセスとは、会社でアクセスが禁止されているWebサイトなどの閲覧を意味する。一般的な対策として、フィルタリングソフトを使う方法がある。ブラックリストを作成し、業務に関係ないサイトや見てはいけないサイトをブロックする。このようなソフトは技術的には十分、確立されているので、フィルタリングエンジンをAIチャットボットから動かすことで、代わりに調べることが可能となる。つまり、人間が1個1個、Web閲覧履歴をチェックする必要はなくなる。
AOSリーガルテックによると、警察の捜査現場などでは1個1個、人海戦術で確認していることもあるとのことだ。まさに証拠集めを人手で行っているが、捜査などではやらざろうえない状況がある。こういったことも、AIチャットボットが変えていくと予想される。さて、山田太郎さんの結果は、次のようになった。

f05

図5 山田太郎さんの不正アクセス

結果は、次のとおりである。いずれも深夜に

●バイクオークションサイト
●オンラインカジノ
●オンラインポーカー

のWebサイトにアクセスしていることがわかった。
さて、これで深夜に不正アクセスをしていたことは、可能性として疑うことができる。しかし、もっと決定的な証拠があれば、より確実になる。調査データのなかには、写真データも1万1927枚ある。人海戦術で1枚1枚、見ていくこともできない数ではない。しかし、10万、30万となったらどうであろうか。ここでも人間が行う作業としては、無理がある。現在では、ビッグデータといわれるように、データ容量が非常に大きくなっている。今後、ますます人手による確認やチェックは難しくなるであろう。
AIリーガルボットでは、新しい写真解析の技術を搭載している。これまでは、「バイクの写真」といった検索に対し、コンピュータはバイクの写真を正しくみつけることはできなかった。しかし、最近では、バイクの写真、猫の写真、人間の写真、ちょっとした特徴を付加することで、高い精度で該当する写真を抽出する。もちろん、100%の精度ではなく、異なる写真を抽出してしまうこともある。しかし、まず自動的に抽出を行い、さらに人間の手によって調査をすることで、効率を向上させることが可能となった。最初から、1万枚の写真を見るのではなく、100点や50点に絞り込まれた状態になれば、人間でも容易に作業ができる。
実際に、「山田太郎さんのバイクに関する写真データがありますか?」とトークすると、AIリーガルボットが1万枚の写真から、バイクの写真を抽出してくれる。

f06

図6 写真データからバイクの写真を調査
ファイル名だけでなく、その写真も表示してくれる。
f07

図7 バイクの写真を表示

この写真がオークションでサイトの購入したバイクと一致していたら、不正アクセスの証拠となる。他には、残業中にアダルトサイトを閲覧していながら、残業代の不払い請求を行ってきた事例があった。ここでも、閲覧した画像データなどが証拠としてみつかると、すぐさま請求を取り下げてくるといったことになる。もし、このような証拠が存在しなければ、延々と不毛な議論や作業を続けなければならないだろう。
ここまで、証拠が出揃ったら、最後に調査レポートの取りまとめとなる。ここでも、AIリーガルボットに「山田太郎さんの調査レポートをまとめてください」とトークする。

f08

図8 調査レポートの依頼

この例では、不正アクセスとバイクの写真であるが、一連のAIリーガルボットとのやりとりをレポート化する。
f09

図9 PDFでダウンロード可能

現時点では、それほど完璧なレポート内容、装丁ではない。しかし、調査結果を一から手書きするよりは、簡単である。下書きくらいに思って利用すれば、十分、利用価値は高い。実際に、PDFを表示してみよう。

f10

図10 調査レポート、その1

f11

図11 調査レポート、その2

今回のデモでは使用しなかったが、最近の写真データには、位置情報なども含まれる。こういった情報を活用することで、より詳細な調査・解析を行うことも可能になっている。この事例のように、具体的な写真を抽出するだけでも、作業量が劇的に変化している点には注目したいところである。上述したように、データは非常に膨大である。それを1個1個、人間が見ていたのでは、とても終わらない。AIリーガルボットがフォレンジックのやり方を大きく変えているといえるだろう。
佐々木氏によれば、新技術によって証拠調査の世界は、一変してきているとのことだ。フォレンジックに限らず、いろいろな分野で、AIチャットボットでできることが広がっていくと予想される。と同時に、これまでにはない仕事のやり方や効率化の達成が期待できる。本ブログでは、今後も新たなAIチャットボットの導入事例を紹介していく予定である。