研究紹介

自然言語による人間の自然なコミュニケーションをコンピュータ上で再現するための数理モデルやアルゴリズムを研究しています。ここでは、現在進めている代表的な研究を紹介します。

構文解析

自然言語の文の構造を解析するための理論や技術を研究しています。意味構造を出力することができる構文解析器 Enju や Jigg の開発をはじめとして、構文解析の高精度化・高速化や、構文解析器の学習のために必要な言語リソースの構築の研究を行っています。英語や日本語に限らず、中国語、ベトナム語、アムハラ語を対象とした研究も行いました。また、多言語のリソースを開発する国際プロジェクト Universal Dependencies に参加し、日本語のデータ開発にたずさわっています。

parsetree image

意味解析

自然言語は、異なる言語表現で同じ意味を表したり、同じ表現で異なる意味を表すことができます。例えば、「大雨になる」と「強い雨が降る」は同じような状況を表していますが、なぜこれが「同じ意味」を表すと言えるのでしょうか？人間は言葉の「意味」を無意識のうちに「同じ」「違う」と判断することができますが、それをコンピュータで再現することは至難の業です。どういう時に２つの言語表現が「同じ意味」を表していると言えるのか、そのしくみを明らかにする研究を行っています。

2つの文の間に意味の包含関係や矛盾があるかどうかを認識する技術をテキスト間含意関係認識といいます。これまで、英語や日本語においてテキスト間含意関係認識を行うための理論や技術を研究してきました。とくに、形式論理に基づく推論と大規模データからの機械学習を組み合わせた含意関係認識モデルの研究でさまざまな成果を挙げています。

また、自然言語テキストを述語論理式やデータベースクエリなどの形式言語に変換するセマンティックパージング技術の研究を行っています。自然言語テキストの意味を表す述語論理式に変換することができれば、テキスト間含意関係認識は論理式間の推論関係として解くことができます。質問文をデータベースクエリに変換することができれば、データベースに対して自然言語を用いて問い合わせができることになり、これは次で紹介するグラウンディングの一つと考えられます。

semantic inference image

グラウンディング

人間は自然言語を用いてコミュニケーションを行っていますが、ふだんの生活では、自然言語以外にも視覚や触覚などさまざまな形で情報を得ています。しかも、自然言語とそれ以外の情報をくみあわせて理解することができます。例えば、山の写真を見ながら、「これはどこの山？」「トマムだよ。先週行ってきたんだ」「スキー？」といった会話を行うことができます。人間はこれを無意識のうちにやってしまいますが、さまざまな形の情報をどのように統合し理解しているのか、未知の領域です。

グラウンディングとは、自然言語で表された概念を、自然言語以外の情報に結びつける研究です。自然言語以外の情報といってもさまざまなものがありますが、とくに画像・映像、データベース、時系列数値データにフォーカスして研究を行っています。たとえば、写真やビデオを入力してその内容を自然言語で説明する研究、大規模データベースに対して自然言語で問い合わせする研究、株価の推移のデータを入力してその概要を説明する研究などを行っています。

現在は、産業技術総合研究所人工知能研究センターと共同でグラウンディングの研究を行っています。画像処理、機械学習、経済学など、さまざまな分野の研究者たちと分野横断的に研究をすすめています。また、JST さきがけ「非テキストデータと接続可能なテキスト解析・推論技術の開発」においては、画像やデータベースと自然言語解析をつなぐための基礎技術の研究を行いました。

対話システムにおける意味理解

人間と同じように会話をすることができるロボットは、人類の夢の一つでしょう。たとえば、上で説明した質問応答は、その一部と見ることができます。しかし、人間は質問に直接答えるだけでなく、能動的に情報を示したり、すでに知っている情報と組み合わせて新たな情報を作ることができます。例えば、グラウンディングの説明で示した例「これはどこの山？」「トマムだよ。先週行ってきたんだ」「スキー？」という対話では、聞かれていないのに「先週行ってきた」という情報を示したり、トマムはスキーリゾートであるという知識を使って「スキーをしに行ったのでは？」という推論を行っています。何気ない会話ですが、その中にさまざまな自然言語理解や人工知能技術が凝縮されており、われわれの研究の最難関の一つと言えます。特に、人間の発話を理解することは、上で説明したセマンティックパージングと共通する問題であり、自然言語処理における重要な研究課題です。

現在は、新学術領域研究「人間機械共生社会を目指した対話知能システム学」に参加し、自然言語処理技術を対話システムにおける言語理解に応用するための基盤技術の研究を行っています。

学術論文テキストデータの解析

学術研究の成果は論文という形で公開され、人類の知として共有されます。しかし、近年では世界中で研究開発がさかんに行われ、発表される論文が爆発的に増加しているため、必要な知見にたどりつくことが困難になりつつあります。インターネットと状況は似ていますが、学術論文の場合はキーワード検索では不十分で、さまざまな概念の間の関係を理解する技術が必要です。そこで、学術論文中に書かれる「手段」「目的」「結果」などの意味的関係を解析する技術の研究を行いました。これまでに、英語と日本語のデータセットを構築して公開し、このデータを用いて学習した意味解析モデルの研究を行いました。

ranis annotation image

金融関連テキストデータの解析

国立情報学研究所金融スマートデータ研究センターにおいて、金融に関するさまざまなデータを有益な知識として活用するための「スマートデータ化」の技術の研究を進めました。金融関連ニュースなどの大規模テキストデータを有効活用するための自然言語処理技術について研究を行っています。

機械翻訳

構文解析や意味解析を応用した高精度な機械翻訳のための技術の研究を行いました。特に、英語、日本語、中国語は文の構造や言い回しが大きく異なるため、構文解析を利用して文の構造を翻訳先言語の構造に近づける手法を開発し、このような言語ペアにおいて精度の高い翻訳ができることを示しました。

質問応答

何か知りたいことがあると、インターネットで検索し、出てきたページを読んで答えを探します。ところが、物知りな人がそばにいたら、その人に直接質問し、答えを聞くでしょう。たとえば、「自然言語処理に関する学会はどういうものがありますか？」という質問に対して、「国内なら言語処理学会、海外なら Association for Computational Linguistics があります」と答えてくれたら、わざわざ検索結果を一つずつ読む手間がはぶけます。このように、質問に対して直接答えを返す技術を質問応答といいます。

これまでに、国立情報学研究所の人工頭脳プロジェクトに参加し、大学入試問題を題材としたデータセットを構築しました。とくに世界史や日本史の問題は、さまざまな知識を利用した質問応答技術が必要とされるベンチマークと見ることができます。さらに、Wikipedia の知識を利用することで答えることができる質問を収集したNIILC-QA データセットを構築し、公開しています。質問と答えだけでなく、その答えを求めるためのプロセスを明らかにするために、キーワードやクエリなどの付加情報を人手で作成しました。