本プロジェクト「自然言語の非線形性の計算論モデル」(2021年度〜2026年度)は、自然言語のあらゆるレベルで現れる、線形を超え木構造未満の非線形的構造を数理的に明らかにすることを目的としています。 これまでの言語学や自然言語処理の研究では、文内構造や文列の構造など異なるスケールにわたって非線形構造があることが知られており、それは自然言語の本質であると考えられます。 この非線形構造は、完全二分木のような充填的な木構造ではなく、線形な構造(マルコフ列)と完全木の間の中間的な構造であると言われています。 しかし、この非線形構造については直感的な議論しか行われておらず、その数理的性質や数理モデルは未解決です。

本プロジェクトでは、自然言語が普遍的にもつ非線形構造を数理的に明らかにして計算論的なモデルを与えること、そしてこれを構文解析や意味推論などの高度化に展開することを狙っています。 これを達成するために、自然言語を研究対象としながらまったく異なるアプローチで研究を行ってきた3つのグループを組織し、それぞれのアプローチでの研究を進めながら、お互いのアプローチの融合点を模索します。

研究体制・研究テーマ

複雑系グループ(PI: 田中久美子)では、確率過程、複雑系科学諸理論を用い、言語の非線形性の計量を基に、大域的視点から言語の系列の非定常特性をモデル化する研究を行います。 計算言語グループ(PI: 宮尾祐介)では、機械学習理論、自然言語処理を方法論とし、伝統的な言語学上の知見をふまえ、構文解析を統一軸とする構造・意味のモデル化の研究を行います。 数理論理グループ(PI: 峯島宏次)では、推論、証明論に基づき、形式意味論を用いた文列に内在する証明構造の非線形性のモデル化の研究を行います。

本プロジェクトは自然言語の非線形性の数理的・計算論的モデルを明らかにすることを主目的としていますが、それらの構文解析や意味推論システムへの応用も視野に入れています。 最終的には、非線形性をはじめとした自然言語の数理的性質を明らかにする「新しい計算言語学」を確立することを目指します。