MAYZ ツールキットは,コーパス指向の文法開発を支援するツールを提供しま す.コーパス指向の文法開発とは,大規模な lexicalized grammar を効率良 く開発するための手法です.通常の文法開発では,各単語の文法的性質を記述 した lexicon を手作業で作りますが,コーパス指向の手法では,lexicon を 作成する前に,まず derivation bank (derivbank) を作成します.Derivbank とは,いわゆる treebank と同じようなもので,実際の文がどのように解析さ れるべきか,その構造を注釈付けしたコーパスです.このとき,その注釈はター ゲットの文法理論が要求する文法的制約(principles)を満たさなければなりま せん.文法的制約を満たした注釈が付けられた文(derivation)が与えられると, lexicon はそこから自動的に抽出することができます.
MAYZ ツールキットは,derivbank の作成を手助けしたり,lexicon の抽出を 行ないます.また,得られた文法の確率モデルを作成するためのツールも提供 します.ユーザは,注釈付けのためのパターンルールと文法理論の一般的文法 制約を記述するだけで,大規模な文法を作成することができます.また,確率 モデルの feature を取り出すパターンを記述するだけで,確率モデルを作る こともできます.
さらに,作成した文法を使って構文解析を行うための汎用パーザ(Unification Parser, UP)もパッケージに含まれています.このパーザは確率モデルを使っ たビームサーチをサポートしています.ツールキットを使って作成した文法を すぐにアプリケーションで利用することができます.