MAYZ 用語集

English version

MAYZ ツールキットに関係する用語を集めました.MAYZ の中でだけ使われてい る特殊な用語には注がつけてあります.

構文木 (MAYZ 特有の使い方です)
MAYZ ツールキットでは,入力の treebank における木構造を「構文木(parse tree)」と 呼びます.ターゲットの文法理論における句構造を表した木構造は,derivation と呼びます.
最大エントロピー(ME)モデル
確率モデルの一つ.詳しくは,amis ホームページ を見て下さい.
derivation (MAYZ 特有の使い方です)
ターゲットの文法理論における句構造を表した木構造.句の情報に加え て,その句が生成された時の情報(例えばスキーマ名)も含みます.例えば, HPSG では娘の構造も含めた sign, CCG では derivation tree を指します. LTAG では,substitution/adjunction のラベルがついた derived tree に 相当します(LTAG の derivation tree は句構造ではない).
derivbank (MAYZ 特有の用語です)
derivation の集合です.MAYZ システムで は,treebank を変換することによって半自動的 に作ります.
lexbank (MAYZ 特有の用語です)
derivationの末端部だけを集めたデータ. 各単語の情報が集められているため,語彙的な情報を集めるのに使えます.
maximum entropy (ME) model
最大エントロピーモデル
parse tree
構文木
treebank
CFG スタイルの句構造がたくさんの文に注釈付けされているデータ. Penn Treebank など,各言語で様々な treebank が作成されています. MAYZ ツールキットは,そのような treebank を入力として,derivbank を作成することを目的とします.

MAYZツールキットマニュアル MAYZホームページ 辻井研究室
MIYAO Yusuke (yusuke@is.s.u-tokyo.ac.jp)