Section 6
Prev     Next

6   空要素

この節では,本アノテーション体系においてノードを割り当てられる空要素について説明する。なお,コントロールを受ける主語位置のギャップ(controlee --- 26 節を参照),ATB 抽出によるギャップ(27 節を参照),右方節点繰上げによるギャップ(30.2 節を参照),N-bar 削除によるギャップ(30.1 節を参照)がノードに割り当てられることはない。

6.1   インデクスを使用しない空要素

インデクスを使用しない空要素には,関係節のトレース,虚辞(expletive),および様々な種類のゼロ代名詞がある。これらはどれも,インデクス付けに利用できる情報を含んでいない。こういった要素のリストをその使用法とともに表1に示す。

     以下の例に見るように,*arb* は一般的な非人称指示に用いられる。

(12)
論文を書くのはとてもたいへんです。

( (IP-MAT (PP (NP (IP-EMB (NP-SBJ;{MAN_2} *pro*)
                          (PP (NP (N 論文))
                              (P を))
                          (NP-OB1 *を*)
                          (VB 書く))
                  (N の))
              (P は))
          (NP-SBJ *)
          (ADVP (ADV とても))
          (ADJN たいへん)
          (AX です)
          (PU 。))
  (ID 2_misc_EXAMPLE))

     主語をもたないように見える文は,空要素としての主語 (NP-SBJ *exp*) を与えられる。これには以下の場合がある。

次の文は,この最後のタイプの例である:

(13)
……道理で返事をしないはずだ、

( (IP-MAT (NP-SBJ *exp*)
          (PU ……)
          (PP (NP (N 道理))
              (P で))
          (NP-PRD (IP-EMB (NP-SBJ *pro*)
                          (PP (NP (N 返事))
                              (P を))
                          (NP-OB1 *を*)
                          (VB し)
                          (NEG ない))
                  (N はず))
          (AX だ)
          (PU 、))
  (ID 200_aozora_Togawa-1937))

文脈から解釈可能な主語が復元可能でない場合でも,発話が世界の状態に関する完全な叙述と見なされるのであれば,節としての解析が望ましく,主語は *exp* としてラベル付けされる。

  (CP-EXL (IP-SUB (NP-SBJ *exp*)
                  (NP-PRD (N 火事))
                  (AX だ))
          (PU !))

     代名詞と同様に,*pro* は談話コンテクスト中の実体を指示するか,または同一の文中の要素を先行詞として取る。*hearer**speaker**speaker+hearer*,および *speaker+pro* は *pro* の特殊な場合であり,条件が満たされる場合には *pro* よりも優先されて使用される。

(14)
津波だと思いました。

( (IP-MAT (NP-SBJ *speaker*)
          (CP-THT (IP-SUB (NP-SBJ *pro*)
                          (NP-PRD (N 津波))
                          (AX だ))
                  (P と))
          (VB 思い)
          (AX まし)
          (AXD た)
          (PU 。))
  (ID 91_newswire_KAHOKU_00034_K201404110A0T30XX00001))

(15)
「先生、もうお忘れですか?」

( (CP-QUE (-LRB- 「)
          (IP-SUB (NP-VOC (N 先生))
                  (PU 、)
                  (NP-SBJ *hearer*)
                  (ADVP (ADV もう))
                  (VB お忘れ)
                  (AX です))
          (P か)
          (PU ?)
          (-RRB- 」))
  (ID 92_aozora_Hayashida-2015))

     最後の例に見るように,ゼロ代名詞は,コントロールを受けない,明示的に表現されていない主要文法役割(NP-SBJ,NP-OB1,NP-OB2),すなわち節内の述語の解釈にとって必須だが省略されている項(argument)を表示する。コントロール関係(コントロール関係がどのように適用されるかについては,26節を参照)や並列構造に起因する束縛関係(27節を参照)にはゼロ代名詞は用いられない。

トレースは,主要部である名詞を修飾する関係節の内部に空要素が存在し,空要素と主要部名詞が一致していることを示す。詳しくは,22.1 節を参照。以下の例では,トレース (NP-SBJ *T*) が主要部の名詞「人」を関係節中の主語の役割にリンク付けしている。

(16)
わかった人は手をあげてごらんなさい。」

( (IP-IMP (PP (NP (IP-REL (NP-SBJ *T*)
                          (VB わかっ)
                          (AXD た))
                  (N 人))
              (P は))
          (NP-SBJ *)
          (PP (NP (N 手))
              (P を))
          (NP-OB1 *を*)
          (VB あげ)
          (P て)
          (VB2 ごらん)
          (VB2 なさい)
          (PU 。)
          (-RRB- 」))
  (ID 137_aozora_Miyazawa-1934_a))

     トレースは,主要文法役割だけでなく,任意の文法役割や付加句(adjunct)の「ギャップ」も表すことができる。この意味でトレースは,(NP-SBJ *pro*) のようなゼロ代名詞が復元可能な項に対応するものに限定されるのと対照をなしている。詳しくは,7.2.3 節を参照のこと。

     ある名詞を修飾する関係節(IP-REL)に他の節が等位接続している場合,それぞれの関係節がトレースをもつ。以下の例では,最初の IP-ADV の下のトレースは主要部名詞を第一目的語役割にリンク付けし,2つめの IP-REL の下のトレースは主語役割にリンク付けしている。

(17)
彼女は皆が愛しそして皆を愛する人です。

( (IP-MAT (PP (NP;{WOMAN_28} (PRO 彼女))
              (P は))
          (NP-SBJ *)
          (NP-PRD (IP-REL (IP-ADV (NP-OB1 *T*)
                                  (PP (NP (Q 皆))
                                      (P が))
                                  (NP-SBJ *が*)
                                  (VB 愛し))
                          (CONJ そして)
                          (NP-SBJ *T*)
                          (PP (NP (Q 皆))
                              (P を))
                          (NP-OB1 *を*)
                          (VB 愛する))
                  (N 人))
          (AX です)
          (PU 。))
  (ID 28_misc_EXAMPLE))

(17) に見るように,2つめのトレースは等位接続された節の前件の後に置かれる。

     なお、関係節に含まれる明示的な代名詞あるいは *pro*がトレースと同一指示である場合,この関係はトレースへの束縛情報ではなく,修飾される名詞が投射する NP に付与される。束縛情報については,__antecedentrelations__節を参照されたい。

(18)
図書館が市民に貸し出して戻ってこない本がたくさんある.

( (IP-MAT (PP (NP;{BOOK} (IP-REL (NP-SBJ *T*)
                                 (IP-ADV (NP-OB1;{BOOK} *pro*)
                                         (PP (NP (N 図書館))
                                             (P が))
                                         (NP-SBJ *が*)
                                         (PP (NP (N 市民))
                                             (P に))
                                         (VB;{貸し出す.01} 貸し出し)
                                         (P て))
                                 (SCON *)
                                 (VB;{戻る} 戻っ)
                                 (P て)
                                 (VB2 こ)
                                 (NEG ない))
                         (N 本))
              (P が))
          (NP-SBJ *が*)
          (NP;*SBJ* (Q たくさん))
          (VB;{有る} ある)
          (PU .))
  (ID 747_dictionary_vv-lexicon_20150226))

6.2   いつでもインデクス付けされる空要素

前節で述べた空要素はすべてインデクス付けされないものであるが,インデクスの付加が必要な空要素も存在する。

*ICH* ("interpret constituent here (この位置で構成素を解釈せよ)"の省略形)は,不連続構造を表示するためのトレースとして使用される。ここで不連続構造とは,例えば句のレベル(必ずしも,生成文法のA-位置 / A-bar-位置の二分法とは一致しない)を横断する外置,長距離スクランブリング,および他の転置のことである。インデクス付けは,インデクス番号を転置された構成素のラベルに付加し,また *ICH* にも付けて,転置された構成素がどの位置で解釈されなければならないかを示すことによって機能する。以下の例文では外置されたPPはインデクス付きのトレースに対応している。曖昧性解消のための情報(下の例の (NP-SBJ *))は,外置された要素の後でなく,*ICH* の後に置かれることに注意すること。

(19)
美しい街ですよ、神戸は。

( (CP-FINAL (IP-SUB (PP *ICH*-1)
                    (NP-SBJ *)
                    (NP-PRD (IP-REL (NP-SBJ *T*)
                                    (ADJI 美しい))
                            (N 街))
                    (AX です))
            (P よ)
            (PU 、)
            (PP-1 (NP (NPR 神戸))
                  (P は))
            (PU 。))
  (ID 989_textbook_kisonihongo))

下の例のように,単一の要素に対する *ICH* によるインデクス付けが複数個になることもあり得る。

(20)
2012年末の男性平均寿命80.18歳、女性平均寿命84.67歳、戸籍人口平均寿命82.41歳。

( (IP-MAT (PP-1 (NP (NUMCLP (NUM 2012)
                            (CL 年))
                    (N 末))
                (P の))
          (IP-ADV (IP-ADV (NP-SBJ (PP *ICH*-1)
                                  (N 男性平均寿命))
                          (NP-PRD (NUMCLP (NUM 80.18)
                                          (CL 歳)))
                          (AX *))
                  (CONJ *)
                  (PU 、)
                  (NP-SBJ (PP *ICH*-1)
                          (N 女性平均寿命))
                  (NP-PRD (NUMCLP (NUM 84.67)
                                  (CL 歳)))
                  (AX *))
          (CONJ *)
          (PU 、)
          (NP-SBJ (PP *ICH*-1)
                  (N 戸籍人口平均寿命))
          (NP-PRD (NUMCLP (NUM 82.41)
                          (CL 歳)))
          (AX *)
          (PU 。))
  (ID 53_wikipedia_Shanghai))

(21)
何のわざとらしさも不自然さもなかった。

( (IP-MAT (NP-SBJ (PP-1 (NP (WPRO 何))
                        (P の))
                  (CONJP (NP (PP *ICH*-1)
                             (N わざとらしさ))
                         (P も))
                  (NP (PP *ICH*-1)
                      (N 不自然さ))
                  (P も))
          (ADJI なかっ)
          (AXD た)
          (PU 。))
  (ID 120_wikipedia_Audrey_Hepburn))

構成素が左側に移動しているが同一の節のレベルにとどまっている場合(例えば,主題化や近距離スクランブリングなど)は,インデクス付けは行われないことに注意すること。

(22)
この服は太った人でも着られます。

( (IP-MAT (PP (NP;{CLOTHES_859} (D この)
                                (N 服))
              (P は))
          (NP-OB1 *)
          (PP (NP (IP-REL (NP-SBJ *T*)
                          (VB 太っ)
                          (AX た))
                  (N 人))
              (P でも))
          (NP-SBJ *)
          (VB 着)
          (VB2 られ)
          (AX ます)
          (PU 。))
  (ID 859_textbook_kisonihongo))

これに対して,右方への外置が行われる場合は,主節述語が最右方の位置を占めるとしなければならないため,外置された句は当該の節とは異なる節に属することになり,したがって *ICH* を用いたインデクス付けが行われる。

(23)
「見よ、神の小羊」。

( (IP-IMP (-LRB- 「)
          (NP-SBJ *hearer*)
          (NP-OB1 *ICH*-1)
          (VB 見よ)
          (PU 、)
          (NP-1 (PP (NP (N 神))
                    (P の))
                (N 小羊))
          (-RRB- 」)
          (PU 。))
  (ID 63_bible_new))

6.3   空要素の位置

空要素は目に見えないために,そのラベル付けに際して迷うことが少なくない。その位置は以下のような方針で行う。

(24)
このビルは、現在の耐震基準に照らし合わせると、強度が不足している.

( (IP-MAT (PP (NP (D この)
                  (N ビル))
              (P は))
          (NP-SBJ *)
          (PU 、)
          (PP (IP-ADV (NP-SBJ *exp*)
                      (NP-OB1 *pro*)
                      (PP (NP (PP (NP (N 現在))
                                  (P の))
                              (N 耐震基準))
                          (P に))
                      (VB;{照らし合わせる.01} 照らし合わせる))
              (P と))
          (SCON *)
          (PU 、)
          (PP (NP (N 強度))
              (P が))
          (NP-SBJ2 *が*)
          (VB 不足)
          (VB0 し)
          (P て)
          (VB2 いる)
          (PU .))
  (ID 1818_dictionary_vv-lexicon_20150226))

(25)
よそから、もらったお酒が二升あった。

( (IP-MAT (PP (NP;{DAZAI_LIQUOR_2_SHO} (IP-REL (NP-OB1 *T*)
                                               (NP-SBJ;{DAZAI_ACQUITANCE} *pro*)
                                               (PP (NP (N よそ))
                                                   (P から))
                                               (PU 、)
                                               (VB2 もらっ)
                                               (AXD た))
                                       (N お酒))
              (P が))
          (NP-SBJ *が*)
          (NP;*SBJ* (NUMCLP (NUM 二)
                            (CL 升)))
          (VB あっ)
          (AXD た)
          (PU 。))
  (ID 66_aozora_Dazai-1-1940))

     空要素と先行詞の照応計算はゼロ代名詞の位置に影響を与える。例えば,照応計算は等位節における同一指示を見るために, Across the Board extraction(ATB)と呼ばれるルールに従う。ここでは,IPn におけるすべてのカテゴリー x が(その文法要素を保持しながら),CONJ の曖昧性解消タグを施された節 1, 2...n-1 における空要素の先行詞となり,その際に,x は IPn-1の姉妹であり,かつそれに先行し,IPn-2 が IPn-1 の先頭要素となり,IPn-3 が IPn-2 の先頭要素となり,等々ということになる。つまり,IPn における 1, 2...n-1 のそれぞれが照応関係を共有するということになる(CONJ による曖昧性解消タグを施された節が複数続く構造については,27.3節を参照)。以下の例に見るように,IPn におけるゼロ代名詞の位置は,ゼロ代名詞がすべての非最終節の先行詞になる場合,最も左側である。

(26)
信じられないようなことですが超常現象ではありません

( (IP-MAT (NP-SBJ *pro*)
          (PP (IP-ADV (NP-PRD (IP-REL (NP-SBJ *T*)
                                      (NP-PRD (IP-EMB (NP-SBJ *pro*)
                                                      (VB 信じ)
                                                      (VB2 られ)
                                                      (NEG ない))
                                              (N よう))
                                      (AX な))
                              (N こと))
                      (AX です))
              (P が))
          (CONJ *)
          (NP-PRD (N 超常現象))
          (AX で)
          (P は)
          (VB2 あり)
          (AX ませ)
          (NEG ん))
  (ID 11_translated_TED_2-JessaGamble_2010G))

次の例ではゼロ代名詞は各々1つの節の構成素として,他の構成素と横並びの位置に現れている。

(27)
喧嘩の呼吸で来られては見当が付かず扱かいにくい。

( (IP-MAT (NP-SBJ *pro*)
          (IP-ADV (NP-SBJ *speaker*)
                  (PP (IP-ADV (NP-OB1 *pro*)
                              (IP-SMC (PP (NP (PP (NP (N 喧嘩))
                                                  (P の))
                                              (N 呼吸))
                                          (P で))
                                      (VB 来))
                              (VB られ)
                              (P て))
                      (P は))
                  (CND *)
                  (PP (NP (N 見当))
                      (P が))
                  (NP-OB1 *が*)
                  (VB 付か)
                  (NEG ず))
          (CONJ *)
          (VB 扱かい)
          (AX にくい)
          (PU 。))
  (ID 117_aozora_Kunieda-1925))

時には,ゼロ代名詞を節の先頭に置くというデフォールトに従ってコントロール関係を発揮させることを妨げなければならないこともある。これが必要になるのは,同一指示関係をもつ先行詞を解釈するに当たり,目的語先行詞の方が主語先行詞よりもアクセス可能性が強いことを規定する「先行詞アクセス可能性の階層」が存在するからである。この階層によって,主語先行詞が従属節をコントロールするためには,その従属節の左側に目的語が存在してはならないことになる。以下の例では,節 IP1 の主要部は他動詞であるが NP-OB1 項は明示されていない。IP1 は従属節 IP2 と主語を共有するが,NP-OB1 を共有していない。よりアクセス可能性の強い NP-OB1 項が等位節の左側に出現することは,それらの内部を束縛してしまうために許されない。

(28)
女の肩に手を掛けて、引き起して、窓の方へ向けて見ると、まだ二十にならない位な、すばらしい別品だったと云うのだ。」

( (IP-MAT (NP-SBJ *exp*)
          (CP-THT (IP-SUB (PP (IP-ADV (NP-SBJ *pro*)
                                      (IP-ADV (IP-ADV (IP-ADV (PP (NP (PP (NP;{WOMAN} (N 女))
                                                                          (P の))
                                                                      (N 肩))
                                                                  (P に))
                                                              (PP (NP (N 手))
                                                                  (P を))
                                                              (NP-OB1 *を*)
                                                              (VB 掛け)
                                                              (P て))
                                                      (CONJ *)
                                                      (PU 、)
                                                      (NP-OB1;{WOMAN} *pro*)
                                                      (VB 引き起し)
                                                      (P て))
                                              (CONJ *)
                                              (PU 、)
                                              (NP-OB1;{WOMAN} *pro*)
                                              (PP (NP (PP (NP (N 窓))
                                                          (P の))
                                                      (N 方))
                                                  (P へ))
                                              (VB 向け)
                                              (P て))
                                      (CONJ *)
                                      (VB 見る))
                              (P と))
                          (SCON *)
                          (PU 、)
                          (NP-SBJ;{WOMAN} *pro*)
                          (NP-PRD (IP-REL (NP-SBJ *T*)
                                          (NP-PRD (IP-EMB (ADVP (ADV まだ))
                                                          (PP (NP (NUMCLP (NUM 二十)))
                                                              (P に))
                                                          (NP-OB1 *に*)
                                                          (VB なら)
                                                          (NEG ない))
                                                  (N 位))
                                          (AX な))
                                  (PU 、)
                                  (IP-REL (NP-SBJ *T*)
                                          (ADJI すばらしい))
                                  (N 別品))
                          (AX だっ)
                          (AXD た))
                  (P と))
          (VB 云う)
          (P の)
          (AX だ)
          (PU 。)
          (-RRB- 」))
  (ID 174_aozora_Mori-1912))

他の文型については,同一指示関係を引き出すための条件はより緩やかである。下の例で,条件を表す接続助詞「たら」が導く節は明示的な第一目的語を含み,その指示対象は主節の主語ゼロ代名詞と同一である。ここで同一指示関係が可能だと推論するには,第一目的語が主語ゼロ代名詞に先行することが十分条件となる。そしてそのためには,*pro* を節の冒頭以外の位置に置くことが必要となる。主節のゼロ代名詞 (NP-SBJ *pro*) を条件節 IP-ADV の右側に置くことによって,先行する IP-ADV の NP-OB1 が当該ゼロ代名詞の先行詞として解釈されることが可能になる。とは言え,他に情報が与えられないかぎり,同一指示は単に可能性にとどまり,決定的なものとはならない。下の例について言えば,従属節中の動詞「あげたら」の NP-OB1「それ」と主節の動詞「なくなった」の (NP-SBJ *pro*) とが次のように「束縛情報」を共有できれば,同一指示関係は理想的な形で決定されることになる: (IP-MAT (IP-ADV (...)(PP (NP;{MIKAN} (PRO それ)) (P を)) (...) あげたら) (NP-SBJ;{MIKAN} *pro*) (...) なくなった)

(29)
それを三つ彼にあげたらなくなった。

( (IP-MAT (PP (IP-ADV (NP-SBJ;{SPEAKER_35} *speaker*)
                      (PP (NP;{MIKAN} (PRO それ))
                          (P を))
                      (NP-OB1 *を*)
                      (NP;*OB1* (NUMCLP (NUM 三)
                                        (CL つ)))
                      (PP (NP;{MAN_35} (PRO 彼))
                          (P に))
                      (NP-OB2 *に*)
                      (VB あげ))
              (P たら))
          (CND *)
          (NP-SBJ;{MIKAN} *pro*)
          (VB なくなっ)
          (AXD た)
          (PU 。))
  (ID 35_misc_EXAMPLE))

     埋め込まれる節の内部の空要素とその右側に現れる明示的先行詞との同一指示関係(左方代名詞化)も可能ではあるが,そのような関係は先行関係によってもアクセス可能性階層によっても解釈することは出来ない。このような場合,同一指示関係の確定のためには束縛情報が絶対に必要である。

(30)
ダウンロードして印刷すれば、学校や家庭で手軽に取り組める。

( (IP-MAT (NP-SBJ *pro*)
          (IP-ADV (NP-OB1;{FILE} *pro*)
                  (IP-ADV (VB ダウンロード)
                          (VB0 し)
                          (P て))
                  (CONJ *)
                  (VB 印刷)
                  (VB0 すれ)
                  (P ば))
          (CND *)
          (PU 、)
          (NP-OB1;{FILE} *pro*)
          (PP (NP (CONJP (NP (N 学校))
                         (P や))
                  (NP (N 家庭)))
              (P で))
          (ADVP (ADJN 手軽)
                (AX に))
          (VB 取り組める)
          (PU 。))
  (ID 55_newswire_KAHOKU_00097_K201402230A0T20XX00001))

     アノテーション作業を行うに際して,照応関係をインデクスとして表示するツールが利用できるようになっている。これによってアノテーターは,アクセス可能性階層や束縛・コントロール関係の様々な構文的条件を直接参照しなくとも,ゼロ代名詞のラベル付けに関する誤りを簡単につきとめることが出来る。


Prev     Next
Section 5  Home  Section 7