Penn Tree Bankで定義されている品詞タグ一覧

はじめに

英文を句構造文法によって自動で構文解析すると,多くのライブラリではPenn Tree Bankの仕様に従って品詞タグが付与されます.

ニューラル言語処理ばかりやっていると意外とこれらの品詞タグが何を表しているかについて馴染みがないので,この機会にまとめてみました.

品詞タグの一覧はこちらで閲覧できます(http://www.ai.mit.edu/courses/6.863/tagdef.html).

より正確なガイドラインはこちらを参照してください(https://www.semanticscholar.org/paper/Part-of-speech-tagging-guidelines-for-the-penn-Santorini/c2fbd6cead3815b8e7038fda6f0f0254a2218ca7).

品詞タグ一覧

1. CC

  • 等位接続詞 (Coordinating conjunction).
    • 例: and, but, or, for, so.
    • 四則計算や分数として用いられる plus, minus, less, times, over もこれに含まれる.

2. CD

  • 基数 (Cardinal number).
    • 数量の大きさを表現する語.
    • 序数 (first, second など) にはCDタグを用いず,形容詞 (JJ) や副詞 (RB) などのタグを割り当てる.

3. DT

  • 限定詞 (Determiner).
    • 例1: 冠詞: a, an, the など
    • 例2: 指示限定詞: this, these など.
    • 例3: 数量詞: every, no, all, some など.
    • 注1: 所有限定詞 (my, your, its, ourなど) には別のタグ (PPS) が割り当てられている.
    • 注2: 疑問限定詞 which (どの,どんな) には別のタグ (WDT) が割り当てられている.

4. EX

  • 存在の There (Existential "there").

5. FW

  • 外国語 (Foreign word).
    • 英語以外の言語に由来すると判断された語に付与される.
    • たとえば医療言語処理では "bronchus" (気管支), in vivo の "vivo" (生体内で) などには FWタグが振られる傾向にある.

6. IN

  • 従属接続詞 (Preposition or subordination conjunction).
    • 例: before, because, if, although, whether.

7. JJ

  • 形容詞 (Adjective).

8. JJR

  • 形容詞の比較級 (Adjective, comparative).

9. JJS

  • 形容詞の最上級 (Adjective, superlative).

10. LS

  • List item marker.
    • 箇条書きに用いられている "1." "a." "i." などに割り振られる.

11. MD

  • 助動詞 (Modal).
    • 例: can, may, must, shall, will, could, might, should, would.

12. NN

  • 可算名詞の単数形もしくは非可算名詞 (Noun, singular or mass).

13. NNS

  • 可算名詞の複数形 (Noun, plural).

14. NP

  • 固有名詞,単数 (Proper noun, singular).

15. NPS

  • 固有名詞,複数 (Proper noun, plural).

16. PDT

  • 前限定辞 (Predeterminer).
    • 学校の英語文法ではあまり聞かない語なので理解しにくい.
    • 冠詞や人称代名詞所有格を前から修飾するような語に割り当てられる.
    • 例: all, both, half, many, quite, rather, such.

17. POS

  • 所有の ‘s (Possessive ending).

18. PP

  • 人称代名詞 (Personal pronoun).
    • 日本の英語教育でいうところの人称代名詞の主格および目的格. さらに所有代名詞,再帰代名詞にもこのタグを割り当てる.
    • 例: I, you, they, myself, themselves, mine, ours.

19. PPS

  • 所有代名詞 (Possessive pronoun).
    • 名称こそ "所有代名詞" だが,実際は人称代名詞の所有格に割り当てられている.
    • 例: my, your, its, his, her, our, their.

20. RB

  • 副詞 (Adverb).
    • enough, indeed, not, n't, neverなどもこれに含まれる.

21. RBR

  • 副詞の比較級 (Adverb, comparative).

22. RBS

  • 副詞の最上級 (Adverb, superlative).

23. RP

  • 不変化詞 (Particle).
    • これも学校の英語文法ではあまり聞かない語なので理解しにくい.
      • 例1: 自動詞としてはたらく動詞句の中で,動詞に後置される語 (call offの"off", rule outの"out", throw upの"up"など).
      • 例2: 助動詞的に使われる動詞句の中で,動詞に後置される語 (used toの"to", had betterの"better", ought toの"to"など).
      • 例3: 限定詞句に登場するもの (many ofの"of"など).
    • https://parentingpatch.com/particle-english-grammar/ を参考にしています.

24. SYM

  • 記号 (Symbol).
    • 主にピリオド, カンマ, コロン, セミコロン以外の記号に割り当てられる.

25. TO

  • "to" に割り当てられる (to).
    • 前置詞であろうとto-不定詞の一部であろうと役割に関係なくこのタグを用いる.

26. UH

  • 間投詞 (Interjection).

27. VB

  • 動詞の原形 (Verb, base form).
    • 命令形の動詞や, 助動詞の後ろもしくはsuggest thatなどの後ろの動詞に割り当てられる.

28. VBD

  • 動詞の過去形 (Verb, past tense).

29. VBG

  • 動名詞または動詞の現在分詞 (Verb, gerun or present participle).

30. VBN

  • 動詞の過去分詞 (Verb, past particle).

31. VBP

  • 動詞の1人称単数現在形または2人称単数現在形 (Verb, non-3rd person singular present).

32. VBZ

  • 動詞の3人称単数現在形 (Verb, 3rd person singular present).

33. WDT

  • 疑問限定詞 (Wh-determiner).
    • "which" に割り当てられる.
    • また,関係代名詞として用いられる "that" にも割り当てられる.

34. WP

  • 疑問代名詞 (Wh-pronoun).
    • "what", "who", "whom" に割り当てられる.

35. WP$

  • 疑問所有代名詞 (Possessive Wh-pronoun).
    • "whose" に割り当てられる.

36. WRB

  • Wh-adverb.
    • wh疑問文やwh疑問詞節などをつくる疑問詞に割り当てられる.
    • 例: when, where, why, how.