自然言語処理タスクを概観する(5) 言語モデル, 情報抽出, 意味, 知識など

NLP Progress という素晴らしいリポジトリを見つけました。整理の意味を込めてまとめます。
NLPの種々のタスクとそのSOTAが掲載されています。
NLPベンチマークとなる有名なデータセットも一緒に紹介されており,NLP論文を読むうえで大きな助けとなってくれるでしょう。

ついにここまでやって来ました。言語の意味などを扱う,より高度なタスクを概観していきます。

7. 言語モデル Language Modeling

  • 概要
    • トークン列の文としての確からしさを評価する.
      • 古典的には, マルコフ仮定にもとづき, 最後のk単語から次の単語を予測するという問題設定だった.1
      • ニューラル言語処理の発展以降はマルコフ仮定を用いない言語モデルに移行している.
    • 評価指標はパープレキシティ preplexity.
      • 性能がよいほど小さくなる.
      • パープレキシティはコーパスから計算するため, 異なるコーパスに対しては比較できない.
  • データセット
  • 上位モデル例
    • Transformer系: Transformer XL etc.

8. 意味解析 Semantic Parsing

  • 概要
    • 自然言語を, 計算機が扱えるような意味表現へと変換するタスク.
    • 出力形式は以下に示すSQLまたはAMRが一般的.

8-1. 抽象的意味表現 AMR (Abstract Meaning Representation)

8-2. SQL parsing

  • 概要
    • 入力された質問文から, それに正しく応答するためのSQL文を自動生成する.
    • こちらは生成するのが文であるため, seq2seqなアプローチが利用可能.
  • データセット
    • 英語
      • ATIS
        • 飛行機のフライト予約に関する質問を受け, それに答えるためのSQL文を生成するためのデータセット.
      • Advising
        • 大学の履修に関する質問を受け, それに答えるためのSQL文を生成するためのデータセット.
      • GeoQuery
        • 地理に関する質問を受け, それに答えるためのSQL文を生成するためのデータセット.
      • Scholar
        • 学術論文のデータベースに関する質問を受け, それに答えるためのSQL文を生成するためのデータセット.
      • Spider
      • WikiSQL
  • 上位モデル例

9. 知識獲得など

9-1. Taxonomy Learning

9-2. Common Sense

  • 概要
  • データセット
    • 英語
      • Event2Mind
        • 複数の人物が登場する, 日常生活の出来事を描写した文が与えられる.
        • 登場人物の行動について, その意図や受け手の反応を推定する.
      • SWAG (Situations with Adversarial Generations)
        • 動画キャプション生成用データセットの, キャプション文のみから作成したもの.
          • LSMDC (Large Scale Movie Description Challenge)
          • Activity Net
        • キャプションの前半部分が与えられ, その続きとして整合性のあるものを4つの選択肢から (動画情報は使わずに) 正しく選ぶ.
      • Winograd Schema Challenge
      • WNLI (Winograd Schema Challenge NLI)
      • VCR (Visual Commonsense Reasnoning)
        • 視覚情報の理解をめざしたデータセット.
        • 画像とその内容についての質問文が与えられ, 質問への正答を選択肢からえらぶ.
        • さらに, なぜその選択肢を選んだのかという根拠もあわせて択一式で答えさせる.
      • ReCoRD (Reading Comprehension with Commonsense Reasnoning Dataset)
        • CNN / Daily News の記事から構成したデータセット.
        • 問題設定は機械読解のタスクと似ているが, 質問文の作成を自動化してある.
  • 上位モデル例
    • Transformer系: RoBERTa, XLNet, BERT etc.

9-3. 情報抽出 IE (Information Extraction)

9-3-1. Open Knowledge Graph Canonicalization

まとめ

ここまで来るとタスクが高度かつ複雑になるため,単一のできあいのモデルをそのまま使うだけでは太刀打ちできません(問題設定やデータセットにもよりますが)。
次回がこのシリーズの最後となる予定です。