NLP Progress という素晴らしいリポジトリを見つけました。整理の意味を込めてまとめます。
NLPの種々のタスクとそのSOTAが掲載されています。
NLPのベンチマークとなる有名なデータセットも一緒に紹介されており，NLP論文を読むうえで大きな助けとなってくれるでしょう。

1. 文書分類タスクとその変形

概要
- 文書に対してNクラス分類を行う.
- 1.の他のタスクも文書分類の亜種だが, 特に文書のドメインなどを扱うタスクがこう呼ばれる印象がある.
データセット例
- 英語
  - AG News Corpus
  - DBpedia ontology
    - 英語版Wikipediaをもとに構成したオントロジー. 全14クラス.
  - TREC dataset
    - TREC-6: open-domain questionからなるデータセット. 全6クラス.
    - TREC-50: 全50クラス.
上位モデル例
- Transformer系全般: BERT, XLnet etc.
- CNN系: Char-level CNN, DPCNN, LSTM+CNN etc.
- 非ニューラル: SVM etc.

概要
- 文書に対して感情極性判定を行う.
データセット例
- 英語
  - IMDb (Internet Movie Database)
    - Internet Movie Database (Amazon傘下) の映画レビューとrating(★1~10)が対になったもの.
    - Kaggleのtutorial competitionにも使用されています.
  - SST (Stanford Sentiment Treebank)
    - Rotten Tomatoes の映画レビューから構成した構文解析木. ツリーの各ノードに negative(1) 〜 positive(25) までの25段階評価が振ってある.
    - SST-5: 5段階評価に単純化したもの.
    - SST-2: 2段階評価に単純化したもの.
  - Yelp 2013, Yelp 2014
    - Fine-grained: 5段階評価
    - Binary: 2段階評価
    - 余談ですが, yelpは画像分類のデータセットを公開していたりもします.
  - SemEval-2017 Task4
    - Subtask A: 入力=ツイート, Class=Positive, Negative, Neutral
    - Subtask B: 入力=ツイートとトピックの対, Class=Positive, Negative
    - Subtask C: 入力=ツイートとトピックの対, Class=5段階評価
    - Subtask D: Subtask B でトピックの入力を与えない(隠した)もの
    - Subtask E: Subtask C でトピックの入力を与えない(隠した)もの
上位モデル例
- Transformer系: BERT, XLnet etc.
- CNN系: Char-level CNN, DPCNN, LSTM+CNN etc.
- ちなみにニューラル以前は構文解析の技術が応用されていたようです.

概要
- 意見が主観的/客観的のどちらであるかを判定する.
データセット例
- 英語
  - SUBJ (Subjectivity Dataset)
上位モデル例
- Self-Adaptive Hierarchial Sentence Model
- CNN + MCFA (attention-based multiple context fixing attachment)
- Byte mLSTM

概要
- 前提文Tが仮説文Hを含意するか否かを判定する. つまり,
  - Tが正しければHも正しいと推論できるなら, true (entailment)
  - Tが正しければHは誤っていると推論できるなら, false (contradiction)
  - どちらともいえないのならば undetermined (neutral)
データセット例
- 英語
  - SNLI (Stanford Natural Language Inference)
  - MNLI (MultiNLI, Multi-Genre Natural Language Inference)
上位モデル例
- Transformer系: RoBERTa, XLNet etc.
- RNN系: Multi-task BiLSTM + Attention etc.
- ニューラル以前は述語項構造解析の手法が応用されていたようです.

まとめ

当然というべきか, これらのタスクは2019年ではすっかりBERT族の独壇場となりました。
他のタスクについても順次まとめていきます。