MIMIC-IIIを使えるようになるまで

0. MIMIC-IIIとは

MIMIC-IIIとは米国ボストンにある Beth Israel Deaconess Medical Center (BIDMC) が収集した大規模単施設医療データセットです. ICUのあらゆる診療データが12年間にわたって収集されており, その規模は ICU stay 約6.2万回, 成人患者 約3.9万人 に及びます.

↓Nature Scientific Dataの元論文はこちら

Alistair E. W. Johnson et al. MIMIC-III, a freely accessible critical care database. Scientific Data. 2016.35.

データの規模もさることながら, 内容も細かく, 診療記録, 画像診断レポート, 退院サマリーからモニター, ICUチャート, 検体検査結果, オーダー, ICDコードに至るまで収集されています(下図は上記論文からの引用).

f:id:radiology-nlp:20200320210828p:plain

医療言語処理の観点からみても, これだけの規模の診療記録データセットは貴重です. ClinicalBERT も MIMIC-III に収録された診療記録で事前学習を行なっています.

arxiv.org

1. MIMIC-IIIのデータを使用するには

MIMIC-IIIは匿名化されたデータであり, HIPAAが定めるところの protected health information (PHI) には該当しないため, 自由に利用可能です.
しかし, かなり詳細な医療データであることには変わりはないため, 利用にあたっては所定の講座を修了のうえ利用申請を行うよう定められています.
利用申請は基本的には案内に従っていけば終了するので, 特段迷うところはありませんが, 以下に手順を記します.
(※2020年1月時点の情報に基づいて記載しています. 現在の正確な情報を反映していない可能性があります)

2. 利用申請の手順

2-1. CITI PROGRAM の Learner Registration
  • 下記のリンクからCITI PROGRAM への登録を行います.

www.citiprogram.org

  • page1: Select Your Organization Affiliation

    • Massachusetts Institute of Technology Affiliates を選択します. f:id:radiology-nlp:20200120224709p:plain
  • page2〜4: メールアドレス, ユーザー名, パスワード, 秘密の質問, 国名

    • 特に迷うところは無いと思います.
  • page5: CE creditが要るかどうか

    • この講座を医療従事者の生涯学習の単位に利用するかどうか. 基本的に米国の医療従事者でなければ No で構いません. f:id:radiology-nlp:20200120225144p:plain
  • page6: Language Preference, Institutional Email Address, Department, Role In Research

    • 特に迷うところは無いと思います.
  • page7: カリキュラム選択

    • Question 1 で Data or Specimens Only Research を選択します.
    • Question 6 で No を選択します. f:id:radiology-nlp:20200120225951p:plain f:id:radiology-nlp:20200120230436p:plain
  • Finalize Registration で登録が完了します. f:id:radiology-nlp:20200120230510p:plain

2-2. コースを受講
  • 医療倫理や研究倫理に関する講座を9つ受講し, その後のテストに合格する必要があります. f:id:radiology-nlp:20200120230625p:plain

  • テストは9講座全体で90%以上の正解率でなければなりません. f:id:radiology-nlp:20200120230849p:plain

  • 講座の内容はテキスト, テストは多肢選択式問題で与えられます. 結構テキストをしっかり読み込まなければ正解できないため, ここで案外時間がかかります.

2-3. アカウントを証明書付き (Credentialed) にする
  • 全9講座の受講が終わったら, メールで下図のような受講終了のお知らせが送られてきます.
  • メール内のリンクから Completion Report という PDF を入手しましょう.

f:id:radiology-nlp:20200321161628p:plain

  • 次に, PhysioNet のアカウント設定画面の Cretentialing タブから, アカウントへの証明書の付与 (Credentialing) を申請します.
  • 上司1名の氏名とメールアドレスを添えて申請しなければならないため, 事前にしかるべき人物に話を通しておきましょう.
  • 先ほど入手した Completion Report もここでアップロードします.

f:id:radiology-nlp:20200321161852p:plain

  • 特に問題がなければ1週間程度でメールで申請受理の連絡がきます.

f:id:radiology-nlp:20200320210606p:plain

2-4. 個々のデータセットの利用申請
  • ここまで来れば, PhysioNet 内で公開されている各種データセットへは, 利用規約に同意する旨のボタンを押すだけでアクセスできるようになります. f:id:radiology-nlp:20200321160825p:plain