【FDAガイダンス】医薬品承認申請時にRWD由来のデータを提出する際のデータ標準に関するガイダンス案と業界の反応

医薬関係
この記事は約14分で読めます。

はじめに

 2021年10月にFDAは、医薬品承認申請時にRWDをソースとしたデータを提出する際のデータ標準に関するガイダンス案を公表しました。

Data Standards for Drug and Biological Product Submissions Containing Real-World Data

Data Standards for Drug and Biological Product Submissions Containing
Data Standards for Drug and Biological Product Submissions Containing Real-World Data

 RWDを承認申請の根拠資料とする機会が増えてくれば、そのRWDをFDAに提出する機会も増加することになりますが、その際のデータフォーマットについての統一的な見解がなければ現場は混乱しますし、事前準備が十分にできず申請が遅れることも考えられます。
 そのようなことがないようデータ標準フォーマットを決めておく必要があり、FDAはこのガイダンスにて考え方(案)を示した形となっています。

 現在の承認申請時に提出するデータ標準はCDISC(Clinical Data Interchange Standards Consortium)のSDTM(Study Data Tabulation Model)やADaM(Analysis Dataset Mode)ですが、これらは「データは治験で収集される」というコンテキストに最適化して作られたフォーマットです。
 そのため、RWDのデータを格納するフォーマットととして利用しようとすると、難しい点がでてきます。

 またフォーマットだけでなく、ターミノロジー(辞書)も異なり、それぞれの辞書の「対応する用語」を探そうとしても、意味的に対応するものがなかったり、1対1の関係でマッピングできないものが多かったり、また無理にRWDをCDISCに合わせようとすると、データ値の「意味」さえ変えざるを得ない場合が発生します。

 このあたりをどう考えるのか、というのが一番の注目点だと思います。

 ガイダンスの分量は多くなく、実装のための詳細な方法論までは述べていませんが、業界からは同じ方向のコメントが寄せられていました。

 ここでは、このガイダンス案の内容を確認した上で、それに対する業界からの反応についても触れてみたいと思います。

ガイダンス案の内容

ガイダンスの目次は以下のような構成になっています。

I.            INTRODUCTION AND SCOPE
II.           REGULATORY BACKGROUND
III.         APPLYING CURRENTLY SUPPORTED DATA STANDARDS TO STUDY DATA DERIVED FROM REAL-WORLD DATA SOURCES
 A.          Challenges in Real-World Data Standardization
 B.           Documentation of Processes for Managing Real-World Data
 C.          Considerations for Conforming Real-World Data to Currently Supported FDA Study Data Standards
 D.          Considerations for Mapping Real-World Data to Study Data Submission Standards
 E.           Considerations for Data Transformations
IV.         GLOSSARY
APPENDIX: EXAMPLES OF MAPPING HEALTH CARE DATA TO CDISC SDTM

I. INTRODUCTION AND SCOPE

 このガイダンス案は医薬品と生物製剤の両方を対象としています。

 このガイダンス案では、RWDは以下のように定義されています。

data relating to individual patient health status or the delivery of health care routinely collected from a variety of sources. Examples of RWD include data from electronic health records (EHRs); medical claims data, data from product and disease registries; patient-generated data (including data from in-home-use settings); and data gathered from other sources that can inform on health status, such as mobile devices.

様々な情報源から日常的に収集される、個々の患者の健康状態や医療の提供に関するデータ。RWDの例としては、電子カルテ(EHR)からのデータ、医事請求データ、製品・疾病レジストリからのデータ、患者が作成したデータ(家庭内での使用データを含む)、健康状態を知ることができるその他の情報源(モバイルデバイスのようなものなど)から収集したデータなどが含まれます。

II. REGULATORY BACKGROUND

 申請時に提出するデータは、FDAが処理、レビュー、およびアーカイブできる電子フォーマットでなければなりません。
 RWDを申請データとして使うのであれば、RWDもその規制の対象となります。
 このガイダンス案は、RWDをソースとする試験データを提出する際に求められる推奨事項をスポンサーに提供します。

III. APPLYING CURRENTLY SUPPORTED DATA STANDARDS TO STUDY DATA DERIVED FROM REAL-WORLD DATA SOURCES

A. Challenges in Real-World Data Standardization

 FDAは、RWDをソースとする試験データを標準化することに伴う困難を認識しています。これらの困難には以下のものが含まれますが、これらに限定されるものではありません。

  1. RWDのデータソースの多様性とその不統一なフォーマット(例:EHR、レジストリ)
  2. 同一またはよく似たのデータエレメントを表現するための標準規格や、ターミノロジー、交換フォーマットが地域的にも世界的にも異なっている世界で収集されるソースデータの違い
  3. データの集約を目的としたデータセットを作成するために使用される様々な方法やアルゴリズム
  4. ビジネスプロセスやデータベース構造、一貫性のない語彙やコーディングシステム、共有された患者データを保護するための非識別化手法など、データの全体的な品質に影響を与える医療データの様々な側面

B. Documentation of Processes for Managing Real-World Data

 データキュレーション及びデータ変換の際には、結果として得られるデータに対する信頼性を高めるために、適切なプロセスを実施する必要があります。
 これらのプロセスの文書化には、ソースデータシステムから最終的な解析用データセットに至るまでのデータの追加、削除、または変更に関する電子的な文書化(メタデータを用いた監査証跡、品質管理手順など)が含まれますが、これに限定されるものではありません。
 治験依頼者は、FDAがサポートする現行のデータ標準に適合させるためのデータの変更と、その変更による潜在的な影響についても、該当する医薬品の申請書に記載すべきです。

C. Considerations for Conforming Real-World Data to Currently Supported FDA Study Data Standards

 FDAは、RWDをデータソースとする試験データの基準について、さらなるガイダンスの発行および/またはカタログの更新を計画しています。
 現在、FD&C法第745A条(a)の対象となる提出物において、臨床および非臨床試験データ(RWDに由来するものを含む)を提出するスポンサーは、免除がない限り、試験データガイダンスに記載されているフォーマットおよびカタログに掲載されているサポートされている試験データ標準を使用することが求められています。
 スポンサーは、FDAに該当する医薬品を提出する際に、試験データ技術適合性ガイドに記載されている仕様、推奨事項、および一般的な考慮事項を参照する必要があります。
 FDAがサポートするデータ標準にRWDを適合させようとする場合、スポンサーは、該当する医薬品の申請において要求される形式で試験データセットを作成するために必要となる、関連するデータ加工、変換、またはマッピングを考慮するべきです。

 スポンサーは、適用される医薬品の申請においてRWDをソースとする試験データの提出を計画している場合、そのデータをFDAがサポートする現行のデータ標準に変換するためのアプローチについて、FDAの適切な審査部門と早期に協議するべきです。スポンサーは、プロトコール、データマネジメントプラン、最終報告書などにこれらのアプローチを記載すべきです。

 FDAは、現在サポートされているデータ標準(例えば、CDISCのSDTM)をEHRやクレームデータなどのRWDに適用するために、様々なアプローチが可能であると認識しています。

 RWDから得られた試験データをSDTMに変換し、併せて使用した変換方法とその根拠を適切に文書化しておくことで、該当する医薬品の申請時にFDAに提出することができます。

D. Considerations for Mapping Real-World Data to Study Data Submission Standards

 FDAは、ほぼすべてのデータ領域において、RWDとFDAがサポートするデータ標準との間で、使用される用語とその正確な意味に大きな違いがあることを認識しています。
 例えば、人種・民族の意味や使用されている特定の用語、薬剤の用語体系、バイタル測定のための医療記録の解釈などです。
 一見同じように記録されている変数(例えば、男性/女性)であっても、RWDとFDAがサポートするデータ標準の間では、これらの変数の定義方法に違いがある場合があります。
 例えば、変数としての性別は、CDISCの用語では身体的特徴に基づく概念として体系化されていますが、EHRではgender identity(性的同一性、性自認)を使用している場合があります。
 このような場合、スポンサーは、性別の変数やその他の変数をCDISCの用語にマッピングすることによる研究結果への潜在的な影響について文書化する必要があります。

 RWDに対して特定のCDISCデータエレメントの選択をしたスポンサーの論理的根拠の文書化と、両者の違いの文書化をすることは重要です。
 治験依頼者は、データマッピングの一般的な手法及び予想される影響についての説明を、「レビューアーズガイド(Study Data Reviewer’s Guide)」の一部又は付録として提供し、関連するドメインを明らかにすべきです。
 さらに、スポンサーは、使用されるすべてのデータエレメントの定義と、他のデータとの関係、起源、使用方法、形式などのエレメントに関するすべての関連情報を文書化したデータディクショナリーを含めるべきです。
 技術的な詳細については、「レビューアーズガイド(Study Data Reviewer’s Guide)」に記載されていない場合でも、Define-XMLファイル(付録参照)と関連するデータセット/ドメインの詳細なマッピングをレビューアーに案内することで参照することができます。

E. Considerations for Data Transformations

 スポンサーは、RWDをFDAがサポートするデータ標準に合致したデータに変換する際に、問題に直面することがあります。
 このような問題の事例としては、医療記録の複数の場所に存在するsemantic concepts(意味的な概念(用語))の管理(投薬情報など)、概念(薬剤や診断など)の一貫性のないコーディングやミスコーディング、試験中に発生したデータ収集やコーディング方法の変更(例:ICD-9コードからICD-10コードへの移行)、または情報の欠落(医療現場では情報が通常記録されていないか、データ入力が一貫していないため)などが挙げられます。

 スポンサーは、FDAがサポートするデータ標準への変換中に直面したデータの問題と、FDAがサポートするデータ標準の適用を可能にするためのアプローチの正当性を文書化すべきです。
 規格や用語のマッピングは、Define-XMLやドメインデータファイルを用いて行うことができます。
 ソースデータの問題を解消するために使用したアプローチの根拠と正当性の記述は、自由記述が必要となる可能性が高いことから、さらに、レビューアーズガイド(Study Data Reviewer’s Guide)の本文またはappendixに説明文を記載し、必要に応じてレビューアーにDefined-XMLやデータセット/ドメインの詳細を適切に指示すべきです。

IV. GLOSSARY

(略)

 以上がガイダンス案でした。

私見を述べると

 FDAの懸念には全く同感です。

 CDISCは計画された試験から収集されるデータを格納することを目的に作られましたので、Visitの概念やアウトカムを格納する変数が丁寧に設計されている一方、RWDは来院間隔はバラバラですし、アウトカムとなる変数が存在しない、もしくは複数のデータ項目からアウトカムを推察しなければならない場合もあるので、この両者の異なるコンテキストから収集されたデータを格納するための構造を考えると、自然と異なるものになります。

 また、データ構造だけでなく、データ値も異なります。
 治験で用いられる薬剤コードはWHODrug Globalだったりしますが、米国の電子カルテや医事請求データで用いられる薬剤コードはNDCやRxNormです。
 疾患名については、治験ではMedDRA(Medical Dictionary for Regulatory Activities)が使われますが、電子カルテや医事請求データでは少し前まではICD-9-CM、今はICD-10-CMが使われています。
 それぞれのシソーラスに含まれる用語の概念や粒度が異なるため、Mapper(cross-walk table)を作ることは一般的には困難ですし、少し強引に対応させようとすると意味が変わってしまう恐れが出てきます(情報量の低下や変質の発生)。

 そのためFDAは、そのような場合はレビューアーズガイド(Study Data Reviewer’s Guide)などにデータ変換の加工方法や、意味が変わりそうなところを詳しく説明するように求めていますが、CDISCへの加工作業自体もそうですが、その加工途中の問題や解消方法について文書化していくことはかなりのリソースが掛かることが想像されます。
 これを機に、CROがRWDのCDISC化サービスを展開していくかもしれませんが、治験データのCDISC対応を実施するよりコストが掛かるのは間違いなさそうです。

 臨床試験の比較対照群としてRWDを使用する場合は無理にでもCDISC形式に対応する必要がありますが、観察研究のデータとして提出する場合であればOMOP(Observational Medical Outcomes Partnership)などのRWDに適した形式の方が良いように思います。

業界の反応

このガイドライン案に対し30のコメントが提出されておりました。

Regulations.gov

 Clinical Path InstituteからはCDISCを超えて、コンセンサスの取れたターミノロジーやメカニズムに関するRWD特有のニーズを定義するべき、といった提案がなされていました。
 PhRMAも、RWDをCDISC標準に適合させる難しさに言及しつつ、Sentinel CDM(Common Data Model)やOMOPといった他の共通データモデルの利用を考慮することを求めていました。また、概念を変えずSDTMに正確にマッピングすることの難しさにも触れ、例えSDTMに変換したとしても、生データの値も残すことを推奨していました。
 Flatironも同様に、CDISC形式に完全にマッピングすることができない可能性に触れ、新しいデータ標準の採用の必要性に触れていました。
 同様の意見がIQVIAやJanssenなどからも出ており、私が感じたものと同じ懸念を表明していました。
 CDISCはFDAの案に賛同し、CDISC形式のより良い使い方を提案していましたが、CDISC形式以外のフォーマットの利用を求めるコメントが多かったこともあり、FDAも無視できないのではないかと思いました。

 その他色々なコメントがあったのですが、RWDで欠測データが発生する理由として、本当に「欠測」していた可能性と、例えば臨床医のメモのようなところに記録されたため構造化データ項目にデータが入力されなかった可能性に触れ、定型フィールドにデータが入力されず、非構造化フィールドに記録された場合には、自然言語処理やカルテレビューによりデータを抽出して補完することがありますが、この作業が「データキュレーション」の定義に含まれていないことを指摘していたASCO(Association for Clinical Oncology)のコメントは印象的でした。

あとがき

 少しフォーカスがずれますが、ASCOからのコメントは「我々はこのガイダンスが、RWDから得られるデータの標準化に関わる重要な課題を認識することから始まったことを評価する」という文章から始まっていました。

 ASCOが専門とする「腫瘍学」という最も標準化がしやすい分野からこのようなコメントが出ていることにも意味があると思います。

 RWDの標準化ができていないのは日本だけではなく、米国でもできていないことを端的に示していると思いました。

タイトルとURLをコピーしました