Points of View 製薬企業における医療情報の二次利用の現状

印刷用PDF

医薬産業政策研究所 主任研究員 岡田法大

要約

  • 厚生労働省で医療情報の二次利用に関する検討が始まった。既に国内外の製薬企業では二次利用が開始されているため、製薬業界における利用事例を調査する。
  • 世界と日本の医薬品事業売上の各上位5社の従業員が著者として含まれる学術論文の特徴を確認した。
  • 製薬企業が論文での公表を目的とした研究で利用した匿名化された医療情報の情報源を国別で確認すると、最も利用されていたのは米国の情報であり、大部分を占めていた。米国以外の国と比較すると日本の情報も多く利用されていた。
  • 利用頻度が多い情報は、請求データを中心とする多様な疾患の研究に利用できる大規模な情報と、構造化が難しい詳細な情報を含む疾患特異的な情報となっていることが推察された。
  • 現在検討されている日本の公的データベースの二次利用に関する議論は、既存の情報との差別化も考慮して、利用環境の整備や情報の拡充を検討していく必要があると考える。

1. はじめに

内閣に設置された医療DX推進本部は、2023年6月に医療DXの推進に関する工程表を公開した1)。工程表の中では、「医療情報の二次利用の環境整備」が一項目として計画されており、11月には厚生労働省の健康・医療・介護情報利活用検討会の下に、「医療等情報の二次利用に関するワーキンググループ」が新たに設置され、環境整備に向けた検討が始まっている2)。医療情報の二次利用とは、日常の診療等で得られる情報を、公衆衛生や新薬開発など情報を取得した本来の目的以外で利用することを指す。ワーキンググループでは、公的な医療データベースを中心に法制度の在り方や、情報連携基盤の整備の方向性を検討していく方針となっているが、製薬企業では、既に民間の商用データベースを中心に利用が始められている。本稿では、現状の製薬企業における医療情報の利用方法の特徴や利用目的等を、公開されている学術論文から確認することにより、本邦における医療情報の二次利用の促進の参考となる情報を示す。

2. 調査方法

公開情報から製薬企業の医療情報の二次利用の実態を調査するために、世界と日本の医薬品事業売上の各上位5社(2021年度)3)の従業員が著者として含まれる2021~2022年に公表された学術論文の特徴を確認した。論文の検索にはWeb of Scienceクラリベイトのトピック検索を利用した(検索語:“Real World” OR “Medical Record” OR “Health Record” OR “Electronic Data” OR “Administrative” OR “Claim” OR “Receipt” OR “Commercial”、“Commercially” OR “Database”)。検索で得られた論文の中から医療情報を二次利用して実施された研究の結果を報告している原著論文を調査の対象として抽出した。製薬企業が二次利用を行う患者単位の医療情報における個人情報保護の方法は、患者からの同意と匿名化の2種類に大別される4、5)。同意を基に構築されているバイオバンクの情報の利用に関しては過去に一部報告しており6)、本稿では、製薬業界からの利用が比較的多い、匿名化された情報の利用に注目して調査を行った。各論文の方法又は研究倫理に関する項を確認し、患者等の情報提供者の同意を必須とせず、各国の規制に従って個人情報が加工された個人単位の情報を利用した研究のみを抽出し、同意を取得して構築されているバイオバンクやレジストリを利用した研究は本稿では対象外とした。「3-4. 情報の利用用途」、以降の項では、世界の医薬品事業売上の上位5社の情報のみを利用して内容の精査を行った。

3. 結果

3-1. 対象論文

調査対象の論文は、世界の上位5社(世界大手企業)では630報、日本の上位5社(日本大手企業)では129報抽出された。個別の企業単位で見ると、世界大手企業では年間60報程度、日本大手企業では年間10報程度の論文が報告されていることが分かる(図1)。論文としての公表を目的とした利用は製薬企業における医療情報の利用の一部分であることも踏まえると、国内外の大手企業では全ての企業で継続的に一定数の利用がなされていると推察される。学術論文で公表されている匿名化された医療情報を二次利用した研究の情報源は保険請求の情報と診療記録が中心であり、情報の入手方法は主に、商用的に医療情報を扱っている企業との連携、又は医療情報を管理する医療機関との共同研究で実現されていた。

図1 各年の企業別論文数

3-2. 情報が取得された国(世界大手企業の利用)

はじめに、世界大手企業が利用した医療情報が取得された国を確認した。利用された医療情報が取得された上位10か国を図2に示す。全体の約70%の研究で米国由来の情報が利用されており、他国を大きく上回っていた。次点以降は僅差となっており、日本、ドイツ、英国と続いた。米国の情報を利用した研究が大部分を占めているが、その他の国と比較すると日本の情報も多く利用されていることが分かる。

図2 世界大手の製薬企業に利用された情報の由来国(上位10か国)

海外から日本の医療情報へのアクセス性を確認するために、海外の製薬企業が日本の医療情報をどのような方法で利用しているかを確認した。論文の著者の所属を確認すると、日本の情報が利用された論文の85%は、当該企業の日本の拠点の従業員が著者に含まれていることが分かった。それ以外の論文を確認すると、残りの大半の論文はOHDSI(Observational Health Data Sciences and Informatics)が開発しているCDM(Common Data Model)を利用した研究であった(表1)7)。CDMを利用すると、異なる情報源から得られた情報を共通のデータ形式に変換することが可能となるため、複数の情報を統合した解析を行うことができる。これらの結果から、海外の製薬企業が日本の情報にアクセスする際には、日本の拠点を経由又は日本の拠点が主導して研究を実施しているか、他国の情報とデータの形式を統一した上で、情報を統合して利用していることが分かった。また、日本の情報を利用した論文の著者の所属部署を確認すると、所属に関する記載のあった28報中22報と大半の論文で、Medical AffairsやMedical Science等のメディカルアフェアーズに携わる部署の従業員が著者に含まれていた。所属に関する記載がない論文も多く、限定的な情報ではあるが、論文での公表を目的とした情報利用では、これらの部署が関与して実施されていることが多いという実態が分かった。その他の国の情報を利用した論文では、最も利用頻度が多い米国の情報が利用される際には、米国の拠点の従業員が著者に含まれる割合は95%であった。今回の調査対象に米国を拠点とする企業が多いことも影響していると考えられる。日本の次に利用数が多いドイツとイギリスの情報が利用される際は、各国の拠点の従業員が著者に含まれる割合はそれぞれ57%と37%であった。欧州では、複数の国の情報を統合して実施された研究に含まれる一か国として情報が利用された事例も多いため、日本と比較すると、情報が取得された国以外の拠点の従業員が著者となっている論文も多く見られた。

表1)日本の情報へのアクセス方法

3-3. 情報が取得された国(日本大手企業の利用)

続いて、日本大手企業が利用した医療情報が取得された国を確認した。利用された医療情報が取得された上位5か国を図3に示す。全体の約52%の研究で米国由来の情報を利用しており、二番目以降は、日本、英国、スペイン、ドイツと続く。日本の製薬企業においても、日本の情報と比較して米国の情報を用いた研究の割合の方が多いことが分かった。

図3 日本大手の製薬企業に利用された情報の由来国(上位5か国)

日本大手企業が他国の医療情報をどのような方法で利用しているかを確認してみると、米国の情報が利用された論文の97%は、著者に当該企業の米国内の拠点の従業員が著者として含まれており、日本本社の著者が共著となっている論文は、今回の調査対象の論文の中には存在しなかった。日本の大手製薬企業が米国の医療情報を利用する際には、米国の拠点が主導して実施している研究が大半であることが分かった。英国、スペイン、ドイツの情報を利用する場合も、海外の現地拠点の従業員が著者となっている研究が大半であった。欧州の医療情報を利用した研究では、複数の国の情報を統合して実施された研究に含まれる一か国として情報が利用された事例も多かった。

3-4. 情報の利用用途

医療情報がどのような研究に利用されたかを調査するために、世界大手企業の論文タイトルを調査した。単語単位のbi-gram(隣接する二つの単語からなる文字列)を用いて論文に使用された表現の頻度を集計した(表2)。上位には「治療パターン」や「医療リソースの負担」、「経済的負担」という語句が確認された。これらは、自社製品の価値最大化や事業戦略の策定、臨床研究の実施計画書の作成に資する情報として利用されていると考えられる。大まかな利用目的の分布を確認するために、明示的な用語がタイトル又はアブストラクトに利用されている論文を集計した(表3)。これらの結果からも、疾患の理解や治療実態を把握する調査が中心であった。

表2 論文タイトルに利用された頻出語句(bi-gram)
表3 医療情報の利用目的の大別

次に、調査対象の論文の対象疾患を調査した。疾患は各社の製品や開発パイプラインに依存するため、今回の調査が少数の企業の情報であることを踏まえて、参考値として上位10疾患分類を提示する(図4)。今回の調査対象となっている製薬企業では、新生物や、循環器系の疾患、神経系の疾患を対象とした研究が多くみられたが、特定の疾患に対する研究に限らず、幅広い疾患で医療情報が利用されていることが分かる。

図4 研究の対象となった疾患(参考情報)

3-5. 有効性評価における利用

製薬企業では上記で述べたように様々な用途で医療情報が二次利用されているが、その中でも薬事申請での利用についての議論が活発化している8)。FDA等の規制当局からも、承認申請に医療情報データベース等を利用する際のガイダンスが発出されており、臨床試験の実施が困難な希少疾患等の医薬品開発への利用が期待されている9、10)。現時点では、学術論文の調査では有効性の評価に利用されている事例は相対的に少ないが、今回は限られた事例の中から今後の医療情報利用の参考とするために詳細を確認した。

今回の調査対象の論文から、対照群を設置して医薬品の有効性比較を行っている論文と外部対照として医療情報を利用している研究を抽出し、それぞれの傾向を確認した。二次利用した医療情報の中で注目する医薬品を使用した群と対照群の双方を設定して、医薬品の有効性の有無について言及した論文は、630報中61報(9.7%)であった。これらの研究の有効性評価の方法を確認すると、事象発生までの期間を両群で比較するTime to eventの解析を実施している研究が61報中52報(85.2%)と大半を占めていた。二次利用される医療情報は、医療機関で治療が行われなければ情報として取得することが難しく、日常診療の中では、臨床試験のような定められた時点での情報の入手が困難であるという欠点があり、評価方法の大半が事象発生までの期間となっている背景にはこのような要因も影響していると考えられる。研究対象となっている疾患を確認すると、循環器系の疾患が61報中22報(36.1%)、新生物が21報(34.4%)と二つの疾患領域が大半を占めていた。循環器系の疾患では、バリデーション研究が実施されている虚血性脳卒中や静脈血栓塞栓症の診断を評価指標とする研究が多く、新生物では死亡や治療の中止・変更を評価指標とする研究が多かった。日常診療で取得されている情報は、個別の治療法の評価を目的に取得されている情報ではないため、一般的な診断定義が確立されている疾患や死亡等の医療機関による測定方法の違いの影響を受けにくい評価項目が利用されていることが分かる。医薬品の有効性評価では日常診療では測定が行われないような指標を利用する疾患も存在するため、医療情報の二次利用のみで、有効性の評価が可能となる疾患は現状では限定されていることが推察される。

さらに外部対照として医療情報を利用している研究を確認する。臨床試験等で単群の治療成績の情報が得られた医薬品の有効性比較を行うために、二次利用した医療情報から対照群のみを構成して比較を行う外部対照としての利用は、630報中8報(1.3%)に留まっていた。これらの全ての研究の疾患領域は新生物であり、事象発生までのTime to eventの解析を実施していた。さらに、情報源を確認すると、8報中7報は米国のFlatironの情報を用いて実施されたものであった。外部対照として医療情報を利用する際には、前述の有効性評価における制約に加えて、臨床試験での選択除外基準を満たす症例を抽出するための疾患に関連する詳細な情報も必要となる。今回の調査対象論文の大半で用いられていた保険請求の情報のみでは、これらの詳細な情報を入手することが困難であることも、有効性評価の研究が少数にとどまることの要因であると考えられる。一方で、Flatironのデータベースは疾患特異的に構築されているため、予後に影響を与える因子の情報も入手可能となっている。医療情報の二次利用により有効性の評価を行うためには、このような疾患特有の予後因子や疾患のサブタイプ、医薬品の有効性や安全性のアウトカムに関連する情報を構造化した疾患特異的な情報の入手が重要となることが推察される。

3-6. 各国で二次利用された情報の特徴

各国で利用されている情報の特徴を確認する。保険請求の情報や診療記録を利用したことのみの記載に留まる論文も存在しているため、正確な数値を集計することは不可能であったが、特徴把握のために論文内に情報源が明記されており、利用頻度の高い情報を紹介する。

米国由来で利用頻度の高い上位3つの情報源は、Merative(IBM)のMarketScanが439報中119報、UnitedHealth GroupのOptumが118報、Flatironが56報となっていた。MarketScanとOptumは保険請求の情報とEMR等に由来する情報を提供している11、12)。MarketScanとOptumには、それぞれ1億人以上の医療情報が含まれており、製薬企業が利用できる情報としては最大規模であることが、利用頻度が高くなっている大きな要因の一つと考えられる13)。Flatironは疾患特異的なEHRシステムで取得した診療記録に加え、遺伝子変異や読影レポート等から得られる情報が利用可能となっている14)。薬事申請に利用された事例もあり、疾患領域が悪性腫瘍に限定されているにも関わらず利用数が多くなっている15)。米国では、民間の商用データベース以外にも、MedicareやMedicaidを運営しているCMS(Centers for Medicare & Medicaid Services)も二次利用可能な情報を整備しており、それらを利用した研究も一部存在していた。

日本由来で利用頻度の高い情報源は、JMDCが46報中23報、メディカル・データ・ビジョンが16報となり、この二つの情報源が大半であった。双方が保険請求を基本とした情報であり、3,000万人前後の情報が利用可能となっている。ドイツ由来で利用頻度の高い情報は、InGef(Institute for Applied Health Research Berlin)が37報中10報、IQVIAが9報、AOK PLUSが5報であった。InGefとAOK PLUSはドイツの法定健康保険の請求データの情報であり、InGefでは800万人前後の情報が利用可能となっている16)。IQVIAは各国で多様な医療情報を提供しているが、ドイツではDisease Analyzerという診療記録に由来する情報の利用割合が高い。英国由来で利用頻度の高い情報は、CPRD(Clinical Practice Research Datalink)が30報中7報、RCGP RSC(Royal College of General Practitioners Research and Surveillance Centre)が6報であった。CPRDは英国の公的機関が提供する診療記録に由来する情報であり、臨床検査値の情報や死亡情報等とも連結が可能で、情報の幅が広いことが特徴である17)。RCGP RSCも医療機関から収集された診療記録が情報源となっている18)。保険請求に由来する情報の利用が多数を占める他国の状況と比較すると英国の情報は異なる傾向が見られる。

利用頻度の高い情報の特徴を整理すると、保険請求の情報を軸として、患者の網羅性が高く、多様な疾患や用途で利用できる汎用的な情報の利用頻度が最も高いことが分かる。これらの情報は、疾患の理解や治療推移の実態把握等の幅広い目的で非常に有益な情報となっている。一方で、詳細な有効性や安全性を把握するためには、現時点では構造化が容易でない疾患特異的な情報も併せて必要となる場面が多い。米国のFlatironは、多様な種類の情報を含んでおり、これらの需要にも応えることが可能な情報として利用数を伸ばしている。これらの結果から、現時点では構造化が容易な情報を大量に蓄積した汎用性の高い情報と、構造化が難しい詳細な情報を含む疾患特異的な情報の2種類の情報利用が主流となっていると推察される。

4. まとめ・考察

本稿では、国内外の製薬企業が論文化を目的として利用した医療情報の特徴を確認した。国内外双方の製薬企業において、最も多く利用されている医療情報は、民間の商用データベースを中心とした米国の情報であり、海外大手の製薬企業が利用している情報の大部分を占めていた。日本の民間の商用データベースの情報も、米国を除くその他の国と比較すると数多く利用されていることが分かった。日本の情報を利用した研究では、メディカルアフェアーズに携わる部署からの利用が中心であった。メディカルアフェアーズにおける医療情報の二次利用の詳細は、日本製薬工業協会の医薬品評価委員会によって昨年調査結果が公表されており、疾患疫学、処方パターンなどの実態調査を目的として利用する会社が最も多いことが報告されている19)

請求データを中心とする多様な疾患の研究に利用できる汎用性の高い情報は、各国で整備が進められている。これらの情報で求められる要素は、情報に含まれる人数や一般化可能性、患者の追跡性等の情報量が重要となると考えられる。日本においては、現時点で官民が独立して二次利用可能なこれらの情報を収集しており、今後それぞれがどのような役割となっていくのかについては、注目していく必要があるだろう。このような構造化が比較的容易な情報は、国際的な連携も検討が始められている。海外で実施される複数の国の情報を統合して実施される研究においても日本人の情報を含んだ臨床的な知見を得るためには、CDMを利用した情報の変換を進めていくことも重要であると考える。

疾患特異的な情報は、悪性腫瘍を対象として主に米国で準備が進んでいる。利用頻度が高かったFlatironの情報に加えて、McKesson Specialty HealthのiKnowMed EHRシステムで取得された情報を利用した事例も存在した。iKnowMedの情報も悪性腫瘍に対する医薬品の薬事申請に利用された経験があり、医薬品の有効性や安全性の比較を行う際には、請求データに含まれない疾患特異的な情報も重要であることが分かる20)。その中でも有効性の評価は、前述した通り、疾患によって二次利用での評価に適否が存在していると考えられる。悪性腫瘍やCOVID-19などの疾患では、臨床試験においても通常の診療記録からも抽出が可能となる死亡や酸素補給を伴う入院等を評価指標としたTime to eventの解析が実施されているため親和性が高い。一方で、定期的な臨床検査値を評価する糖尿病や、日常診療で複数回取得されることが稀な認知機能テストを評価する認知障害は二次利用のみでの評価は困難となる。前向きな疾患レジストリの代わりに日常診療で得られた情報の利用を検討する際には、疾患に応じて代替可能性の評価が重要となる。

製薬企業が二次利用している日本の情報は、民間の商用データベースが中心となっている。匿名化された情報の利用という点では、本邦では2018年に施行された次世代医療基盤法が取り上げられることが多いが、本制度は利用数の少なさが指摘されている。今回の調査対象の論文の中では、ファイザーの従業員が著者に含まれる利用事例の1報のみであったが、この論文は複数のメディアに取り上げられる大きな成果となっている21)。この研究成果は、診療記録の非構造化情報に対して、自然言語処理を行っている点が構造化情報のみを扱う他の大多数の論文と異なっている。昨年の法改正において仮名加工医療情報が利用できることとなり、今後より詳細な非構造化情報が利用できるようになると、今回の成果のような人工知能の開発等を目的とした研究において、請求データを中心とした他のデータベースとの差別化が進み、より利用価値の高い情報となっていくことが期待される。厚生労働省のワーキンググループの構成員からは、臨床研究や製薬会社の研究等では、民間の商用データベースの方が、公的な医療データベースと比較して利用しやすいことも指摘されており、公的なデータベースは、情報へのアクセスの容易さや分析におけるデータ操作の容易さの向上も求められている22)。以前のニュースにおいても、公的機関と次世代医療基盤法の認定作成事業者が収集する情報の役割分担が望まれることについて触れた23)。今回検討が始まった公的な医療データベースの二次利用基盤に関しても、既に利用が進んでいる民間の情報を含めて、情報の網羅性や収集する情報の種類、情報の連結等の観点でどのような立ち位置を目指すのかを明確にし、利用環境の整備や情報の拡充を検討していくことが重要であると考える。

このページをシェア

TOP