製薬協について 製薬協について

Topics | トピックス

最新号目次へ 既刊号一覧2014年5月以降2014年3月以前 pdf
180号タイトル
トピックス画像
前へ1234567次へ
本邦における医療データベースを用いた薬剤疫学研究の環境整備
ナショナルデータベースの試行的民間提供を終えて
line03 line03 line03

NDBのシステムとプログラム開発

民間提供模擬申し出を行った当時のNDBシステムは巨大なテキストデータ(ファイル)で一般に「データベース」と呼ばれる仕組みではありませんでしたが、2014年度末に大量データを扱いやすいリレーショナルデータベース(Oracle DB)に更新され、一般的なSQL文により扱うことが可能になりました。しかし、集計プログラムの作成には多くのリソースを要するため、ほかのNDBデータの第三者提供に極力影響を与えないように、集計プログラムを含めたNDB側の集計負荷をできるだけ減らす観点から、SQLのプログラムはすべて申し出者が作成することとなり[8]、2015年1月に開発に着手しました。2016年6月および7月には東京大学と京都大学に設置されたオンサイトリサーチセンターのテストでNDBシステムの性能は報告されていますが[10][11]、今回のプログラム開発当初は情報がなく手探りで試行しながらの作業となりました。NDBのシステムは診療年月単位で全データを抽出することは得意な半面、条件に合致しないレセプトの抽出(たとえば糖尿病治療薬を使用されていない患者をサブクエリーを用いて抽出する)にはSQLのプログラムに工夫が必要です。当初このことがわからず、一度に処理するデータをパフォーマンスに合わせてたとえば100万件ずつ繰り返し処理するプログラムを開発し、2015年3月初めに厚生労働省側に提出しましたが、かえって効率が悪いことがわかり、全面的にプログラムを書き直しました。これ以外にも後からわかったことがあり、計2回プログラムの書き直しを行いました。また、NDBにはプログラムテストの環境がなく、運用環境で全データを対象にテストされます。このため運用の合間に行う必要があることに加えてNDBシステムに直接アクセスは認められませんので、プログラム作成-提出・実行依頼-実行-エラー有無回答-確認-修正を繰り返す必要があり、この点でも時間を要しました。このように通常の運用の合間を縫いながら、断続的にテストを行ったため、一通りのテストを終えたのは2015年9月ですが、開発環境構築とテスト用ダミーデータの作成、2度の全面書き直しを含めても実質的には5ヵ月程度で開発を行いました。
 開発環境についてもう少し説明します。厚生労働省にIN HOUSEで構築・使用する開発・テスト環境とダミーデータの提供を依頼しましたが、学術研究等の申し出者用にも提供の準備がないため、集計に必要なNDB内の各テーブルを作成するSQL文例の提供を受けてNDBのシステムとは少し違いますが、まったく同じPL/SQLプロシージャが実行可能なOracle 11g上に開発環境を構築しました。さらに、プログラムのテストとパフォーマンス評価のため、1000万レセプト分のダミーデータを作成しました。ダミーデータはランダムなデータとしますと集計でヌル(ゼロ)が多く生じてしまいます。このためたとえば傷病名に糖尿病関連のコードがあり、薬剤に経口糖尿病薬のコードがある組み合わせが多くなるよう、また、抗がん剤や注射の抗菌薬は入院患者で多く、使用回数は短くなるよう実際にありそうな組み合わせで作成する必要があり、そのためのプログラムも作成しました。NDBのオンサイトリサーチセンターのシステムにもこのような開発・テスト環境の提供はないようです。Oracle 11gにはExpress Edition という無償版がありますので、ダミーデータと一通りの環境がDVDディスク等で提供されれば、オンサイトリサーチセンターを利用される学術研究等の方々も事前にある程度のプログラム開発が可能になり、効率的な研究が可能になるだけでなく、教育にも利用可能でしょう。






mark [10]
第31回レセプト情報等の提供に関する有識者会議 資料1-2「レセプト情報等オンサイトリサーチセンターの試行的利用に関する中間報告」(東京大学提出) http://www.mhlw.go.jp/stf/shingi2/0000128904.html
mark [11]
第32回レセプト情報等の提供に関する有識者会議 資料1「レセプト情報等オンサイトリサーチセンター(京都)パフォーマンステスト結果報告」(京都大学提出)http://www.mhlw.go.jp/stf/shingi2/0000131575.html

集計結果の用途

今回の試行的提供は主として医薬品の使用実態を性・年齢区分(5歳区切り)ごとに主にID1[12]で単一化した件数を患者数として集計しています。性・年齢区分ごとの患者数、1日投与量、肝疾患、腎疾患、糖尿病等の合併頻度、併用されている類薬の種類の数等、基本的なことですが今までよくわからなかった実態が全国レベルで初めて明らかになります。NDBのID1またはID2[13]を用いた名寄せには留意点があることが指摘されていますが[14]、NDBは悉皆性の高いデータであるため日本国民を母集団とする統計情報と組み合わせることが可能です。たとえば全レセプトを集計した「患者基礎集計」の「死亡」(傷病の転帰欄)と人口動態統計月報年計、透析患者を日本透析医学会の調査結果と照合することは精度評価の参考になると考えます。また、商業提供されているレセプトデータ等の偏りの評価や得られた結果を日本全体の情報として捉えることができるかどうかを考える際に「患者基礎集計」を用いて調査研究の精度を向上させることも可能でしょう。医薬品ごとの集計は医薬品の特性により用途、価値が異なります。たとえば小児に適応がない医薬品、適応はあっても剤形(含量)が合っていない等のアンメットニーズがある可能性、透析患者等禁忌の患者の状況等有用な情報が期待されます。特に75歳以上の慢性疾患、外来診療の医療情報データは限られていますので、実態の把握、商用データベースの74歳以下(あるいは65歳以下)の情報を後期高齢者に拡張して良いかどうかを考える際の妥当性評価に役立つでしょう。


mark [12]
保険者番号+被保険者番号+生年月日+性別 により生成されたハッシュキー
mark [13]
患者氏名+生年月日+性別 により生成されたハッシュキー
mark [14]
「レセプト情報・特定健診等情報データベースの第三者の提供 —利用を検討している方々へのマニュアル— http://www.mhlw.go.jp/file/06- Seisakujouhou-12400000-Hokenkyoku/0000117728.pdf
前へ1234567次へ
最新号目次へ 既刊号一覧2014年5月以降2014年3月以前

このページのトップへ