SRWS-PSGで、DeSCの処理コードを共有するためのレポジトリです。マスタ以外のデータや処理済のファイルはこのレポジトリ外で管理してください(.gitignoreで指定)。
このリポジトリは、DeSCデータベースを用いたアルコール依存症患者に対する飲酒量低減治療の現況・早期介入としての意義・転帰に関する観察研究のための解析コードを提供します。
- 飲酒量低減治療を受けている患者のベースライン特性を明らかにする
- 飲酒量低減治療が行われる医療機関の特徴を把握する
- 飲酒量低減治療がアルコール依存症への早期介入に寄与しているかを評価する
- 治療開始前後の肝機能・生活習慣・飲酒行動等の転帰を3群(飲酒量低減目標治療群、断酒目標治療群、治療目標不明群)で比較する
Clineを使うことを前提に、メモリーバンクを設定しています https://docs.cline.bot/improving-your-prompting-skills/custom-instructions-library/cline-memory-bank
master/フォルダには、分析や処理に必要なマスターデータと関連ドキュメントが格納されています。
master\optimized_database_schema.json が最重要なデータベースのスキーマです。
data定義書_table定義書.xlsx- テーブル構造と各フィールドの定義情報er_figure.md- Mermaid形式のER図(関係図)ER図.pdf- PDFフォーマットのER図healthcare-database-flowchart.svg- svgフォーマットのER図
被保険者台帳を中心として以下のテーブル群が関連付けられています:
- 組織・所属期間
- 健診・問診データ
- kencomテーブル群(登録、利用機能、歩活参加、記事閲覧など)
- ライフログテーブル群(歩数、血圧、体重、血糖など)
- アンケートテーブル群(質問、選択肢、回答)
- レセプトテーブル群(基本情報、医療機関、傷病、医薬品、診療行為)
ほとんどのファイルは.feather形式で保存されています(高速なデータ読み込みが可能なフォーマット)。
m_med_treat_all.feather- 医科診療行為マスターm_med_treat_all_unique.csv- 医科診療行為マスター(重複なし、CSV形式)m_dental_treat_all.feather- 歯科診療行為マスターm_spec_equip_all.feather- 特定器材マスター
m_drug_main.feather- 医薬品メインマスターm_drug_ingredient.feather- 医薬品成分マスターm_drug_rece_all.feather- レセプト医薬品マスターm_drug_who_atc.feather- WHO ATCコードマスターm_drug_ephmra_atc.feather- EphMRA ATCコードマスターm_dispense_all.feather- 調剤マスター
m_disease.feather- 疾病マスターm_icd10.feather- ICD-10コードマスター
m_hco_med.feather- 医療機関マスターm_hco_xref_specialty.feather- 医療機関×診療科クロスリファレンス
m_survey_question.feather- アンケート質問マスターmerged_m_survey_choice.feather- アンケート選択肢マスター(マージ済)
m_version.feather- マスターバージョン管理m_version_drug.feather- 医薬品マスターバージョン管理
DeSC-Nalmefene/
├── data/
│ ├── raw/ # 生データへのリンク(バージョン管理外)
│ ├── interim/ # 中間処理データ
│ └── processed/ # 解析用データセット
├── scripts/
│ ├── preprocessing/
│ │ ├── python/ # Python前処理スクリプト
│ │ └── r/ # R前処理スクリプト
│ ├── analysis/ # 解析スクリプト
│ ├── helpers/ # ユーティリティ関数
│ └── validation/ # データ検証関数
├── outputs/
│ ├── logs/ # 処理ログ
│ ├── reports/ # 生成されたレポート
│ ├── figures/ # 生成された図
│ └── tables/ # 生成された表
└── README.md # プロジェクト概要
このプロジェクトでは、データファイルをリポジトリ外部に保存しています。以下の手順で環境を設定できます。
-
リポジトリをクローンした後、VSCodeでプロジェクトを開きます。
-
Cline拡張機能がインストールされていることを確認します。
-
Clineに以下のように入力するだけで初期設定が完了します:
このレポジトリの初期設定をして -
Clineが以下の作業を自動的に行います:
.env.exampleから.envファイルを作成- 必要なPythonパッケージのインストール
- データディレクトリと出力ディレクトリの設定確認
自分で設定する場合は、以下の手順に従ってください:
-
リポジトリをクローンする
git clone https://github.com/SRWS-PSG/DeSC-Nalmefene.git cd DeSC-Nalmefene -
必要なパッケージをインストールする
pip install -r requirements.txt
-
環境変数ファイルを設定する
.env.exampleファイルをコピーして.envファイルを作成
copy .env.example .env # Windowsの場合 # または cp .env.example .env # Linux/Macの場合
.envファイルを編集し、実際のデータディレクトリと出力ディレクトリを設定
# 例: DATA_ROOT_DIR=D:\\DeSC_data # 実際のデータディレクトリパスに置き換え OUTPUT_DIR=D:\\DeSC_output # 実際の出力ディレクトリパスに置き換え -
出力ディレクトリが存在しない場合は作成
mkdir -p data/{raw,interim,processed} mkdir -p outputs/{logs,reports,figures,tables}
- Python 3.9以上
- 必要なパッケージ:
- polars
- pyarrow
- psutil
- tqdm
- R 4.0.0以上
- 必要なパッケージ:
- dplyr
- tidyr
- arrow
- gtsummary
- flextable
- officer
- mice
- epiR
Python前処理スクリプトを実行して、DeSCデータベースから中間データを作成します:
python scripts/preprocessing/python/process_desc_data.py次に、R前処理スクリプトを実行して、解析用データセットを作成します:
Rscript scripts/preprocessing/r/create_analysis_datasets.RR Markdownを使用して解析レポートを生成します:
Rscript -e "rmarkdown::render('scripts/analysis/analysis_main.Rmd', output_dir = 'outputs/reports')"または、個別の解析スクリプトを実行します:
Rscript scripts/analysis/table1_generator.Routputs/tables/table1.html: ベースライン特性比較表(HTML形式)outputs/tables/table1.docx: ベースライン特性比較表(Word形式)outputs/reports/analysis_main.html: 解析レポート
- データディレクトリには、masterフォルダと同様のデータファイルが必要です
.envファイルはバージョン管理対象外のため、各自の環境に合わせて設定してください- 大規模データの処理には十分なディスク容量とメモリが必要です
- 実際のDeSCデータは、セキュリティ上の理由からリポジトリには含まれていません。
- データへのアクセスには適切な権限が必要です。
既存のPythonスクリプトでconfig.jsonを直接読み込んでいる場合、以下のように修正してください:
# 変更前
with open('config.json', 'r', encoding='utf-8') as f:
config = json.load(f)
# 変更後
from data_definition_processing.config_loader import load_config
config = load_config()- 環境変数が読み込まれない場合は、
.envファイルの形式を確認してください - データディレクトリにアクセスできない場合は、パスが正しいか確認してください
- 出力ディレクトリに書き込めない場合は、権限を確認してください
- Devin
このプロジェクトは非公開です。無断での使用・配布は禁止されています。