PINN Framework

1. 概述

PINN_Framework 是一个基于物理信息神经网络 (Physics-Informed Neural Network, PINN) 的地貌演化模拟框架。它是从 PINN_Fastscape_Framework 精简而来，旨在提供一个更简洁、聚焦于单一主线实现的代码库。

接手运行请先看 RUNBOOK.md。那里按环境配置、数据生成、训练、单步验证、多步 rollout 验证给了完整命令。

该框架的核心目标是：

模拟地貌演化: 使用 PINN 近似求解地貌演化的控制偏微分方程 (PDE)。
可微分计算: 实现端到端可微分，支持基于梯度的参数反演（例如，推断抬升率场）。
简洁高效: 移除冗余组件，专注于一条经过验证的核心实现路径，提高代码可维护性和易用性。

当前 V2 底座定位:

这个版本把训练产品链路和第一版神经算子底座打通：配置、数据契约、模型初始化、loss 组合、训练循环、检查点和测试都走同一套可验证路径。它保留 AdaptiveFastscapePINN 和 LandscapeUNetPINO 作为 baseline，同时将默认 operator 切换为 LandscapeNeuralOperator。

主线实现:

模型:
- AdaptiveFastscapePINN: 旧 baseline，支持多分辨率处理和双输出（状态和导数）。
- LandscapeUNetPINO: U-Net step operator baseline，显式输入 h, K_f, K_d, U, m, n, precip, t, x, y，输出 state 和 dh/dt。
- LandscapeNeuralOperator: 当前默认模型，使用 UNO 编解码骨架、FNO 频域层和 soft flow-graph 水文分支。
物理计算:
- 汇水面积: 保留 IDA/D∞ 路径用于诊断和旧实验；新增 soft_mfd 可微多流向汇水面积作为训练默认路径。
- 其他: 包括坡度、拉普拉斯算子、河流侵蚀和坡面扩散的可微实现。
损失函数:
- PDE 残差: compute_pde_residual_dual_output，利用模型的双输出来计算物理损失 (位于 src/losses.py)。
- Step-operator 监督: compute_increment_loss 约束 Δh，compute_temporal_derivative_loss 用有限差分监督 dh/dt 输出头。
- 其他: 包括数据损失 (compute_data_loss) 和平滑度惩罚 (compute_smoothness_penalty)。
训练器: 简化的 PINNTrainer (位于 src/trainer.py)，专注于双输出模型的训练流程。
数据契约:
- pair 模式: 兼容旧数据 initial_topo -> final_topo。
- trajectory 模式: 将 trajectory_topo[T, 1, H, W] 展开为连续的 state_t -> state_next 单步样本。
优化器: 基于 PyTorch 的参数优化器 (ParameterOptimizer 位于 src/optimizer_utils.py)，用于反演问题。

2. 目录结构

PINN_Framework/
├── configs/                # 配置文件 (YAML)
│   ├── data_gen_config.yaml   # 数据生成参数
│   ├── train_config.yaml      # 模型训练参数
│   └── optimize_config.yaml   # 参数优化/反演参数
├── data/                   # 数据存储目录 (建议结构)
│   ├── processed/          # 处理后的训练/验证数据 (.pt 文件)
│   │   └── resolution_HxW/ # 按分辨率组织的子目录 (可选)
│   └── observations/       # 观测数据 (例如，目标 DEM .npy 文件)
├── scripts/                # 可执行脚本
│   ├── generate_data.py    # 生成模拟数据 (使用 fastscape/xsimlab)
│   ├── train.py            # 训练 PINN 模型
│   ├── train_operator.py   # 使用 LandscapeNeuralOperator 配置训练新版 step operator
│   ├── verify_operator_training.py # 生成小型临时数据并验证训练链路
│   └── optimize.py         # 运行参数优化/反演
├── src/                    # 框架源代码
│   ├── __init__.py
│   ├── data_utils.py       # 数据集和数据加载器
│   ├── losses.py           # 损失函数 (数据, 双输出PDE, 平滑度)
│   ├── models.py           # PINN baseline 与 LandscapeNeuralOperator 架构
│   ├── optimizer_utils.py  # 参数优化工具
│   ├── physics.py          # 物理计算 (导数, IDA/D∞, soft-MFD, PDE项)
│   ├── trainer.py          # 训练循环管理器
│   └── utils.py            # 通用辅助函数 (日志, 配置, 设备等)
├── tests/                  # 测试代码 (待补充)
│   └── __init__.py
├── environment.yml         # Conda 环境依赖文件
├── requirements.txt        # pip 开发/测试依赖文件
└── README.md               # 本文件

3. 安装

建议使用 Conda 来管理环境，以确保所有依赖项（包括 fastscape 及其 Fortran 依赖）正确安装。

安装 Conda: 如果尚未安装，请从 Anaconda 或 Miniconda 官网下载并安装。
创建环境: 打开终端（Anaconda Prompt, PowerShell, bash 等），导航到 PINN_Framework 根目录，然后运行：
```
conda env create -f environment.yml
```
这将创建一个名为 pinn-framework-env 的新环境并安装所有核心依赖。
激活环境: 每次运行代码前，激活环境：
```
conda activate pinn-framework-env
```
(可选) 安装开发/测试工具: 如果需要运行测试或进行开发，在激活环境后，使用 pip 安装 requirements.txt 中的工具：
```
pip install -r requirements.txt
```

4. 使用方法

框架的使用主要通过 scripts/ 目录下的脚本进行，并通过 configs/ 目录下的 YAML 文件进行配置。

配置:
- 修改 configs/ 目录下的 .yaml 文件以设置您的实验参数。
- data_gen_config.yaml: 配置数据生成参数，如样本数量、分辨率、参数范围、输出目录等。
- train_config.yaml: 配置模型训练参数，如数据路径、模型超参数、优化器、学习率、损失权重、训练轮数、检查点路径等。
- optimize_config.yaml: 配置参数优化（反演）任务，如训练好的模型路径、观测数据路径、要优化的参数及其初始猜测/边界、优化器设置等。
- 注意: 配置文件支持使用 ${...} 语法进行变量插值（需要安装 omegaconf）。
- data.sample_mode 控制训练样本模式：
  - pair: 使用旧版单步 pair 文件。
  - trajectory: 一个 .pt 轨迹文件会被展开为多个连续单步 transition。
生成数据:
- 配置好 configs/data_gen_config.yaml。
- 运行脚本：
```
conda activate pinn-framework-env
python scripts/generate_data.py --config configs/data_gen_config.yaml
```
- 生成的数据将保存在 data_gen_config.yaml 中指定的 base_output_dir 下的对应分辨率子目录中。
训练模型:
- 确保已生成训练数据。
- 配置好 configs/train_config.yaml，特别是数据路径和模型/训练参数。
- 运行脚本：
```
conda activate pinn-framework-env
python scripts/train.py --config configs/train_config.yaml
```
- 训练日志、TensorBoard 文件和模型检查点将保存在 train_config.yaml 中指定的 output_dir/run_name 下。
新版 operator 架构训练入口：
```
conda activate pinn-framework-env
python scripts/train_operator.py --config configs/train_operator_config.yaml
```
快速验证训练链路：
```
python scripts/verify_operator_training.py
```
训练完成后的独立验证入口：
```
python scripts/evaluate_operator.py \
  --config configs/train_operator_config.yaml \
  --checkpoint results/<run_name>/checkpoints/best_model.pth \
  --split val \
  --output results/<run_name>/evaluation_val.json
```
这个脚本会在 held-out split 上比较三类结果：
- learned: 训练好的 neural operator。
- persistence: 不发生地形变化的 baseline。
- physics_euler: 使用当前 PDE 显式推进一步的 baseline。
重点看 state_rmse、delta_rmse、derivative_rmse、slope_rmse、physics_loss，以及 improvement.state_rmse_vs_*。如果训练 loss 下降但验证集 state_rmse/delta_rmse 不降，或者 improvement 长期为负，就不能认为模型真的学到了可泛化 operator。

多步 rollout 验证入口：
```
python scripts/evaluate_rollout.py \
  --config configs/train_operator_config.yaml \
  --checkpoint results/<run_name>/checkpoints/best_model.pth \
  --split val \
  --steps 10 \
  --output results/<run_name>/rollout_val.json
```
Rollout 验证会从同一条 teacher trajectory 的第 0 帧开始，让模型把自己的预测反复喂回去。重点看 per_step["1".."N"].learned.state_rmse 是否随步数快速爆炸，以及每一步相对 persistence 和 physics_euler 的 improvement 是否稳定为正。

当前默认 loss 组合包括：
```
loss_weights:
  data: 1.0
  increment: 0.5
  derivative_data: 0.1
  physics: 0.1
  smoothness: 0.001
```
其中 increment 和 derivative_data 是 operator 训练目标，用来避免模型只拟合最终 DEM，却没有学稳地形变化量和 dh/dt。

当前训练不会在每个 loss 里重新运行 Fastscape。Fastscape/xsimlab 是离线 teacher，用来生成 .pt 样本或 trajectory；训练时只读取保存的数据，并用 PyTorch 内部的 soft_mfd PDE residual 约束模型。
参数优化 (反演):
- 确保已训练好模型并准备好观测数据。
- 配置好 configs/optimize_config.yaml，特别是模型检查点路径、观测数据路径、要优化的参数和固定参数。
- 运行脚本：
```
conda activate pinn-framework-env
python scripts/optimize.py --config configs/optimize_config.yaml
```
- 优化结果（例如，推断出的参数场）和日志将保存在 optimize_config.yaml 中指定的 output_dir/run_name 下。

5. 核心组件

src/models.py: 定义了 AdaptiveFastscapePINN、LandscapeUNetPINO、LandscapeNeuralOperator，以及 build_model_from_config 模型工厂。
src/physics.py: 实现了地貌演化 PDE 中的关键物理过程，包括旧 IDA/D∞ 汇水面积和训练默认的 soft_mfd 可微汇水面积。
src/losses.py: 实现了用于训练 PINN 的损失函数，包括数据损失、基于双输出的 PDE 残差损失和平滑度惩罚。
src/trainer.py: 包含 PINNTrainer 类，管理训练和验证循环。
src/optimizer_utils.py: 包含 ParameterOptimizer 类和 optimize_parameters 函数，用于执行参数反演。
src/data_utils.py: 定义了 FastscapeDataset 类和 create_dataloaders 函数，用于加载和处理模拟数据。
src/utils.py: 包含日志记录、配置加载、设备管理等通用辅助函数。

6. 后续工作

M1: 加入多步 rollout 验证，评估误差是否随时间爆炸。
M2: 对 soft_mfd 与 Fastscape/teacher 的离散汇水面积做系统对齐评估。
M3: 加入无量纲化、质量/通量守恒 loss，以及更明确的水文拓扑诊断。
M4: 扩展状态变量到沉积厚度、降水、base level、岩性和挠曲，再进入地表-地下耦合接口。

7. 验证状态

当前底座验证命令：

pytest -q

当前通过结果：

163 passed, 1 skipped

另有 1 个旧 IDA/D∞ 低迭代数测试的预期收敛 warning；默认 operator 训练已切到 soft_mfd。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PINN Framework

1. 概述

2. 目录结构

3. 安装

4. 使用方法

5. 核心组件

6. 后续工作

7. 验证状态

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
configs		configs
scripts		scripts
src		src
tests		tests
.gitignore		.gitignore
INSTALL.md		INSTALL.md
README.md		README.md
RUNBOOK.md		RUNBOOK.md
Technical Reports.md		Technical Reports.md
environment.yml		environment.yml
pytest.ini		pytest.ini
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

PINN Framework

1. 概述

2. 目录结构

3. 安装

4. 使用方法

5. 核心组件

6. 后续工作

7. 验证状态

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages