この版は、学習と Web 対局に必要なものだけを残した軽量構成です。
要点:
- 単一モデル運用:
checkpoints/model.ptだけを使い、他の.ptは使いません。 - native collector は並列収集に対応しています。
- 量子将棋は
quant_native_cpp、乱将棋はrans_native_cppを推奨します。 --collector_workers 0は推奨値を自動選択します。- 量子将棋: 2 worker
- 乱将棋: 4 worker
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
python tools/build_native.pyfind checkpoints -type f -name '*.pt' ! -name 'model.pt' -delete
python -m backend.qs.train_policy_value \
--init_model checkpoints/model.pt \
--out checkpoints/model.pt \
--minutes 360 \
--games_per_cycle 256 \
--epochs_per_cycle 1 \
--batch_size 1024 \
--lr 8e-4 \
--device cpu \
--max_ply 1000 \
--repeat_draw 4 \
--eps 0.22 \
--select_temp 0.80 \
--target_temp 1.10 \
--selfplay_mode quant_native_cpp \
--collector_workers 0 \
--micro_limit 2 \
--micro_random_extra 1 \
--micro_prior_scale 0.02 \
--position_stride 8 \
--tail_keep 10 \
--informative_value 0.30 \
--outcome_blend 0.20 \
--search_converge_mode none \
--selected_converge_mode local \
--selected_converge_time_budget_ms 0.15 \
--selected_converge_approx_iters 1 \
--variant quantumfind checkpoints -type f -name '*.pt' ! -name 'model.pt' -delete
python -m backend.qs.train_policy_value \
--init_model checkpoints/model.pt \
--out checkpoints/model.pt \
--minutes 360 \
--games_per_cycle 256 \
--epochs_per_cycle 1 \
--batch_size 1024 \
--lr 8e-4 \
--device cpu \
--max_ply 1000 \
--repeat_draw 2 \
--eps 0.30 \
--select_temp 1.00 \
--target_temp 1.20 \
--selfplay_mode rans_native_cpp \
--collector_workers 0 \
--micro_limit 2 \
--micro_random_extra 1 \
--micro_prior_scale 0.02 \
--position_stride 8 \
--tail_keep 8 \
--informative_value 0.30 \
--outcome_blend 0.20 \
--search_converge_mode none \
--selected_converge_mode local \
--selected_converge_time_budget_ms 0.10 \
--selected_converge_approx_iters 1 \
--variant ranshogiPYTHONPATH=. python tools/benchmark_native_parallel_speed.pypython run_server.py --host 127.0.0.1 --port 8000ブラウザ:
http://127.0.0.1:8000/
- 量子将棋:
Variant = quantum - 乱将棋:
Variant = Ran Shogi / 乱将棋