## 練習用コンペ - テーブルコンペ(分類) - [x] titanic - テーブルコンペ(回帰) - [x] House Prices: Advanced Regression Techniques - テーブルコンペ - [ ] Restaurant Revenue Prediction - [x] Home Credit Default Risk - 画像系 - [x] Dogs vs. Cats Redux: Kernels Edition ## 前処理 - [ ] PCA による次元圧縮 - [ ] 値が1つしかない特徴量(クレンジング対象)を自動的に検出して警告する EDA スクリプト - [ ] 外れ値が含まれる特徴量(クレンジング対象)を自動的に検出して警告& plot する EDA スクリプト ## 検証 - [x] k-cold CV 時の各 k でのモデルの clone() 有無 - [ ] 時系列データに対する k-fold CV ## 可視化 - [x] EDA スクリプト - [x] UMAP ## 特徴量エンジニアリング - [x] Feature 形式の取り扱い ## 環境構築 - [x] github管理 - [x] データセットの自動ダウンロード(Kaggle API使用) - [x] 自動 submit(Kaggle API使用) - [ ] Kaggle 用 dockerfile(xgboost などの conda に含まれていないパッケージの自動インストール) - [x] 実験パラメーターの jsonファイル管理 - [ ] ログファイルの出力(logger 機能の追加) - [ ] submit の pending 待ち処理 - [x] ディレクトリ構成の変更 - [ ] スプレットシートに実験パラメータとスコアを自動的に記入するスクリプト ## 発展 - [ ] テーブルデータに対する分類問題の DNN モデル検証 - [ ] テーブルデータに対する回帰問題の DNN モデル検証 - [ ] XGBoost(Gradient Boosting)論文読み - [ ] XGBoost(Gradient Boosting)引用論文調査
練習用コンペ
前処理
検証
可視化
特徴量エンジニアリング
環境構築
発展