Skip to content

General #1

@Yagami360

Description

@Yagami360

練習用コンペ

  • テーブルコンペ(分類)
    • titanic
  • テーブルコンペ(回帰)
    • House Prices: Advanced Regression Techniques
  • テーブルコンペ
    • Restaurant Revenue Prediction
    • Home Credit Default Risk
  • 画像系
    • Dogs vs. Cats Redux: Kernels Edition

前処理

  • PCA による次元圧縮
  • 値が1つしかない特徴量(クレンジング対象)を自動的に検出して警告する EDA スクリプト
  • 外れ値が含まれる特徴量(クレンジング対象)を自動的に検出して警告& plot する EDA スクリプト

検証

  • k-cold CV 時の各 k でのモデルの clone() 有無
  • 時系列データに対する k-fold CV

可視化

  • EDA スクリプト
  • UMAP

特徴量エンジニアリング

  • Feature 形式の取り扱い

環境構築

  • github管理
  • データセットの自動ダウンロード(Kaggle API使用)
  • 自動 submit(Kaggle API使用)
  • Kaggle 用 dockerfile(xgboost などの conda に含まれていないパッケージの自動インストール)
  • 実験パラメーターの jsonファイル管理
  • ログファイルの出力(logger 機能の追加)
  • submit の pending 待ち処理
  • ディレクトリ構成の変更
  • スプレットシートに実験パラメータとスコアを自動的に記入するスクリプト

発展

  • テーブルデータに対する分類問題の DNN モデル検証
  • テーブルデータに対する回帰問題の DNN モデル検証
  • XGBoost(Gradient Boosting)論文読み
  • XGBoost(Gradient Boosting)引用論文調査

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions