🎙 VoiceDraft

喋るだけで、伝わるテキストに。

言語化が苦手でも大丈夫。話した内容を AI が自動で清書し、アクティブウィンドウにそのまま入力する Windows 常駐型アシスタントです。

✨ 特徴

話すだけ — キーボードで文章を打つ必要なし
AI が清書 — 「えーっと」や言い直しも綺麗に整形
対話で磨く — AI の問いかけに答えて、テキストをブラッシュアップ
そのまま入力 — 確定するとアクティブウィンドウに自動ペースト
邪魔しない UI — Dynamic Island 風のコンパクトなフローティングウィンドウ

🎬 フロー

Ctrl+Shift+A → 🎙 録音 → ⏳ AI清書 → 📝 プレビュー → ✅ 確定 → 入力完了！
                  ↑                        │
                  └── 🎙 もっと話す ────────┘

Ctrl+Shift+A でセッション開始（録音開始）
自由に話す — 言い直し OK、詰まっても OK
Ctrl+Shift+A or ⏹ ボタンで録音停止（沈黙でも自動停止）
AI が清書テキストをプレビュー表示
「もっと話す」で追加情報を伝えるか、「確定」でテキスト入力

📦 セットアップ

前提条件

Python 3.12+
uv パッケージマネージャー
Gemini API キー

インストール

git clone https://github.com/yourname/voice-draft.git
cd voice-draft
uv sync

設定

cp .env.example .env

.env を編集して API キーを設定：

GEMINI_API_KEY=your_api_key_here

🚀 使い方

uv run main.py

操作方法

操作	方法
起動 / 録音停止	`Ctrl+Shift+A`（トグル）
録音停止	⏹ ボタン / 沈黙検知（自動）
もっと話す	🎙 ボタン
確定（テキスト入力）	✅ ボタン
キャンセル	❌ ボタン / `Esc`

💡 ヒント: ホットキーは config.py の HOTKEY で変更できます。

🏗 モジュール構成

voice-draft/
├── main.py              # エントリーポイント
├── app.py               # オーケストレーター（状態管理）
├── config.py            # 設定定数
├── recorder.py          # 録音 + 沈黙検知
├── gemini_client.py     # Gemini API クライアント
├── injector.py          # テキスト注入（Win32 API）
├── ui/
│   └── floating_window.py  # Dynamic Island 風 UI
├── .env.example         # 環境変数テンプレート
└── pyproject.toml       # プロジェクト設定

⚙ カスタマイズ

config.py で各種設定を変更できます：

設定	デフォルト	説明
`HOTKEY`	`ctrl+shift+a`	起動/停止ホットキー
`SILENCE_DURATION`	`2.5`	沈黙検知の秒数
`SILENCE_THRESHOLD`	`0.01`	沈黙判定の RMS 閾値
`GEMINI_MODEL`	`gemini-2.5-flash`	使用する AI モデル

📄 ライセンス

MIT

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🎙 VoiceDraft

✨ 特徴

🎬 フロー

📦 セットアップ

前提条件

インストール

設定

🚀 使い方

操作方法

🏗 モジュール構成

⚙ カスタマイズ

📄 ライセンス

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
docs/images		docs/images
ui		ui
.env.example		.env.example
.gitignore		.gitignore
.python-version		.python-version
README.md		README.md
app.py		app.py
config.py		config.py
gemini_client.py		gemini_client.py
injector.py		injector.py
main.py		main.py
pyproject.toml		pyproject.toml
recorder.py		recorder.py
uv.lock		uv.lock

Folders and files

Latest commit

History

Repository files navigation

🎙 VoiceDraft

✨ 特徴

🎬 フロー

📦 セットアップ

前提条件

インストール

設定

🚀 使い方

操作方法

🏗 モジュール構成

⚙ カスタマイズ

📄 ライセンス

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages