Skip to content
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
10 changes: 6 additions & 4 deletions knowledge/ai/platform/anthropic-api.md
Original file line number Diff line number Diff line change
@@ -1,5 +1,5 @@
---
reviewed: 2026-05-07
reviewed: 2026-05-10
tags: [library, commercial, cloud-hosted, ai-workflow]
aliases: [claude-api]
---
Expand Down Expand Up @@ -40,11 +40,11 @@ print(message.content[0].text)

| モデル | API ID | コンテキスト | 最大出力 | 位置付け | 価格 (入力/出力 per 1M) |
|---|---|---|---|---|---|
| **Opus 4.7** | `claude-opus-4-7` | 1M | 128K | 最高精度。複雑推論・agentic coding。Extended thinking 非対応(adaptive thinking のみ) | $5 / $25 |
| **Opus 4.7** | `claude-opus-4-7` | 1M | 128K | 最高精度。複雑推論・agentic coding。Extended thinking 非対応(adaptive thinking のみ)。新トークナイザで Opus 4.6 比 1.0〜1.35x のトークン消費(実効コスト最大 +35%) | $5 / $25 |
| **Sonnet 4.6** | `claude-sonnet-4-6` | 1M | 64K | 速度と知性のバランス(デフォルト推奨)。extended/adaptive 両対応 | $3 / $15 |
| **Haiku 4.5** | `claude-haiku-4-5-20251001` | 200K | 64K | 最速・最安。near-frontier 知性。extended thinking 対応 | $1 / $5 |

Opus 4.7 は 2026-04-16 リリース。1M context は **2026-03-13 に Opus 4.6 / Sonnet 4.6 で GA**(ヘッダ不要、標準価格)。旧モデル向け beta ヘッダ `context-1m-2025-08-07` は 2026-04-30 に Sonnet 4.5 / Sonnet 4 から廃止され効果なし。`claude-opus` / `claude-sonnet` のエイリアスは各ティアの最新を指す(プロダクション用途ではピン留め推奨)。Sonnet 4 / Opus 4 は 2026-06-15 retire 予定。
Opus 4.7 は 2026-04-16 リリース。**新トークナイザ採用により Opus 4.6 比で 1.0〜1.35x のトークンを消費**するため、`max_tokens` には余裕を持たせる(コンパクション閾値も同様)。1M context は **2026-03-13 に Opus 4.6 / Sonnet 4.6 で GA**(ヘッダ不要、標準価格)。旧モデル向け beta ヘッダ `context-1m-2025-08-07` は 2026-04-30 に Sonnet 4.5 / Sonnet 4 から廃止され効果なし。`claude-opus` / `claude-sonnet` のエイリアスは各ティアの最新を指す(プロダクション用途ではピン留め推奨)。Sonnet 4 / Opus 4 は 2026-06-15 retire 予定。

## プロンプトキャッシング — 最重要の最適化

Expand Down Expand Up @@ -118,7 +118,7 @@ tools = [

## Extended / Adaptive Thinking

Opus 4.6 以降は **adaptive thinking** が推奨。Opus 4.7 では `thinking: {type: "enabled", budget_tokens: N}` を渡すと **400 エラー** が返る(deprecated ではなくリジェクト)。Opus 4.7 は extended thinking 自体に非対応で adaptive のみサポート。
Opus 4.6 以降は **adaptive thinking** が推奨。Opus 4.7 では `thinking: {type: "enabled", budget_tokens: N}` を渡すと **400 エラー** が返る(deprecated ではなくリジェクト)。Opus 4.7 は extended thinking 自体に非対応で adaptive のみサポート。**Opus 4.7 では adaptive thinking はデフォルト OFF**。明示的に `thinking={"type": "adaptive"}` を指定しないと thinking なしで動作する。

Opus 4.7 では **`temperature` / `top_p` / `top_k` を非デフォルト値に設定すると 400 エラー**。これらのパラメータはリクエストから除去すること。

Expand All @@ -135,6 +135,8 @@ message = client.messages.create(

`effort` パラメータ(2026-02-05 GA、`budget_tokens` の代替)は `output_config={"effort": "<level>"}` で指定する。effort レベル: `max` / `xhigh`(coding・agentic 推奨)/ `high`(汎用推奨最低ライン)/ `medium` / `low`。

**Task budgets(beta、Opus 4.7〜)**: agentic ループ全体(thinking + tool calls + tool results + final output)の合計トークン目安をモデルに伝える。`max_tokens` がハードキャップなのに対し、`task_budget` はモデルが認識する advisory な目安。beta ヘッダ `task-budgets-2026-03-13` を付与し、`output_config={"effort": "high", "task_budget": {"type": "tokens", "total": 128000}}` のように指定(最小 20k)。

Opus 4.7 では **`thinking.display` のデフォルトが `"omitted"`** に変更(Opus 4.6 はデフォルト `"summarized"`)。ストリーミング中に thinking 内容を表示したい場合は明示的に `"display": "summarized"` を指定すること。

- **用途**: 多段推論、数学、デバッグ、深い分析
Expand Down
Loading