diff --git a/.all-contributorsrc b/.all-contributorsrc
new file mode 100644
index 00000000..1a505349
--- /dev/null
+++ b/.all-contributorsrc
@@ -0,0 +1,20 @@
+{
+  "files": ["README.md"],
+  "imageSize": 100,
+  "contributorsPerLine": 7,
+  "contributorsSortAlphabetically": true,
+  "badgeTemplate": "[![All Contributors](https://img.shields.io/badge/all_contributors-<%= contributors.length %>-orange.svg?style=flat-square)](#contributors-)",
+  "contributorTemplate": "<a href=\"<%= contributor.profile %>\"><img src=\"<%= contributor.avatar_url %>\" width=\"<%= options.imageSize %>px;\" alt=\"<%= contributor.name %>\"/><br /><sub><b><%= contributor.name %></b></sub></a>",
+  "types": {
+    "code": { "symbol": "💻", "description": "Code" },
+    "data": { "symbol": "🔣", "description": "Data" },
+    "doc": { "symbol": "📖", "description": "Documentation" },
+    "ideas": { "symbol": "🤔", "description": "Ideas, Planning, & Feedback" },
+    "maintenance": { "symbol": "🚧", "description": "Maintenance" },
+    "review": { "symbol": "👀", "description": "Reviewed Pull Requests" },
+    "test": { "symbol": "⚠️", "description": "Tests" },
+    "infra": { "symbol": "🔧", "description": "Infrastructure" }
+  },
+  "skipCi": true,
+  "contributors": []
+}
diff --git a/.editorconfig b/.editorconfig
new file mode 100644
index 00000000..44ce5230
--- /dev/null
+++ b/.editorconfig
@@ -0,0 +1,21 @@
+root = true
+
+[*]
+charset = utf-8
+end_of_line = lf
+insert_final_newline = true
+trim_trailing_whitespace = true
+indent_style = space
+indent_size = 2
+
+[*.md]
+trim_trailing_whitespace = false
+
+[*.yaml]
+indent_size = 2
+
+[*.yml]
+indent_size = 2
+
+[Makefile]
+indent_style = tab
diff --git a/.github/CODEOWNERS b/.github/CODEOWNERS
new file mode 100644
index 00000000..ff8d40a2
--- /dev/null
+++ b/.github/CODEOWNERS
@@ -0,0 +1,14 @@
+# Default reviewers for all changes
+* @liushuai
+
+# Provider data changes
+providers/ @liushuai
+
+# Type definitions
+types/ @liushuai
+
+# CI/CD workflows
+.github/workflows/ @liushuai
+
+# Documentation
+docs/ @liushuai
diff --git a/.github/FUNDING.yml b/.github/FUNDING.yml
new file mode 100644
index 00000000..ff862f3b
--- /dev/null
+++ b/.github/FUNDING.yml
@@ -0,0 +1,3 @@
+# These supported funding platforms will be linked from the repository sidebar
+
+github: i-need-token
diff --git a/.github/ISSUE_TEMPLATE/bug_report.md b/.github/ISSUE_TEMPLATE/bug_report.md
new file mode 100644
index 00000000..b7b37e2e
--- /dev/null
+++ b/.github/ISSUE_TEMPLATE/bug_report.md
@@ -0,0 +1,30 @@
+---
+name: Bug Report
+about: Report incorrect model data or a bug in a scrape script
+title: "[Bug] "
+labels: bug
+---
+
+## Description
+
+<!-- What's wrong? Be specific about the provider and model ID. -->
+
+## Provider
+
+<!-- Which provider is affected? e.g., openai, anthropic, google -->
+
+## Model ID
+
+<!-- Which model has incorrect data? e.g., gpt-4o, claude-sonnet-4-5 -->
+
+## Expected Data
+
+<!-- What should the correct data be? Include a source link if possible. -->
+
+## Current Data
+
+<!-- What does the catalog currently show? -->
+
+## Source
+
+<!-- Link to the provider's official documentation or API confirming the correct data. -->
diff --git a/.github/ISSUE_TEMPLATE/config.yml b/.github/ISSUE_TEMPLATE/config.yml
new file mode 100644
index 00000000..ee50c7bf
--- /dev/null
+++ b/.github/ISSUE_TEMPLATE/config.yml
@@ -0,0 +1,5 @@
+blank_issues_enabled: false
+contact_links:
+  - name: 💬 Ask a Question
+    url: https://github.com/i-need-token/ai-models/discussions
+    about: Ask questions and discuss the catalog with the community
diff --git a/.github/ISSUE_TEMPLATE/data_update.md b/.github/ISSUE_TEMPLATE/data_update.md
new file mode 100644
index 00000000..45fece32
--- /dev/null
+++ b/.github/ISSUE_TEMPLATE/data_update.md
@@ -0,0 +1,22 @@
+---
+name: Data Update
+about: Report outdated model data that needs updating
+title: "[Data] "
+labels: data, good first issue
+---
+
+## Provider
+
+<!-- Which provider? -->
+
+## Model ID
+
+<!-- Which model? -->
+
+## What Changed
+
+<!-- What data is outdated? e.g., pricing changed, new snapshot released, context window updated -->
+
+## Source
+
+<!-- Link to the provider's official page confirming the update. -->
diff --git a/.github/ISSUE_TEMPLATE/feature_request.md b/.github/ISSUE_TEMPLATE/feature_request.md
new file mode 100644
index 00000000..162dcb55
--- /dev/null
+++ b/.github/ISSUE_TEMPLATE/feature_request.md
@@ -0,0 +1,27 @@
+---
+name: Feature request
+about: Suggest a new feature, documentation page, or capability
+title: "[Feature] "
+labels: ["enhancement"]
+assignees: ""
+---
+
+## Problem
+
+<!-- What problem does this feature solve? What are you trying to do? -->
+
+## Proposed Solution
+
+<!-- Describe the feature you'd like to see -->
+
+## Alternatives Considered
+
+<!-- Any alternative approaches you've considered -->
+
+## Additional Context
+
+<!-- Any other context, screenshots, or examples -->
+
+## Would you be willing to submit a PR?
+
+- [ ] Yes, I'd like to contribute this feature
diff --git a/.github/ISSUE_TEMPLATE/provider_request.md b/.github/ISSUE_TEMPLATE/provider_request.md
new file mode 100644
index 00000000..2fc50ed8
--- /dev/null
+++ b/.github/ISSUE_TEMPLATE/provider_request.md
@@ -0,0 +1,40 @@
+---
+name: Provider Request
+about: Request adding a new AI model provider to the catalog
+title: "[Provider] "
+labels: enhancement
+---
+
+## Provider Name
+
+<!-- e.g., Replicate, Snowflake Cortex -->
+
+## Provider URL
+
+<!-- Link to the provider's website -->
+
+## API Documentation
+
+<!-- Link to the provider's API docs, if available -->
+
+## Data Source
+
+How can we obtain model data from this provider?
+
+- [ ] Public API (no auth required)
+- [ ] Public API (auth required)
+- [ ] Website (server-side rendered)
+- [ ] Website (client-side rendered)
+- [ ] Other: \***\*\_\_\_\*\***
+
+## Pricing Model
+
+- [ ] Per-token pricing (USD/CNY/EUR)
+- [ ] Per-second pricing
+- [ ] Credit-based pricing
+- [ ] No public pricing
+- [ ] Other: \***\*\_\_\_\*\***
+
+## Additional Context
+
+<!-- Any other details about this provider. -->
diff --git a/.github/ISSUE_TEMPLATE/stargazer.md b/.github/ISSUE_TEMPLATE/stargazer.md
new file mode 100644
index 00000000..ee805856
--- /dev/null
+++ b/.github/ISSUE_TEMPLATE/stargazer.md
@@ -0,0 +1,16 @@
+---
+name: 🌟 Stargazer
+about: Leave a star and say hi!
+title: "🌟 I starred this repo!"
+labels: stargazer
+---
+
+Thanks for checking out the AI Models Catalog! 🎉
+
+If you find this project useful, please consider:
+
+- ⭐ **Starring** this repository — it helps others discover it
+- 🐦 **Sharing** it on social media
+- 📝 **Contributing** a new provider or fixing data
+
+Feel free to leave a comment below telling us how you use the catalog!
diff --git a/.github/PULL_REQUEST_TEMPLATE.md b/.github/PULL_REQUEST_TEMPLATE.md
new file mode 100644
index 00000000..4b6cad30
--- /dev/null
+++ b/.github/PULL_REQUEST_TEMPLATE.md
@@ -0,0 +1,25 @@
+## Description
+
+<!-- What does this PR do? -->
+
+## Type of Change
+
+- [ ] New provider
+- [ ] Data update (pricing, capabilities, etc.)
+- [ ] Bug fix
+- [ ] Documentation
+- [ ] Refactor
+
+## Provider Affected
+
+<!-- Which provider(s) are affected? Leave blank if N/A. -->
+
+## Validation
+
+- [ ] `npx tsx scripts/validate.ts` passes
+- [ ] Data comes from first-party sources only
+- [ ] No hardcoded model ID lists in scrape functions
+
+## Additional Notes
+
+<!-- Anything else reviewers should know? -->
diff --git a/.github/badges/models.json b/.github/badges/models.json
new file mode 100644
index 00000000..4f27c22a
--- /dev/null
+++ b/.github/badges/models.json
@@ -0,0 +1 @@
+{ "schemaVersion": 1, "label": "models", "message": "4587", "color": "green" }
diff --git a/.github/badges/providers.json b/.github/badges/providers.json
new file mode 100644
index 00000000..89c832bf
--- /dev/null
+++ b/.github/badges/providers.json
@@ -0,0 +1 @@
+{ "schemaVersion": 1, "label": "providers", "message": "87", "color": "blue" }
diff --git a/.github/dependabot.yml b/.github/dependabot.yml
new file mode 100644
index 00000000..9d3e3db6
--- /dev/null
+++ b/.github/dependabot.yml
@@ -0,0 +1,19 @@
+version: 2
+
+updates:
+  - package-ecosystem: npm
+    directory: /
+    schedule:
+      interval: weekly
+    open-pull-requests-limit: 5
+    labels:
+      - dependencies
+
+  - package-ecosystem: github-actions
+    directory: /
+    schedule:
+      interval: weekly
+    open-pull-requests-limit: 5
+    labels:
+      - dependencies
+      - ci
diff --git a/.github/discussions-setup.md b/.github/discussions-setup.md
new file mode 100644
index 00000000..2da1cdb8
--- /dev/null
+++ b/.github/discussions-setup.md
@@ -0,0 +1,42 @@
+# GitHub Discussions Setup Guide
+
+Enable GitHub Discussions to create a community hub around the AI Models Catalog.
+
+## Steps
+
+1. Go to **Settings → Features** in the repository
+2. Check ✅ **Discussions**
+3. Create the following discussion categories:
+
+### Recommended Categories
+
+| Category         | Format       | Description                                   |
+| ---------------- | ------------ | --------------------------------------------- |
+| 📢 Announcements | Announcement | New providers, data updates, breaking changes |
+| 💬 General       | Open-ended   | Questions, ideas, show-and-tell               |
+| 🙏 Q&A           | Q&A          | How to use the catalog, data questions        |
+| 💡 Ideas         | Open-ended   | Feature requests, new docs suggestions        |
+| 🏷️ Show and Tell | Open-ended   | Projects built with the catalog               |
+
+### First Discussion Posts
+
+Create these seed discussions to set the tone:
+
+1. **Welcome to AI Models Catalog** (Announcement)
+   - Introduce the project, link to quick-start, invite contributions
+
+2. **What are you building with the catalog?** (Show and Tell)
+   - Encourage users to share their projects
+
+3. **Which provider should we add next?** (Ideas)
+   - Crowdsource new provider requests
+
+4. **Data quality report — how to report issues** (Q&A)
+   - Explain how to report stale or incorrect data
+
+## Benefits
+
+- **Reduces issue noise** — questions move to Discussions instead of Issues
+- **Builds community** — users help each other, share projects
+- **SEO boost** — public discussions are indexed by search engines
+- **Feedback loop** — learn what users need most
diff --git a/.github/labeler.yml b/.github/labeler.yml
new file mode 100644
index 00000000..fa424d43
--- /dev/null
+++ b/.github/labeler.yml
@@ -0,0 +1,27 @@
+documentation:
+  - changed-files:
+      - any-glob-to-any-file: ["docs/**", "*.md", "README.md", "CONTRIBUTING.md"]
+
+data-update:
+  - changed-files:
+      - any-glob-to-any-file: ["providers/**/*.yaml", "providers/**/*.yml"]
+
+new-provider:
+  - changed-files:
+      - any-glob-to-any-file: ["providers/*/provider.yaml", "providers/*/scrape.ts"]
+
+ci:
+  - changed-files:
+      - any-glob-to-any-file: [".github/workflows/**", "action.yml"]
+
+dependencies:
+  - changed-files:
+      - any-glob-to-any-file: ["package.json", "package-lock.json"]
+
+types:
+  - changed-files:
+      - any-glob-to-any-file: ["types/**"]
+
+scripts:
+  - changed-files:
+      - any-glob-to-any-file: ["scripts/**"]
diff --git a/.github/repo-settings.md b/.github/repo-settings.md
new file mode 100644
index 00000000..79430127
--- /dev/null
+++ b/.github/repo-settings.md
@@ -0,0 +1,48 @@
+# GitHub Repository Settings
+
+This file documents the recommended GitHub repository settings for discoverability.
+
+## Repository Description
+
+```
+Structured YAML catalog of 4,587 AI models across 95 providers — pricing, context windows, modalities, capabilities. First-party data with TypeScript types and Zod validation.
+```
+
+## Topics
+
+Add these topics to the repository (Settings → General → Topics):
+
+- ai-models
+- llm
+- large-language-model
+- ai-catalog
+- model-pricing
+- ai-pricing
+- openai
+- anthropic
+- gemini
+- deepseek
+- llama
+- qwen
+- mistral
+- groq
+- cerebras
+- inference-api
+- model-comparison
+- ai-provider
+- yaml
+- machine-readable
+- zod
+- open-weights
+- context-window
+- tool-calling
+- function-calling
+- ai-agents
+- reasoning-models
+- vision-models
+- free-ai-models
+- ai-model-catalog
+- structured-data
+- npm-package
+- huggingface
+- github-action
diff --git a/.github/stale.yml b/.github/stale.yml
new file mode 100644
index 00000000..b020f753
--- /dev/null
+++ b/.github/stale.yml
@@ -0,0 +1,32 @@
+# Configuration for probot/stale - https://github.com/probot/stale
+
+# Number of days of inactivity before an issue becomes stale
+daysUntilStale: 60
+
+# Number of days of inactivity before a stale issue is closed
+daysUntilClose: 7
+
+# Issues with these labels will never be considered stale
+exemptLabels:
+  - pinned
+  - security
+  - good first issue
+  - help wanted
+
+# Label to use when marking an issue as stale
+staleLabel: wontfix
+
+# Comment to post when marking an issue as stale
+markComment: >
+  This issue has been automatically marked as stale because it has not had
+  recent activity. It will be closed if no further activity occurs in 7 days.
+  Thank you for your contributions!
+
+# Comment to post when closing a stale issue
+closeComment: >
+  This issue has been automatically closed due to inactivity.
+  If you believe this was closed in error, please reopen the issue
+  or leave a comment explaining why it should remain open.
+
+# Limit to only issues (not PRs)
+only: issues
diff --git a/.github/workflows/auto-merge.yml b/.github/workflows/auto-merge.yml
new file mode 100644
index 00000000..ed468ab6
--- /dev/null
+++ b/.github/workflows/auto-merge.yml
@@ -0,0 +1,38 @@
+name: Auto-merge Dependabot
+
+on:
+  pull_request_target:
+    types: [opened, synchronize]
+
+permissions:
+  contents: write
+  pull-requests: write
+
+jobs:
+  auto-merge:
+    runs-on: ubuntu-latest
+    if: github.actor == 'dependabot[bot]'
+    steps:
+      - name: Dependabot metadata
+        id: metadata
+        uses: dependabot/fetch-metadata@v2
+        with:
+          github-token: "${{ secrets.GITHUB_TOKEN }}"
+
+      - name: Auto-approve minor and patch updates
+        if: >
+          steps.metadata.outputs.update-type == 'version-update:semver-patch' ||
+          steps.metadata.outputs.update-type == 'version-update:semver-minor'
+        run: gh pr review --approve "$PR_URL"
+        env:
+          PR_URL: ${{ github.event.pull_request.html_url }}
+          GH_TOKEN: ${{ secrets.GITHUB_TOKEN }}
+
+      - name: Auto-merge approved updates
+        if: >
+          steps.metadata.outputs.update-type == 'version-update:semver-patch' ||
+          steps.metadata.outputs.update-type == 'version-update:semver-minor'
+        run: gh pr merge --auto --squash "$PR_URL"
+        env:
+          PR_URL: ${{ github.event.pull_request.html_url }}
+          GH_TOKEN: ${{ secrets.GITHUB_TOKEN }}
diff --git a/.github/workflows/demo.yml b/.github/workflows/demo.yml
new file mode 100644
index 00000000..2f62c814
--- /dev/null
+++ b/.github/workflows/demo.yml
@@ -0,0 +1,50 @@
+name: AI Models Demo
+on:
+  workflow_dispatch:
+  schedule:
+    - cron: "0 6 * * 1" # Every Monday 6:00 UTC
+
+jobs:
+  demo:
+    runs-on: ubuntu-latest
+    steps:
+      - name: Get AI Model Data
+        id: models
+        uses: i-need-token/ai-models@v0.2.2
+        with:
+          format: json
+          output-dir: model-data
+
+      - name: Show Stats
+        run: |
+          echo "📊 ${{ steps.models.outputs.model-count }} models from ${{ steps.models.outputs.provider-count }} providers"
+          echo "📁 Data saved to ${{ steps.models.outputs.file-path }}"
+
+      - name: Find Cheapest Tool-Calling Model
+        run: |
+          python3 -c "
+          import json
+          with open('model-data/models.json') as f:
+              data = json.load(f)
+          models = data['models']
+          AGG = {'openrouter','requesty','auriko','llmgateway','cortecs','aihubmix','orcarouter','fastrouter','302ai','martian','nanogpt','jiekou','venice','meganova'}
+          tc = [m for m in models if m.get('tool_call') and m.get('provider') not in AGG and m.get('pricing',{}).get('unit') != 'free' and m.get('pricing',{}).get('input',999) > 0]
+          tc.sort(key=lambda m: (m['pricing']['input'], m['pricing']['output']))
+          print('💰 Cheapest tool-calling models:')
+          for m in tc[:5]:
+              print(f'  {m[\"id\"]}: \${m[\"pricing\"][\"input\"]}/\${m[\"pricing\"][\"output\"]}/M tokens')
+          "
+
+      - name: Find Free Reasoning Models
+        run: |
+          python3 -c "
+          import json
+          with open('model-data/models.json') as f:
+              data = json.load(f)
+          models = data['models']
+          free_reason = [m for m in models if m.get('reasoning') and m.get('pricing',{}).get('unit') == 'free']
+          print('🆓 Free reasoning models:')
+          for m in free_reason[:5]:
+              ctx = m.get('limit',{}).get('context',0)
+              print(f'  {m[\"id\"]}: {ctx//1000 if ctx >= 1000 else ctx}K context')
+          "
diff --git a/.github/workflows/digest.yml b/.github/workflows/digest.yml
new file mode 100644
index 00000000..d441e1f7
--- /dev/null
+++ b/.github/workflows/digest.yml
@@ -0,0 +1,99 @@
+name: Weekly Digest
+
+on:
+  workflow_dispatch:
+  schedule:
+    - cron: "0 6 * * 1" # Monday 6:00 UTC
+
+permissions:
+  contents: read
+  discussions: write
+
+jobs:
+  digest:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v4
+        with:
+          node-version: 22
+
+      - name: Install dependencies
+        run: npm ci
+
+      - name: Compute stats
+        run: npx tsx scripts/stats.ts json > stats.json
+
+      - name: Generate digest
+        env:
+          GITHUB_TOKEN: ${{ secrets.GITHUB_TOKEN }}
+        run: |
+          STATS=$(cat stats.json)
+
+          # Extract key numbers
+          TOTAL=$(echo "$STATS" | jq '.model_files')
+          PROVIDERS=$(echo "$STATS" | jq '.providers')
+          FREE=$(echo "$STATS" | jq '.free')
+          TOOL_CALL=$(echo "$STATS" | jq '.tool_call')
+          REASONING=$(echo "$STATS" | jq '.reasoning')
+          VISION=$(echo "$STATS" | jq '.vision')
+          OPEN_WEIGHTS=$(echo "$STATS" | jq '.open_weights')
+          DEPRECATED=$(echo "$STATS" | jq '.deprecated')
+          FAMILIES=$(echo "$STATS" | jq '.families')
+
+          # Get date range
+          WEEK_START=$(date -d "last monday" +%Y-%m-%d 2>/dev/null || date -v-7d +%Y-%m-%d)
+          TODAY=$(date +%Y-%m-%d)
+
+          # Build the discussion body
+          cat > /tmp/digest.md << 'HEADER'
+          ## 📊 Weekly AI Models Digest
+          HEADER
+
+          echo "" >> /tmp/digest.md
+          echo "**Week of ${WEEK_START} — ${TODAY}**" >> /tmp/digest.md
+          echo "" >> /tmp/digest.md
+
+          echo "| Metric | Count |" >> /tmp/digest.md
+          echo "|--------|-------|" >> /tmp/digest.md
+          echo "| Total Models | ${TOTAL} |" >> /tmp/digest.md
+          echo "| Providers | ${PROVIDERS} |" >> /tmp/digest.md
+          echo "| Free Models | ${FREE} |" >> /tmp/digest.md
+          echo "| Tool Calling | ${TOOL_CALL} |" >> /tmp/digest.md
+          echo "| Reasoning | ${REASONING} |" >> /tmp/digest.md
+          echo "| Vision | ${VISION} |" >> /tmp/digest.md
+          echo "| Open Weights | ${OPEN_WEIGHTS} |" >> /tmp/digest.md
+          echo "| Families | ${FAMILIES} |" >> /tmp/digest.md
+          echo "| Deprecated | ${DEPRECATED} |" >> /tmp/digest.md
+
+          echo "" >> /tmp/digest.md
+          echo "### 🔗 Quick Links" >> /tmp/digest.md
+          echo "- [Interactive Catalog](https://i-need-token.github.io/ai-models/) — search, filter, compare" >> /tmp/digest.md
+          echo "- [Download Data](https://github.com/i-need-token/ai-models/releases/latest) — JSON, CSV, schema" >> /tmp/digest.md
+          echo "- [Free Models Guide](https://github.com/i-need-token/ai-models/blob/main/docs/free-models.md)" >> /tmp/digest.md
+          echo "- [Pricing Comparison](https://github.com/i-need-token/ai-models/blob/main/docs/pricing-comparison.md)" >> /tmp/digest.md
+          echo "" >> /tmp/digest.md
+          echo "---" >> /tmp/digest.md
+          echo "*Auto-generated by the [Weekly Digest workflow](https://github.com/i-need-token/ai-models/actions/workflows/digest.yml).*" >> /tmp/digest.md
+
+          # Create or update the discussion
+          # Discussion category: Announcements (id from repo)
+          TITLE="📊 Weekly Digest — ${TODAY}"
+          BODY=$(cat /tmp/digest.md)
+
+          # Use GraphQL to create a discussion
+          gh api graphql -f query='
+            mutation {
+              createDiscussion(input: {
+                repositoryId: "'$(gh api repos/i-need-token/ai-models --jq '.node_id')'",
+                categoryId: "'$(gh api graphql -f query='{ repository(owner:"i-need-token", name:"ai-models") { discussionCategories(first:10) { nodes { id name } } } }' --jq '.data.repository.discussionCategories.nodes[] | select(.name == "Announcements") | .id')'",
+                title: "'"${TITLE}"'",
+                body: "'"${BODY}"'"
+              }) {
+                discussion {
+                  url
+                }
+              }
+            }
+          ' 2>/dev/null || echo "Note: Discussion creation requires proper category setup"
diff --git a/.github/workflows/labeler.yml b/.github/workflows/labeler.yml
new file mode 100644
index 00000000..b756dc12
--- /dev/null
+++ b/.github/workflows/labeler.yml
@@ -0,0 +1,17 @@
+name: PR Labeler
+
+on:
+  pull_request_target:
+    types: [opened]
+
+permissions:
+  contents: read
+  pull-requests: write
+
+jobs:
+  label:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/labeler@v5
+        with:
+          repo-token: "${{ secrets.GITHUB_TOKEN }}"
diff --git a/.github/workflows/pages.yml b/.github/workflows/pages.yml
new file mode 100644
index 00000000..156b4401
--- /dev/null
+++ b/.github/workflows/pages.yml
@@ -0,0 +1,47 @@
+name: Deploy Pages
+
+on:
+  push:
+    branches: [main]
+    paths:
+      - "site/**"
+      - "providers/**"
+      - "scripts/compile.ts"
+      - ".github/workflows/pages.yml"
+  workflow_dispatch:
+
+permissions:
+  contents: read
+  pages: write
+  id-token: write
+
+concurrency:
+  group: pages
+  cancel-in-progress: true
+
+jobs:
+  deploy:
+    runs-on: ubuntu-latest
+    environment:
+      name: github-pages
+      url: ${{ steps.deployment.outputs.page_url }}
+    steps:
+      - uses: actions/checkout@v6
+
+      - name: Setup Pages
+        uses: actions/configure-pages@v5
+
+      - name: Install dependencies
+        run: npm install
+      - name: Compile models.json
+        run: npx tsx scripts/compile.ts
+      - name: Copy data to site
+        run: cp dist/models.json site/models.json
+      - name: Upload artifact
+        uses: actions/upload-pages-artifact@v3
+        with:
+          path: site
+
+      - name: Deploy to GitHub Pages
+        id: deployment
+        uses: actions/deploy-pages@v4
diff --git a/.github/workflows/publish.yml b/.github/workflows/publish.yml
new file mode 100644
index 00000000..3bf9cc3f
--- /dev/null
+++ b/.github/workflows/publish.yml
@@ -0,0 +1,27 @@
+name: Publish to npm
+
+on:
+  release:
+    types: [published]
+
+permissions:
+  contents: read
+
+jobs:
+  publish:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v6
+        with:
+          node-version: 22
+          registry-url: https://registry.npmjs.org/
+
+      - run: npm ci
+
+      - run: npm run build
+
+      - run: npm publish --access public
+        env:
+          NODE_AUTH_TOKEN: ${{ secrets.NPM_TOKEN }}
diff --git a/.github/workflows/release.yml b/.github/workflows/release.yml
new file mode 100644
index 00000000..d597af4f
--- /dev/null
+++ b/.github/workflows/release.yml
@@ -0,0 +1,67 @@
+name: Release
+
+on:
+  push:
+    tags:
+      - "v*"
+  workflow_dispatch:
+
+permissions:
+  contents: write
+
+jobs:
+  release:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v6
+        with:
+          node-version: 22
+
+      - name: Install dependencies
+        run: npm ci
+
+      - name: Validate
+        run: npx tsx scripts/validate.ts
+
+      - name: Compile models.json
+        run: npx tsx scripts/compile.ts
+
+      - name: Export models.csv
+        run: npx tsx scripts/export-csv.ts
+
+      - name: Compute stats
+        run: npx tsx scripts/stats.ts json > stats.json
+
+      - name: Create release
+        uses: softprops/action-gh-release@v3
+        with:
+          files: |
+            dist/models.json
+            models.csv
+            stats.json
+          body: |
+            ## AI Models Catalog Release
+
+            **Compiled data files:**
+
+            | File | Format | Size | Description |
+            | ---- | ------ | ---- | ----------- |
+            | `models.json` | JSON | ~2.3 MB | All 4,587 models with full metadata |
+            | `models.csv` | CSV | ~560 KB | Flat table — open in Excel, Google Sheets, Python |
+            | `stats.json` | JSON | ~1 KB | Catalog statistics summary |
+
+            **Usage:**
+            ```bash
+            # Download the compiled JSON
+            curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+            # Download the CSV (for Excel/Sheets)
+            curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+
+            # Use in JavaScript
+            const catalog = require("./models.json");
+            console.log(catalog.stats);
+            ```
+          generate-release-notes: true
diff --git a/.github/workflows/stats.yml b/.github/workflows/stats.yml
new file mode 100644
index 00000000..d37890ea
--- /dev/null
+++ b/.github/workflows/stats.yml
@@ -0,0 +1,60 @@
+name: Stats
+
+on:
+  workflow_dispatch:
+  schedule:
+    - cron: "0 0 * * 0" # weekly on Sunday
+
+permissions:
+  contents: write
+
+jobs:
+  stats:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v6
+        with:
+          node-version: 22
+
+      - name: Install dependencies
+        run: npm ci
+
+      - name: Compute stats
+        run: npx tsx scripts/stats.ts json > stats.json
+
+      - name: Export CSV
+        run: npx tsx scripts/export-csv.ts
+
+      - name: Update dynamic badges
+        run: |
+          STATS=$(cat stats.json)
+          MODELS=$(echo "$STATS" | jq '.model_files')
+          PROVIDERS=$(echo "$STATS" | jq '.providers')
+          cat > .github/badges/models.json << EOF
+          {"schemaVersion":1,"label":"models","message":"$MODELS","color":"green"}
+          EOF
+          cat > .github/badges/providers.json << EOF
+          {"schemaVersion":1,"label":"providers","message":"$PROVIDERS","color":"blue"}
+          EOF
+
+      - name: Format badges
+        run: npx oxfmt --write .github/badges/*.json
+
+      - name: Commit badges
+        run: |
+          git config user.name "github-actions[bot]"
+          git config user.email "github-actions[bot]@users.noreply.github.com"
+          git add .github/badges/*.json
+          git diff --cached --quiet || git commit -m "chore: update dynamic badges [skip ci]"
+          git push
+
+      - name: Upload artifacts
+        uses: actions/upload-artifact@v7
+        with:
+          name: catalog-data
+          path: |
+            stats.json
+            models.csv
+          retention-days: 30
diff --git a/.github/workflows/sync-hf.yml b/.github/workflows/sync-hf.yml
new file mode 100644
index 00000000..c974da28
--- /dev/null
+++ b/.github/workflows/sync-hf.yml
@@ -0,0 +1,59 @@
+name: Sync to Hugging Face
+
+on:
+  release:
+    types: [published]
+  workflow_dispatch:
+
+jobs:
+  sync:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v6
+        with:
+          node-version: 22
+
+      - name: Compile JSON
+        run: npx tsx scripts/compile.ts
+
+      - name: Export CSV
+        run: npx tsx scripts/export-csv.ts
+
+      - name: Push to Hugging Face
+        env:
+          HF_TOKEN: ${{ secrets.HF_TOKEN }}
+        run: |
+          if [ -z "$HF_TOKEN" ]; then
+            echo "HF_TOKEN not set — skipping Hugging Face sync"
+            exit 0
+          fi
+
+          pip install huggingface-hub
+
+          python3 -c "
+          from huggingface_hub import HfApi
+          import os
+
+          api = HfApi(token=os.environ['HF_TOKEN'])
+          repo_id = os.environ.get('HF_REPO_ID', 'i-need-token/ai-models')
+
+          api.upload_file(
+              path_or_fileobj='dist/models.json',
+              path_in_repo='models.json',
+              repo_id=repo_id,
+              repo_type='dataset',
+              commit_message='Sync models.json from GitHub release',
+          )
+
+          api.upload_file(
+              path_or_fileobj='models.csv',
+              path_in_repo='models.csv',
+              repo_id=repo_id,
+              repo_type='dataset',
+              commit_message='Sync models.csv from GitHub release',
+          )
+
+          print(f'Synced to https://huggingface.co/datasets/{repo_id}')
+          "
diff --git a/.github/workflows/sync.yml b/.github/workflows/sync.yml
new file mode 100644
index 00000000..5977a609
--- /dev/null
+++ b/.github/workflows/sync.yml
@@ -0,0 +1,57 @@
+name: Weekly Sync
+
+on:
+  schedule:
+    - cron: "0 2 * * 1" # Every Monday at 02:00 UTC
+  workflow_dispatch:
+
+permissions:
+  contents: write
+  pull-requests: write
+
+jobs:
+  sync:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v6
+        with:
+          node-version: "22"
+
+      - name: Install dependencies
+        run: npm ci
+
+      - name: Run scrape
+        run: npx tsx scripts/scrape-all.ts
+        continue-on-error: true
+
+      - name: Check for changes
+        id: changes
+        run: |
+          if git diff --quiet providers/; then
+            echo "changed=false" >> "$GITHUB_OUTPUT"
+          else
+            echo "changed=true" >> "$GITHUB_OUTPUT"
+            git diff --stat providers/ > /tmp/diff-stat.txt
+          fi
+
+      - name: Create pull request
+        if: steps.changes.outputs.changed == 'true'
+        uses: peter-evans/create-pull-request@v8
+        with:
+          title: "🔄 Weekly model data sync"
+          body: |
+            Automated data sync from provider APIs.
+
+            ## Changes
+
+            ```diff
+            ${{ steps.changes.outputs.diff_stat }}
+            ```
+
+            Generated by the [Weekly Sync](/.github/workflows/sync.yml) workflow.
+          branch: sync/weekly
+          commit-message: "chore: weekly model data sync"
+          labels: data-update, automated
+          delete-branch: true
diff --git a/.github/workflows/validate.yml b/.github/workflows/validate.yml
new file mode 100644
index 00000000..16e649bb
--- /dev/null
+++ b/.github/workflows/validate.yml
@@ -0,0 +1,73 @@
+name: Validate
+
+on:
+  push:
+    branches: [main]
+    paths:
+      - "providers/**/*.yaml"
+      - "providers/**/*.yml"
+      - "types/**"
+      - "scripts/**"
+  pull_request:
+    branches: [main]
+    paths:
+      - "providers/**/*.yaml"
+      - "providers/**/*.yml"
+      - "types/**"
+      - "scripts/**"
+
+jobs:
+  validate:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v6
+        with:
+          node-version: 22
+
+      - name: Install dependencies
+        run: npm ci
+
+      - name: Validate YAML data
+        run: npx tsx scripts/validate.ts
+
+      - name: Type check
+        run: npx tsc --noEmit
+
+      - name: Lint
+        run: npm run lint
+
+  format:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - uses: actions/setup-node@v6
+        with:
+          node-version: 22
+
+      - name: Install dependencies
+        run: npm ci
+
+      - name: Check formatting
+        run: npm run fmt:check
+
+  stats:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v6
+
+      - name: Count providers
+        id: count
+        run: |
+          providers=$(ls providers/ | wc -l | tr -d ' ')
+          models=$(find providers -name "*.yaml" -o -name "*.yml" | wc -l | tr -d ' ')
+          echo "providers=$providers" >> "$GITHUB_OUTPUT"
+          echo "models=$models" >> "$GITHUB_OUTPUT"
+
+      - name: Report stats
+        run: |
+          echo "📊 Catalog Stats"
+          echo "Providers: ${{ steps.count.outputs.providers }}"
+          echo "Model files: ${{ steps.count.outputs.models }}"
diff --git a/.github/workflows/welcome.yml b/.github/workflows/welcome.yml
new file mode 100644
index 00000000..78a63728
--- /dev/null
+++ b/.github/workflows/welcome.yml
@@ -0,0 +1,57 @@
+name: Welcome New Contributor
+
+on:
+  issues:
+    types: [opened]
+  pull_request_target:
+    types: [opened]
+
+permissions:
+  issues: write
+  pull-requests: write
+
+jobs:
+  welcome:
+    runs-on: ubuntu-latest
+    steps:
+      - name: Welcome first-time contributors
+        uses: actions/github-script@v7
+        with:
+          script: |
+            const isIssue = context.eventName === 'issues';
+            const author = isIssue
+              ? context.payload.issue.user.login
+              : context.payload.pull_request.user.login;
+
+            // Check if this is a first-time contributor
+            const { data: issues } = await github.rest.search.issuesAndPullRequests({
+              q: `author:${author} repo:${context.repo.owner}/${context.repo.repo} is:issue`,
+              per_page: 1,
+            });
+            const { data: prs } = await github.rest.search.issuesAndPullRequests({
+              q: `author:${author} repo:${context.repo.owner}/${context.repo.repo} is:pr`,
+              per_page: 1,
+            });
+
+            const totalContributions = issues.total_count + prs.total_count;
+            if (totalContributions > 1) return;
+
+            const message = isIssue
+              ? `👋 Welcome @${author}! Thanks for opening your first issue. We'll take a look soon.\n\n💡 Tip: Check out our [contributing guide](https://github.com/i-need-token/ai-models/blob/main/CONTRIBUTING.md) for ways to get involved.`
+              : `👋 Welcome @${author}! Thanks for your first pull request! We appreciate your contribution.\n\n🔍 A maintainer will review your PR shortly. In the meantime, make sure the CI checks pass.`;
+
+            if (isIssue) {
+              await github.rest.issues.createComment({
+                owner: context.repo.owner,
+                repo: context.repo.repo,
+                issue_number: context.issue.number,
+                body: message,
+              });
+            } else {
+              await github.rest.pulls.createReviewComment({
+                owner: context.repo.owner,
+                repo: context.repo.repo,
+                pull_number: context.payload.pull_request.number,
+                body: message,
+              });
+            }
diff --git a/.gitignore b/.gitignore
index 0b655613..c8346f5b 100644
--- a/.gitignore
+++ b/.gitignore
@@ -3,3 +3,9 @@ dist/
 .claude/
 .pi/
 *.local
+*.tsbuildinfo
+dist/
+models.csv
+stats.json
+social-preview.png
+site/models.json
diff --git a/.npmignore b/.npmignore
new file mode 100644
index 00000000..14ab81cf
--- /dev/null
+++ b/.npmignore
@@ -0,0 +1,36 @@
+# Source files (not needed in npm package)
+scripts/
+.github/
+site/
+docs/
+*.ts
+!types/**/*.ts
+
+# Config files
+tsconfig.json
+tsconfig.build.json
+.husky/
+.claude/
+.pi/
+
+# Generated / temp files
+*.tsbuildinfo
+models.csv
+stats.json
+social-preview.svg
+
+# Dev dependencies
+node_modules/
+
+# Misc
+.gitignore
+AGENTS.md
+CHANGELOG.md
+CODE_OF_CONDUCT.md
+CONTRIBUTING.md
+SECURITY.md
+CITATION.cff
+schema.json
+llms.txt
+llms-full.txt
+action.yml
\ No newline at end of file
diff --git a/AGENTS.md b/AGENTS.md
index 11c1c000..6d222558 100644
--- a/AGENTS.md
+++ b/AGENTS.md
@@ -10,6 +10,63 @@ A structured catalog of AI model providers and their models, stored as YAML file
 - [`types/schemas.ts`](types/schemas.ts) — Zod runtime validation schemas
 - [`docs/data-acquisition.md`](docs/data-acquisition.md) — How we acquire and update model data ([中文](docs/zh/data-acquisition.md))
 - [`docs/lessons-learned.md`](docs/lessons-learned.md) — Design principles and pitfalls ([中文](docs/zh/lessons-learned.md))
+- [`docs/context-windows.md`](docs/context-windows.md) — Context window comparison by size and pricing ([中文](docs/zh/context-windows.md))
+- [`docs/large-context-models.md`](docs/large-context-models.md) — 2,195 models with 128K+ context, 397 with 1M+ ([中文](docs/zh/large-context-models.md))
+- [`docs/small-models.md`](docs/small-models.md) — 1,153 small/edge models under 10B params ([中文](docs/zh/small-models.md))
+- [`docs/provider-comparison.md`](docs/provider-comparison.md) — Top 30 providers by model count and capabilities ([中文](docs/zh/provider-comparison.md))
+- [`docs/free-models.md`](docs/free-models.md) — 81 free AI models by capability ([中文](docs/zh/free-models.md))
+- [`docs/open-weights.md`](docs/open-weights.md) — 513 open-weight models ([中文](docs/zh/open-weights.md))
+- [`docs/reasoning-models.md`](docs/reasoning-models.md) — 1,306 reasoning models ([中文](docs/zh/reasoning-models.md))
+- [`docs/tool-calling.md`](docs/tool-calling.md) — 2,350 tool-calling models ([中文](docs/zh/tool-calling.md))
+- [`docs/vision-models.md`](docs/vision-models.md) — 1,487 vision models ([中文](docs/zh/vision-models.md))
+- [`docs/video-models.md`](docs/video-models.md) — 167 video models ([中文](docs/zh/video-models.md))
+- [`docs/image-generation.md`](docs/image-generation.md) — 28 image generation models ([中文](docs/zh/image-generation.md))
+- [`docs/audio-models.md`](docs/audio-models.md) — 118 audio input + 34 audio output models ([中文](docs/zh/audio-models.md))
+- [`docs/code-models.md`](docs/code-models.md) — 189 code-focused models across 41 providers ([中文](docs/zh/code-models.md))
+- [`docs/agentic-models.md`](docs/agentic-models.md) — Models with tool calling + reasoning for AI agents ([中文](docs/zh/agentic-models.md))
+- [`docs/openai-alternatives.md`](docs/openai-alternatives.md) — GPT-4/GPT-3.5 alternatives with pricing, free options, OpenAI-compatible providers ([中文](docs/zh/openai-alternatives.md))
+- [`docs/chat-models.md`](docs/chat-models.md) — 2,350 models with tool calling for chat applications ([中文](docs/zh/chat-models.md))
+- [`docs/multimodal-models.md`](docs/multimodal-models.md) — 1,519 models with image/audio/video input ([中文](docs/zh/multimodal-models.md))
+- [`docs/embedding-models.md`](docs/embedding-models.md) — 5 embedding models for search, RAG, similarity ([中文](docs/zh/embedding-models.md))
+- [`docs/structured-output.md`](docs/structured-output.md) — 829 structured output models ([中文](docs/zh/structured-output.md))
+- [`docs/modality-matrix.md`](docs/modality-matrix.md) — Model capabilities matrix ([中文](docs/zh/modality-matrix.md))
+- [`docs/providers.md`](docs/providers.md) — Provider overview by type and market ([中文](docs/zh/providers.md))
+- [`docs/model-comparison.md`](docs/model-comparison.md) — Model comparison tables ([中文](docs/zh/model-comparison.md))
+- [`docs/pricing-comparison.md`](docs/pricing-comparison.md) — Pricing comparison across providers ([中文](docs/zh/pricing-comparison.md))
+- [`docs/cached-pricing.md`](docs/cached-pricing.md) — Models with prompt caching, 50-90% input cost savings ([中文](docs/zh/cached-pricing.md))
+- [`docs/data-schema.md`](docs/data-schema.md) — Data schema reference ([中文](docs/zh/data-schema.md))
+- [`docs/quick-start.md`](docs/quick-start.md) — Quick start guide ([中文](docs/zh/quick-start.md))
+- [`docs/model-selection.md`](docs/model-selection.md) — Model selection guide: free, best value, large context ([中文](docs/zh/model-selection.md))
+- [`docs/model-selection-cheatsheet.md`](docs/model-selection-cheatsheet.md) — Model selection cheatsheet: best model by budget and use case ([中文](docs/zh/model-selection-cheatsheet.md))
+- [`docs/small-language-models.md`](docs/small-language-models.md) — Small language models guide: 2,002 SLMs for edge and mobile ([中文](docs/zh/small-language-models.md))
+- [`docs/benchmarks.md`](docs/benchmarks.md) — AI Model Benchmarks & Leaderboards: key benchmarks, leaderboard landscape, interpretation guide ([中文](docs/zh/benchmarks.md))
+- [`docs/migration-guide.md`](docs/migration-guide.md) — Switch providers: pricing, API compatibility, checklist ([中文](docs/zh/migration-guide.md))
+- [`docs/api.md`](docs/api.md) — API & programmatic access ([中文](docs/zh/api.md))
+- [`docs/code-examples.md`](docs/code-examples.md) — code examples in multiple languages ([中文](docs/zh/code-examples.md))
+- [`docs/faq.md`](docs/faq.md) — frequently asked questions ([中文](docs/zh/faq.md))
+- [`docs/glossary.md`](docs/glossary.md) — key terms and definitions ([中文](docs/zh/glossary.md))
+
+## SEO Comparison Pages
+
+Curated standalone pages targeting high-volume search queries. All cross-linked with JSON-LD Article schema and OpenGraph/Twitter meta tags.
+
+- [`site/best-ai-models.html`](site/best-ai-models.html) — Best AI Models in 2025 (curated picks, quick compare)
+- [`site/free-ai-models.html`](site/free-ai-models.html) — Free AI Models (81 models, zero cost)
+- [`site/llm-pricing.html`](site/llm-pricing.html) — LLM Pricing Comparison (95 providers, cheapest per tier)
+- [`site/openai-alternatives.html`](site/openai-alternatives.html) — OpenAI Alternatives (95 providers, flagship comparison)
+- [`site/ai-models-by-provider.html`](site/ai-models-by-provider.html) — AI Models by Provider (95 providers, 20 detailed sections)
+- [`site/context-window-comparison.html`](site/context-window-comparison.html) — Context Window Comparison (7 context tiers, cheapest per tier)
+- [`site/best-ai-models-for-coding.html`](site/best-ai-models-for-coding.html) — Best AI Models for Coding (flagship, value, free, open-weight, large context, agentic)
+- [`site/best-ai-models-for-agents.html`](site/best-ai-models-for-agents.html) — Best AI Models for Agents (full-stack agentic, TC+reasoning, cheapest TC, free TC)
+- [`site/reasoning-models-comparison.html`](site/reasoning-models-comparison.html) — Reasoning Models Comparison (flagship head-to-head, cheapest, free, open weights, reasoning+TC)
+- [`site/cheapest-ai-models.html`](site/cheapest-ai-models.html) — Cheapest AI Models (cheapest overall, TC, reasoning, vision, 128K+, per provider)
+- [`site/tool-calling-models-comparison.html`](site/tool-calling-models-comparison.html) — Tool Calling Models Comparison (flagship, cheapest, free, open weights, TC+reasoning, TC+vision, TC+large context)
+- [`site/ai-model-pricing-calculator.html`](site/ai-model-pricing-calculator.html) — AI Model Pricing Calculator (interactive cost calculator, quick comparison, cheapest tables)
+- [`site/best-ai-models-for-image-generation.html`](site/best-ai-models-for-image-generation.html) — Best AI Models for Image Generation (DALL·E, Imagen, GPT-5 Image, Midjourney, cheapest, free, open-weight)
+- [`site/best-ai-models-for-vision.html`](site/best-ai-models-for-vision.html) — Best AI Models for Vision (GPT-4o, Claude, Gemini, 1,487 vision models, cheapest, free, vision+tool_call, vision+large context)
+- [`site/structured-output-models-comparison.html`](site/structured-output-models-comparison.html) — Structured Output Models Comparison (829 structured output models, JSON mode, SO+tool_call, SO+reasoning, cheapest, free)
+- [`site/open-source-ai-models.html`](site/open-source-ai-models.html) — Open Source AI Models (527 open-weight models, free, tool calling, reasoning, vision, large context)
+- [`site/multimodal-ai-models.html`](site/multimodal-ai-models.html) — Multimodal AI Models (1,548 vision/audio/image models, modality breakdown, flagship, free)
 
 ## Key Design Decisions
 
diff --git a/CHANGELOG.md b/CHANGELOG.md
new file mode 100644
index 00000000..2612d240
--- /dev/null
+++ b/CHANGELOG.md
@@ -0,0 +1,85 @@
+# Changelog
+
+All notable changes to the AI Models Catalog.
+
+## v0.1.0 (2026-05)
+
+### Core Data
+
+- **95 providers** with structured YAML model data
+- **4,587 model files** covering 2,712 unique model IDs across 441 families
+- TypeScript type definitions (`types/model.ts`, `types/pricing.ts`, `types/provider.ts`)
+- Zod runtime validation schemas (`types/schemas.ts`)
+- JSON Schema for YAML validation (`schema.json`)
+- Automated scrape scripts for each provider (`providers/<id>/scrape.ts`)
+- CLI tools: `scripts/sync.ts`, `scripts/validate.ts`, `scripts/stats.ts`, `scripts/compile.ts`, `scripts/export-csv.ts`
+
+### Programmatic Access
+
+- npm package (`ai-models`) with TypeScript types and JSON data
+- jsDelivr CDN access (`cdn.jsdelivr.net/npm/ai-models@latest/models.json`)
+- CSV export (`models.csv`) available from GitHub Releases
+- Reusable GitHub Action (`action.yml`) for CI/CD pipelines
+- Hugging Face dataset sync (`huggingface.co/datasets/i-need-token/ai-models`)
+- Interactive model catalog on GitHub Pages (`i-need-token.github.io/ai-models/`)
+
+### Documentation (22 EN + 22 ZH = 44 pages)
+
+- [Quick Start](docs/quick-start.md) — find the right model in 30 seconds
+- [API & Programmatic Access](docs/api.md) — npm, CDN, CSV, GitHub Action, Hugging Face
+- [FAQ](docs/faq.md) — common questions about the catalog, data, and contributing
+- [Glossary](docs/glossary.md) — key terms and definitions for AI model terminology
+- [Code Examples](docs/code-examples.md) — TypeScript, Python, Go, Rust, jq, Excel
+- [Model Comparison](docs/model-comparison.md) — flagship, cost-effective, free, open-weight
+- [Pricing Comparison](docs/pricing-comparison.md) — side-by-side pricing across providers
+- [Context Window Comparison](docs/context-windows.md) — largest context windows by tier
+- [Modality Matrix](docs/modality-matrix.md) — which models support what modalities
+- [Tool Calling Models](docs/tool-calling.md) — 2,350 tool-calling models
+- [Reasoning Models](docs/reasoning-models.md) — 1,306 reasoning models
+- [Structured Output](docs/structured-output.md) — 829 JSON-mode models
+- [Vision Models](docs/vision-models.md) — 1,487 vision models
+- [Video Models](docs/video-models.md) — 167 video input models
+- [Audio Models](docs/audio-models.md) — 118 audio input + 34 audio output models
+- [Image Generation](docs/image-generation.md) — 28 image generation models
+- [Free AI Models](docs/free-models.md) — 81 free models
+- [Open-Weight Models](docs/open-weights.md) — 527 open-weight models
+- [Provider Overview](docs/providers.md) — all 95 providers by type and market
+- [Data Schema Reference](docs/data-schema.md) — complete YAML schema
+- [Data Acquisition](docs/data-acquisition.md) — how we acquire and update model data
+- [Design Principles](docs/lessons-learned.md) — lessons learned from building the catalog
+- All docs available in Chinese (`docs/zh/`) with cross-language links
+
+### Community & Infrastructure
+
+- CONTRIBUTING.md with Good First Issues table
+- CODE_OF_CONDUCT.md, SECURITY.md, CHANGELOG.md
+- CITATION.cff for academic discoverability (18 keywords)
+- 6 GitHub issue templates + PR template + config.yml
+- 10 CI workflows (validate, stats, release, publish, sync, sync-hf, pages, labeler, auto-merge, welcome)
+- PR auto-labeler, Dependabot auto-merge, Renovate config
+- Welcome workflow for first-time contributors
+- CODEOWNERS, .editorconfig, .npmignore, Makefile
+- llms.txt + llms-full.txt for AI discoverability
+- Social preview SVG, robots.txt, sitemap.xml for SEO
+
+### Provider Coverage
+
+- **Model producers**: OpenAI, Anthropic, Google, Meta, DeepSeek, Alibaba Cloud, Mistral, xAI, Cohere, NVIDIA, IBM, Microsoft, and 18 more
+- **Inference platforms**: OpenRouter, Together AI, Fireworks AI, Groq, Cerebras, DeepInfra, and 40+ more
+- **Cloud provider hosted**: Amazon Bedrock, Azure OpenAI, Google Vertex AI
+- **Chinese market**: 20 providers with CNY pricing
+- **European market**: 7 providers with EUR pricing
+
+### Data Highlights
+
+- 1,306 reasoning models
+- 2,350 tool-calling models
+- 829 structured output models
+- 527 open-weight models
+- 81 free models
+- 1,487 vision (image input) models
+- 28 image output models
+- 118 audio input models
+- 34 audio output models
+- 167 video input models
+- Context windows up to 10M tokens (Llama 4 Scout)
diff --git a/CITATION.cff b/CITATION.cff
new file mode 100644
index 00000000..2ddb6e4d
--- /dev/null
+++ b/CITATION.cff
@@ -0,0 +1,49 @@
+cff-version: 1.2.0
+message: "If you use this catalog in your research, please cite it as below."
+title: "AI Models Catalog"
+type: dataset
+authors:
+  - given-names: "i-need-token"
+repository-code: "https://github.com/i-need-token/ai-models"
+url: "https://github.com/i-need-token/ai-models"
+abstract: >
+  A structured YAML catalog of 4,587 AI models across 95 providers,
+  including pricing, context windows, modalities, and capabilities.
+  All data sourced from first-party APIs and official documentation.
+keywords:
+  - ai-models
+  - llm
+  - pricing
+  - model-catalog
+  - yaml
+  - structured-data
+  - open-data
+  - tool-calling
+  - reasoning-models
+  - vision-models
+  - open-weights
+  - context-window
+  - structured-output
+  - image-generation
+  - free-models
+  - github-action
+  - cdn
+  - huggingface
+  - model-selection
+  - prompt-caching
+  - cached-pricing
+  - audio-models
+  - video-models
+  - code-models
+  - agentic-models
+  - modality-matrix
+  - chat-models
+  - multimodal-models
+  - embedding-models
+  - migration-guide
+  - provider-comparison
+  - large-context-models
+  - small-models
+license: MIT
+version: 0.2.2
+date-released: "2026-05-21"
diff --git a/CODE_OF_CONDUCT.md b/CODE_OF_CONDUCT.md
new file mode 100644
index 00000000..2be142d8
--- /dev/null
+++ b/CODE_OF_CONDUCT.md
@@ -0,0 +1,77 @@
+# Contributor Covenant Code of Conduct
+
+## Our Pledge
+
+We as members, contributors, and leaders pledge to make participation in our community a harassment-free experience for everyone, regardless of age, body size, visible or invisible disability, ethnicity, sex characteristics, gender identity and expression, level of experience, education or socio-economic status, nationality, personal appearance, race, caste, color, religion, or sexual identity and orientation.
+
+We pledge to act and interact in ways that contribute to an open, welcoming, diverse, inclusive, and healthy community.
+
+## Our Standards
+
+Examples of behavior that contributes to a positive environment for our community include:
+
+- Demonstrating empathy and kindness toward other people
+- Being respectful of differing opinions, viewpoints, and experiences
+- Giving and gracefully accepting constructive feedback
+- Accepting responsibility and apologizing to those affected by our mistakes, and learning from the experience
+- Focusing on what is best not just for us as individuals, but for the overall community
+
+Examples of unacceptable behavior include:
+
+- The use of sexualized language or imagery, and sexual attention or advances of any kind
+- Trolling, insulting or derogatory comments, and personal or political attacks
+- Public or private harassment
+- Publishing others' private information, such as a physical or email address, without their explicit permission
+- Other conduct which could reasonably be considered inappropriate in a professional setting
+
+## Enforcement Responsibilities
+
+Community leaders are responsible for clarifying and enforcing our standards of acceptable behavior and will take appropriate and fair corrective action in response to any behavior that they deem inappropriate, threatening, offensive, or harmful.
+
+Community leaders have the right and responsibility to remove, edit, or reject comments, commits, code, wiki edits, issues, and other contributions that are not aligned to this Code of Conduct, and will communicate reasons for moderation decisions when appropriate.
+
+## Scope
+
+This Code of Conduct applies within all community spaces, and also applies when an individual is officially representing the community in public spaces. Examples of representing our community include using an official e-mail address, posting via an official social media account, or acting as an appointed representative at an online or offline event.
+
+## Enforcement
+
+Instances of abusive, harassing, or otherwise unacceptable behavior may be reported to the community leaders responsible for enforcement through [GitHub Issues](https://github.com/i-need-token/ai-models/issues) or directly via email. All complaints will be reviewed and investigated promptly and fairly.
+
+All community leaders are obligated to respect the privacy and security of the reporter of any incident.
+
+## Enforcement Guidelines
+
+Community leaders will follow these Community Impact Guidelines in determining the consequences for any action they deem in violation of this Code of Conduct:
+
+### 1. Correction
+
+**Community Impact**: Use of inappropriate language or other behavior deemed unprofessional or unwelcome in the community.
+
+**Consequence**: A private, written warning from community leaders, providing clarity around the nature of the violation and an explanation of why the behavior was inappropriate. A public apology may be requested.
+
+### 2. Warning
+
+**Community Impact**: A violation through a single incident or series of actions.
+
+**Consequence**: A warning with consequences for continued behavior. No interaction with the people involved, including unsolicited interaction with those enforcing the Code of Conduct, for a specified period of time. This includes avoiding interactions in community spaces as well as external channels like social media. Violating these terms may lead to a temporary or permanent ban.
+
+### 3. Temporary Ban
+
+**Community Impact**: A serious violation of community standards, including sustained inappropriate behavior.
+
+**Consequence**: A temporary ban from any sort of interaction or public communication with the community for a specified period of time. No public or private interaction with the people involved, including unsolicited interaction with those enforcing the Code of Conduct, is allowed during this period. Violating these terms may lead to a permanent ban.
+
+### 4. Permanent Ban
+
+**Community Impact**: Demonstrating a pattern of violation of community standards, including sustained inappropriate behavior, harassment of an individual, or aggression toward or disparagement of classes of individuals.
+
+**Consequence**: A permanent ban from any sort of public interaction within the community.
+
+## Attribution
+
+This Code of Conduct is adapted from the [Contributor Covenant](https://www.contributor-covenant.org/), version 2.1, available at [https://www.contributor-covenant.org/version/2/1/code_of_conduct.html](https://www.contributor-covenant.org/version/2/1/code_of_conduct.html).
+
+Community Impact Guidelines were inspired by [Mozilla's code of conduct enforcement ladder](https://github.com/divmain/pull-mozilla-coc).
+
+For answers to common questions about this code of conduct, see the FAQ at [https://www.contributor-covenant.org/faq](https://www.contributor-covenant.org/faq). Translations are available at [https://www.contributor-covenant.org/translations](https://www.contributor-covenant.org/translations).
diff --git a/CONTRIBUTING.md b/CONTRIBUTING.md
new file mode 100644
index 00000000..9f10e1b7
--- /dev/null
+++ b/CONTRIBUTING.md
@@ -0,0 +1,163 @@
+# Contributing to AI Models Catalog
+
+Thank you for your interest in contributing! This guide covers everything you need to add a new provider, fix data, or improve the catalog.
+
+## Quick Start
+
+> 💡 **Try the [Interactive Catalog](https://i-need-token.github.io/ai-models/)** — search, sort, and filter all 4,587 models in your browser.
+
+1. Fork the repository
+2. Create your feature branch: `git checkout -b feature/my-provider`
+3. Make your changes
+4. Validate: `npx tsx scripts/validate.ts`
+5. Submit a pull request
+
+## Adding a New Provider
+
+### 1. Create the Provider Directory
+
+```
+providers/<id>/
+├── provider.yaml    # Provider metadata
+├── scrape.ts        # Data acquisition script
+└── models/          # Generated YAML model files
+```
+
+### 2. Create `provider.yaml`
+
+```yaml
+id: my-provider
+name: My Provider
+url: https://my-provider.com
+api_docs: https://my-provider.com/docs
+apis:
+  openai: https://api.my-provider.com/v1
+```
+
+### 3. Create `scrape.ts`
+
+Your scrape function must:
+
+- **Return structured data** — never write files directly
+- **Use first-party sources only** — the provider's own API or website
+- **Include a discovery step** — fetch the model list dynamically, never hardcode model IDs
+- **Skip models with missing data** — don't fabricate values
+
+```typescript
+import type { Model, Provider } from "../types";
+import { defineProvider } from "../scripts/lib/define-provider";
+import { defineModel } from "../scripts/lib/define-model";
+
+const provider = defineProvider({
+  id: "my-provider",
+  name: "My Provider",
+  url: "https://my-provider.com",
+  api_docs: "https://my-provider.com/docs",
+  apis: { openai: "https://api.my-provider.com/v1" },
+});
+
+export async function scrape(): Promise<{ provider: Provider; models: Model[] }> {
+  // Discover models from the provider's API
+  const resp = await fetch("https://api.my-provider.com/v1/models");
+  const data = await resp.json();
+
+  const models = data.data
+    .filter((m: any) => shouldInclude(m))
+    .map((m: any) =>
+      defineModel({
+        id: m.id,
+        name: deriveName(m.id),
+        family: deriveFamily(m.id),
+        // ... other fields from the API
+      }),
+    );
+
+  return { provider, models };
+}
+```
+
+### 4. Run and Validate
+
+```bash
+# Generate YAML files
+npx tsx scripts/sync.ts my-provider
+
+# Validate all data
+npx tsx scripts/validate.ts
+```
+
+## Provider Acceptance Criteria
+
+### Model Producers
+
+Providers that develop their own AI models. We welcome all model producers with public APIs or documentation.
+
+### Inference Platforms
+
+Inference platforms must meet **all** of these criteria:
+
+- ✅ Per-token pricing (not per-second, per-credit, or other units)
+- ✅ Pricing in USD, CNY, or EUR
+- ✅ First-party data source (public API or website)
+
+**Not accepted:**
+
+| Category            | Examples                                 | Reason                             |
+| ------------------- | ---------------------------------------- | ---------------------------------- |
+| Auth-required API   | Hyperbolic, Nebius                       | Can't scrape without credentials   |
+| Non-token pricing   | Replicate (per-second), Databricks (DBU) | Incompatible pricing model         |
+| GPU cloud           | SubModel, GMI Cloud                      | Rent GPUs, not per-token inference |
+| Enterprise/research | Abacus AI, Liquid AI                     | No public pricing/API              |
+| Model hub           | ModelScope, HuggingFace                  | Duplicate data from producers      |
+
+## Data Quality Rules
+
+- **First-party data only** — no copying from third-party aggregators
+- **Never fabricate data** — if a field is missing, omit it rather than guessing
+- **Include deprecated models** — mark with `deprecated: true`
+- **Exclude retired models** — models no longer accessible via API
+- **Dynamic discovery** — scrape functions must discover models from the source
+
+## Code Style
+
+```bash
+# Format
+npm run fmt
+
+# Lint
+npm run lint
+
+# Type check
+npm run typecheck
+
+# All checks
+npm run check
+```
+
+## Good First Issues
+
+New contributors welcome! These tasks are beginner-friendly and don't require deep knowledge of the codebase:
+
+| Task                       | How                                                                                                                 | Difficulty |
+| -------------------------- | ------------------------------------------------------------------------------------------------------------------- | ---------- |
+| Fix incorrect model data   | Find the model YAML in `providers/<id>/models/`, correct it, run `npx tsx scripts/validate.ts`                      | Easy       |
+| Add a provider README      | Create `providers/<id>/README.md` describing the data source and scraping strategy (see existing examples)          | Easy       |
+| Update outdated pricing    | Re-run `npx tsx providers/<id>/scrape.ts` and review the diff                                                       | Easy       |
+| Add missing model features | Add `tool_call`, `structured_output`, `reasoning`, etc. to model YAML files where the provider docs confirm support | Easy       |
+| Translate a doc to Chinese | Copy an English doc from `docs/` to `docs/zh/` and translate                                                        | Medium     |
+
+Look for issues labeled [`good first issue`](https://github.com/i-need-token/ai-models/labels/good%20first%20issue) or [`help wanted`](https://github.com/i-need-token/ai-models/labels/help%20wanted).
+
+## Reporting Issues
+
+- **Incorrect model data** — open an issue with the provider name, model ID, and what's wrong
+- **Missing provider** — open an issue with the provider name and a link to their API/docs
+- **Bug in scrape script** — open an issue with the error output and steps to reproduce
+
+## Questions?
+
+Check the documentation first:
+
+- [Data Acquisition Guide](docs/data-acquisition.md) — detailed scraping guidelines
+- [Design Principles & Pitfalls](docs/lessons-learned.md) — lessons learned from building the catalog
+- [数据采集（中文）](docs/zh/data-acquisition.md) — 中文版数据采集指南
diff --git a/LICENSE b/LICENSE
index aab0cadd..5eff32d0 100644
--- a/LICENSE
+++ b/LICENSE
@@ -1,6 +1,6 @@
 MIT License
 
-Copyright (c) 2025 ai-models contributors
+Copyright (c) 2025-2026 ai-models contributors
 
 Permission is hereby granted, free of charge, to any person obtaining a copy
 of this software and associated documentation files (the "Software"), to deal
diff --git a/Makefile b/Makefile
new file mode 100644
index 00000000..9684e368
--- /dev/null
+++ b/Makefile
@@ -0,0 +1,37 @@
+.PHONY: install validate scrape build stats csv clean
+
+install:
+	npm install
+
+validate:
+	npm run validate
+
+scrape:
+	npm run scrape-all
+
+build:
+	npm run build
+
+stats:
+	npm run stats
+
+csv:
+	npm run export-csv
+
+clean:
+	rm -rf dist/ *.tsbuildinfo models.csv stats.json
+
+lint:
+	npm run lint
+
+fmt:
+	npx oxfmt --write .
+
+fmt-check:
+	npx oxfmt --check .
+
+typecheck:
+	npx tsc --noEmit
+
+check: fmt-check lint typecheck validate
+	@echo "All checks passed!"
diff --git a/README.md b/README.md
index 63d122fa..6551bc95 100644
--- a/README.md
+++ b/README.md
@@ -1,41 +1,225 @@
-# AI Models Catalog
+<div align="center">
 
-A structured, machine-readable catalog of AI model providers and their models. All data is sourced from first-party APIs and official documentation — no third-party aggregators.
+# 🤖 AI Models Catalog [![Awesome](https://awesome.re/badge-flat2.svg)](https://github.com/sindresorhus/awesome)
 
-## Data Format
+**The most comprehensive structured catalog of AI models on GitHub**
 
-Model data is stored as YAML files under `providers/<provider>/models/`. Each file represents one model with its snapshots:
+95 providers · 4,587 model files · 2,712 unique model IDs · First-party data only
+
+[![License: MIT](https://img.shields.io/badge/License-MIT-blue.svg)](LICENSE)
+[![npm version](https://img.shields.io/npm/v/ai-models.svg)](https://www.npmjs.com/package/ai-models)
+[![Hugging Face](https://img.shields.io/badge/%F0%9F%A4%97-Dataset-blue)](https://huggingface.co/datasets/i-need-token/ai-models)
+[![Models](https://img.shields.io/endpoint?url=https://raw.githubusercontent.com/i-need-token/ai-models/main/.github/badges/models.json)](providers/)
+[![Providers](https://img.shields.io/endpoint?url=https://raw.githubusercontent.com/i-need-token/ai-models/main/.github/badges/providers.json)](providers/)
+[![CI](https://github.com/i-need-token/ai-models/actions/workflows/validate.yml/badge.svg)](https://github.com/i-need-token/ai-models/actions/workflows/validate.yml) [![GitHub stars](https://img.shields.io/github/stars/i-need-token/ai-models?style=social)](https://github.com/i-need-token/ai-models/stargazers) [![Last Updated](https://img.shields.io/github/last-commit/i-need-token/ai-models?label=updated)](https://github.com/i-need-token/ai-models/commits/main) [![Star History](https://api.star-history.com/svg?repos=i-need-token/ai-models&type=Date)](https://star-history.com/#i-need-token/ai-models&Date)
+
+</div>
+
+> ⭐ **If this catalog helps you choose the right model, please star this repo — it helps others discover it!**
+
+---
+
+Machine-readable YAML catalog of every major AI model provider and their models — pricing, context windows, modalities, capabilities, and more. All data sourced from first-party APIs and official documentation, never third-party aggregators.
+
+**[Quick start →](docs/quick-start.md)** · **[Choose a model →](docs/model-selection.md)** · **[Compare pricing →](docs/pricing-comparison.md)** · **[🔍 Search →](https://i-need-token.github.io/ai-models/)** · **[Download CSV →](https://github.com/i-need-token/ai-models/releases/latest/download/models.csv)** · **[JSON →](https://github.com/i-need-token/ai-models/releases/latest/download/models.json)**
+
+> 🆓 **81 free models** with tool calling, reasoning, and vision — [see the list →](docs/free-models.md) · 💰 **Cheapest models from $0.01/M tokens** — [compare pricing →](docs/pricing-comparison.md) · 🤖 **1,080 agentic models** for AI agents — [find yours →](docs/agentic-models.md)
+
+> 💡 **Try it now** — fetch model data in one command:
+>
+> ```bash
+> curl -sL https://github.com/i-need-token/ai-models/releases/latest/download/models.json | python3 -c "import sys,json; d=json.load(sys.stdin); print(f'{len(d["models"])} models across {len(set(m["provider"] for m in d["models"]))} providers')"
+> ```
+
+## 💡 Quick Value Demo
+
+> **What's the cheapest model with tool calling?** → ling-2.6-flash at **$0.01/$0.03** per M tokens ([see all 2,350 →](docs/tool-calling.md))
+> **What's the best free reasoning model?** → DeepSeek R1 — **92% MATH-500** ([see all 81 free →](docs/free-models.md))
+> **Which model has the largest context window?** → Gemini 2.5 Pro — **1,048,576 tokens** ([see all context windows →](docs/context-windows.md))
+
+## 🖥️ Interactive Catalog
+
+[![AI Models Catalog — Interactive model comparison tool](docs/images/catalog-screenshot.png)](https://i-need-token.github.io/ai-models/)
+
+<details>
+<summary>🎬 Watch demo (filter, sort, dark mode, calculator)</summary>
+
+![Demo: filter by free models, sort by price, toggle dark mode, use price calculator](docs/images/catalog-demo.gif)
+
+</details>
+
+**[Try it live →](https://i-need-token.github.io/ai-models/)** — Search, filter, compare 4,587+ models with 25+ features including dark/light theme, keyboard shortcuts, price calculator, and model picker wizard.
+
+<details>
+<summary>📊 AI Models Landscape — providers, capabilities, pricing, context windows at a glance</summary>
+
+![AI Models Landscape 2025 — 4,587 models across 95 providers](docs/images/ai-models-landscape.png)
+
+</details>
+
+## Why This Catalog?
+
+|                                         |                                                                           |
+| --------------------------------------- | ------------------------------------------------------------------------- |
+| 🔍 **Compare models at a glance**       | Pricing, context windows, capabilities — all in one place, all structured |
+| 📊 **4,587 models across 95 providers** | From OpenAI to Zhipu, from cloud APIs to open-weights                     |
+| ✅ **First-party data only**            | Every data point comes from the provider's own API or docs                |
+| 🤖 **Machine-readable YAML**            | TypeScript types + Zod validation = programmatic access with confidence   |
+| 🔄 **Automated sync**                   | Scrape scripts pull fresh data from provider APIs                         |
+
+## Contents
+
+- [Quick Compare](#quick-compare)
+- [🏆 Model Picks](#-model-picks)
+- [Use Cases](#use-cases)
+- [Quick Numbers](#quick-numbers)
+- [Example Model](#example-model)
+- [Programmatic Usage](#programmatic-usage)
+- [GitHub Action](#use-as-github-action)
+- [Documentation](#documentation)
+- [Provider Showcase](#provider-showcase)
+- [Contributing](#contributing)
+- [Who's Using This](#whos-using-this)
+- [License](#license)
+
+## Quick Compare
+
+> Popular models at a glance — full data for [4,587 models](docs/model-comparison.md)
+
+| Model            | Provider  | Context | Input $/M | Output $/M | Tools | Reason | Vision |
+| ---------------- | --------- | ------- | --------- | ---------- | ----- | ------ | ------ |
+| gpt-4.1          | openai    | 1M      | $2        | $8         | ✓     |        | ✓      |
+| gpt-4.1-mini     | openai    | 1M      | $0.40     | $1.60      | ✓     |        | ✓      |
+| gpt-4.1-nano     | openai    | 1M      | $0.10     | $0.40      | ✓     |        | ✓      |
+| o3               | openai    | 200K    | $10       | $40        | ✓     | ✓      | ✓      |
+| o4-mini          | openai    | 200K    | $1.10     | $4.40      | ✓     | ✓      | ✓      |
+| claude-opus-4    | anthropic | 200K    | $15       | $75        | ✓     | ✓      | ✓      |
+| claude-sonnet-4  | anthropic | 200K    | $3        | $15        | ✓     | ✓      | ✓      |
+| claude-haiku-4   | anthropic | 200K    | $1        | $5         | ✓     | ✓      | ✓      |
+| gemini-2.5-pro   | google    | 1M      | $1.25     | $10        | ✓     | ✓      | ✓      |
+| gemini-2.5-flash | google    | 1M      | $0.15     | $0.60      | ✓     | ✓      | ✓      |
+| deepseek-r1      | deepseek  | 128K    | $0.55     | $2.19      |       | ✓      |        |
+| deepseek-chat    | deepseek  | 128K    | $0.14     | $0.28      | ✓     |        |        |
+| llama-4-maverick | meta      | 1M      | $0.20     | $0.20      | ✓     |        | ✓      |
+| llama-4-scout    | meta      | 10M     | $0.03     | $0.03      | ✓     |        | ✓      |
+| grok-3           | xai       | 131K    | $3        | $15        | ✓     |        | ✓      |
+| grok-3-mini      | xai       | 131K    | $0.30     | $0.50      | ✓     | ✓      | ✓      |
+| mistral-large    | mistral   | 128K    | $2        | $6         | ✓     |        | ✓      |
+| qwen3-235b-a22b  | alibaba   | 128K    | $0.14     | $0.42      | ✓     | ✓      | ✓      |
+| qwen3-30b-a3b    | alibaba   | 128K    | $0.03     | $0.05      | ✓     | ✓      | ✓      |
+
+<details><summary>📖 How to read this table</summary>
+
+- **Context**: Maximum context window (input + output tokens)
+- **Input/Output $/M**: Price per million tokens
+- **Tools**: Supports function/tool calling
+- **Reason**: Uses chain-of-thought reasoning
+- **Vision**: Accepts image input
+- Prices shown are for standard (non-cached) API calls. Many providers offer 50-90% discounts for cached inputs.
+
+</details>
+
+## 🏆 Model Picks
+
+> Curated recommendations for common use cases — from [4,587 models](docs/model-comparison.md) across 95 providers
+
+| Use Case              | Model            | Why                                     | Input $/M | Context |
+| --------------------- | ---------------- | --------------------------------------- | --------- | ------- |
+| **Coding**            | gpt-4.1          | Best code generation + 1M context       | $2        | 1M      |
+| **Coding (cheap)**    | gpt-4.1-nano     | 20x cheaper, great for autocomplete     | $0.10     | 1M      |
+| **Reasoning**         | o4-mini          | Best cost-effective reasoning           | $1.10     | 200K    |
+| **Reasoning (power)** | claude-opus-4    | Deepest reasoning for hard problems     | $15       | 200K    |
+| **Agents**            | claude-sonnet-4  | Best tool use + reasoning balance       | $3        | 200K    |
+| **Agents (cheap)**    | gemini-2.5-flash | Fastest agent loop under $1             | $0.15     | 1M      |
+| **Vision**            | gemini-2.5-pro   | Best multimodal understanding           | $1.25     | 1M      |
+| **Free**              | llama-4-scout    | 10M context, open weights, free on Groq | $0        | 10M     |
+| **Open weights**      | deepseek-r1      | Best open reasoning model               | $0.55     | 128K    |
+| **Large context**     | gemini-2.5-flash | 1M context at lowest price              | $0.15     | 1M      |
+
+## Use Cases
+
+| Use Case                       | How This Catalog Helps                                                                                                                             |
+| ------------------------------ | -------------------------------------------------------------------------------------------------------------------------------------------------- |
+| 💰 **Find the cheapest model** | [Pricing comparison](docs/pricing-comparison.md) across 95 providers                                                                               |
+| 🔎 **Pick the right model**    | [Model comparison](docs/model-comparison.md) by capability, context, cost                                                                          |
+| 🔍 **Search & compare models** | [Interactive catalog](https://i-need-token.github.io/ai-models/) — search, filter, compare, price calc, model picker, copy-as-code, share, j/k nav |
+| 🔌 **Build an API gateway**    | Structured pricing + modality data for routing decisions                                                                                           |
+| 📊 **Track the AI landscape**  | 2,712 models with release dates, deprecation status                                                                                                |
+| 🤖 **Power an AI tool**        | TypeScript types + Zod validation = type-safe access                                                                                               |
+| 🌍 **Find local/EU providers** | [Provider overview](docs/providers.md) with market segmentation                                                                                    |
+| 🎯 **Choose the right model**  | [Model selection guide](docs/model-selection.md) — decision framework                                                                              |
+| 💸 **Optimize API costs**      | [Cached pricing](docs/cached-pricing.md) — 1,374 models with 50-90% savings                                                                        |
+| 🧪 **Prototype for free**      | [Free models](docs/free-models.md) — 81 models at zero cost                                                                                        |
+| 💬 **Build chat apps**         | [Chat models](docs/chat-models.md) — 2,350 models with tool calling                                                                                |
+| 🖼️ **Process images/audio**    | [Multimodal models](docs/multimodal-models.md) — 1,519 models with vision/audio/video                                                              |
+| 🔎 **Power semantic search**   | [Embedding models](docs/embedding-models.md) — vector search & RAG                                                                                 |
+| 🤖 **Build AI agents**         | [Agentic models](docs/agentic-models.md) — 1,080 models with tool_call + reasoning                                                                 |
+| 💻 **Generate & review code**  | [Code models](docs/code-models.md) — 189 code-focused models                                                                                       |
+| 🎙️ **Add voice/speech**        | [Audio models](docs/audio-models.md) — 118 audio input + 34 audio output                                                                           |
+| 🔄 **Switch from OpenAI**      | [OpenAI alternatives](docs/openai-alternatives.md) — pricing, free options, compat                                                                 |
+
+## Quick Numbers
+
+| Metric                      | Count |
+| --------------------------- | ----: |
+| Providers                   |    95 |
+| Model files                 | 4,587 |
+| Unique model IDs            | 2,712 |
+| Model families              |   441 |
+| Reasoning models            | 1,306 |
+| Tool-calling models         | 2,350 |
+| Open-weight models          |   527 |
+| Free models                 |    81 |
+| Vision (image input) models | 1,487 |
+| Image output models         |    28 |
+| Audio input models          |   118 |
+| Audio output models         |    34 |
+| Video input models          |   167 |
+
+## Data at a Glance
+
+Each model is a single YAML file with structured metadata:
 
 ```yaml
-id: gpt-4o
-name: GPT-4o
-family: gpt-4o
-reasoning: true
+id: gpt-4.1
+name: GPT-4.1
+family: gpt-4.1
 tool_call: true
-attachment: true
 structured_output: true
 pricing:
-  input: 2.5
-  output: 10
-  cache_read: 1.25
+  input: 2.0 # USD per million tokens
+  output: 8.0
+  cache_read: 0.5
 limit:
-  context: 128000
-  output: 16384
+  context: 1047576 # tokens (~1M)
+  output: 32768
 modalities:
-  input:
-    - text
-    - image
-  output:
-    - text
-knowledge: "2023-10"
-release_date: "2024-05-13"
-last_updated: "2024-08-06"
-snapshots:
-  - id: gpt-4o-2024-08-06
-  - id: gpt-4o-2024-05-13
-    deprecated: true
+  input: [text, image]
+  output: [text]
+release_date: "2026-05-18"
+last_updated: "2026-05-18"
+```
+
+<details>
+<summary>Same model as JSON (from <code>models.json</code>)</summary>
+
+```json
+{
+  "id": "gpt-4.1",
+  "name": "GPT-4.1",
+  "family": "gpt-4.1",
+  "tool_call": true,
+  "structured_output": true,
+  "pricing": { "input": 2.0, "output": 8.0, "cache_read": 0.5 },
+  "limit": { "context": 1047576, "output": 32768 },
+  "modalities": { "input": ["text", "image"], "output": ["text"] },
+  "release_date": "2026-05-18",
+  "last_updated": "2026-05-18"
+}
 ```
 
+</details>
+
 ### Pricing Types
 
 | Type           | When                      | Example                         |
@@ -45,60 +229,252 @@ snapshots:
 | `UnitPricing`  | Per-image or per-request  | `unit: per_image, price: 0.04`  |
 | `FreePricing`  | No cost                   | `unit: free`                    |
 
-See [`types/pricing.ts`](types/pricing.ts) for the full type definitions.
+## Covered Providers
+
+<details>
+<summary><strong>Model Producers</strong> (develop their own models)</summary>
+
+- **Anthropic** — Claude series
+- **Google** — Gemini series
+- **Meta** — Llama series
+- **OpenAI** — GPT series
+- **DeepSeek** — DeepSeek-V/R series
+- **Alibaba Cloud** — Qwen series
+- **Mistral AI** — Mistral series
+- **Cohere** — Command series
+- **xAI** — Grok series
+- **Reka AI** — Reka series
+- **AI21 Labs** — Jamba series
+- **01.AI** — Yi series
+- **ByteDance** — Doubao series
+- **MiniMax** — MiniMax series
+- **Moonshot AI** — Kimi series
+- **Zhipu AI** — GLM series
+- **NVIDIA** — Nemotron series
+- **IBM** — Granite series
+- **Microsoft** — Phi series
+- **StepFun** — Step series
+- **iFlytek** — SparkDesk series
+- **Baidu** — ERNIE series
+- **Baichuan AI** — Baichuan series
+- **Tencent** — Hunyuan series
+- **Xiaomi** — MiMo series
+- **Sarvam AI** — Sarvam series
+- **InclusionAI** — Book series
+- **Writer** — Palmyra series
+- **Upstage** — Solar series
+- **Voyage AI** — Voyage series
+
+</details>
+
+<details>
+<summary><strong>Inference Platforms</strong> (host and serve models)</summary>
+
+- **Amazon Bedrock** — Multi-provider inference on AWS
+- **Azure OpenAI Service** — OpenAI models on Azure
+- **Google Vertex AI** — Multi-provider inference on GCP
+- **OpenRouter** — 300+ models with unified API
+- **Together AI** — Open-source model hosting
+- **Fireworks AI** — Fast inference for open models
+- **Groq** — LPU-accelerated inference
+- **Cerebras** — CS-3 wafer-scale inference
+- **DeepInfra** — Cost-effective model hosting
+- **SiliconFlow** — GPU cloud inference
+- **Novita AI** — Multi-model API
+- **SambaNova** — SN40L accelerated inference
+- **Cohere** — Command models + hosted models
+- **Databricks** — MosaicML inference
+- **Cloudflare Workers AI** — Edge inference
+- **DigitalOcean** — GPU Droplets inference
+- **Nebius** — AI cloud inference
+- **OVHcloud** — AI Endpoints
+- **Scaleway** — GPU inference
+- **Vultr** — Cloud inference
+- **Chutes** — Community inference
+- **Kluster AI** — Distributed inference
+- **NanoGPT** — Simple API, 500+ models
+- **And 40+ more platforms…**
+
+</details>
+
+<details>
+<summary><strong>Full Provider List (95)</strong></summary>
 
-## Usage
+01.AI · 302.AI · AI21 Labs · AIHubMix · AI/ML API · Aion Labs · Alibaba Cloud · Amazon Bedrock · Amazon Nova · Anthropic · Arcee AI · Auriko · Azure OpenAI · Baichuan AI · Baidu · Baseten · Berget · ByteDance · Cerebras · Chutes · Clarifai · CloudFerro Sherlock · Cloudflare Workers AI · Cohere · Cortecs · DInference · Databricks · DeepInfra · DeepSeek · DigitalOcean · evroc · FastRouter · Fireworks AI · FriendliAI · GMI Cloud · Google · Google Vertex AI · Groq · HPC-AI Cloud · Hyperbolic · IBM Granite · iFlytek SparkDesk · Inception Labs · InclusionAI · Inference.net · Kluster AI · LLM Gateway · Martian · MegaNova · Meta Llama · Microsoft Phi · MiniMax · Mistral AI · Mixlayer · MoArk AI · Moonshot AI · Morph · NanoGPT · Nebius · NeuralWatt · Nous Research · Novita AI · NVIDIA · OpenAI · OpenRouter · OrcaRouter · OVHcloud · PPIO · Perplexity · Privatemode AI · Qiniu AI · Regolo · Reka AI · Requesty · SambaNova · Sarvam AI · Scaleway · SiliconFlow · SiliconFlow CN · StepFun · SubModel · Tencent Cloud TokenHub · Tencent Hunyuan · TextSynth · Together AI · Upstage · Venice AI · Voyage AI · Vultr · Wafer · Writer · xAI Grok · Xiaomi · Zhipu AI · 接口 AI
 
-### Install Dependencies
+</details>
+
+## Quick Start
+
+### Browse the Data
+
+No installation needed — just browse `providers/<provider>/models/` for YAML files. Every file is human-readable.
+
+### Install from npm
 
 ```bash
-npm install
+npm install ai-models
 ```
 
-### Sync Model Data
+```typescript
+import catalog from "ai-models"; // 4,587 models as JSON
+import type { Model } from "ai-models"; // TypeScript types
+```
 
-Fetch the latest model data from a provider's first-party source:
+### Install & Sync
 
 ```bash
-# Sync a specific provider
+# Install dependencies
+npm install
+
+# Fetch latest data from a specific provider
 npx tsx scripts/sync.ts openai
 npx tsx scripts/sync.ts anthropic
 
-# Sync all providers
+# Fetch all providers
 npx tsx scripts/sync.ts
+
+# Validate all YAML files
+npx tsx scripts/validate.ts
+
+# Compute catalog statistics
+npx tsx scripts/stats.ts
+
+# Compile to a single models.json
+npx tsx scripts/compile.ts
+```
+
+Or use the Makefile shortcuts:
+
+```bash
+make install    # npm install
+make validate   # validate all YAML
+make scrape     # sync all providers
+make build      # compile models.json
+make stats      # compute statistics
+make check      # run all checks (fmt + lint + typecheck + validate)
 ```
 
-### Validate Model Data
+### Use Programmatically
 
-Validate all YAML files against the Zod schemas:
+```typescript
+import { ModelSchema } from "./types/schemas";
+import { parse } from "yaml";
+import { readFileSync } from "fs";
+
+// Load and validate a model
+const raw = readFileSync("providers/openai/models/gpt-4.1.yaml", "utf-8");
+const model = ModelSchema.parse(parse(raw));
+
+console.log(model.pricing); // { input: 2, output: 8, cache_read: 0.5 }
+console.log(model.limit); // { context: 1047576, output: 32768 }
+console.log(model.modalities); // { input: ["text", "image"], output: ["text"] }
+```
+
+### Download Data
+
+Available in JSON and CSV formats from [GitHub Releases](https://github.com/i-need-token/ai-models/releases/latest):
 
 ```bash
-npx tsx scripts/validate.ts
+# JSON — full metadata (2.3 MB)
+curl -sLO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — flat table for Excel/Google Sheets (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+```
+
+```html
+<!-- Use in any HTML page -->
+<script type="module">
+  const catalog = await fetch(
+    "https://github.com/i-need-token/ai-models/releases/latest/download/models.json",
+  ).then((r) => r.json());
+  console.log(catalog.models.length); // 4,587
+</script>
+```
+
+```python
+# Python — no pip install needed
+import urllib.request, json
+catalog = json.loads(urllib.request.urlopen("https://github.com/i-need-token/ai-models/releases/latest/download/models.json").read())
+print(len(catalog['models']))  # 4587
+```
+
+```bash
+# Quick stats with jq
+curl -sL https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+```
+
+See [API & Programmatic Access](docs/api.md) for full usage examples in JavaScript and Python.
+
+### Use as GitHub Action
+
+```yaml
+- uses: i-need-token/ai-models@main
+  id: catalog
+
+- name: Use catalog data
+  run: |
+    echo "Models: ${{ steps.catalog.outputs.model-count }}"
+    echo "Providers: ${{ steps.catalog.outputs.provider-count }}"
+    echo "File: ${{ steps.catalog.outputs.file-path }}"
+```
+
+Download a specific version or format:
+
+```yaml
+- uses: i-need-token/ai-models@main
+  with:
+    version: v0.1.0 # specific release tag
+    format: csv # csv or json
+    output-dir: data # directory to save files
 ```
 
+See [`action.yml`](action.yml) for all inputs and outputs.
+
+<details>
+<summary>🎬 Live demo output (from our CI)</summary>
+
+```
+📊 4587 models from 87 providers
+📁 Data saved to model-data/models.json
+
+💰 Cheapest tool-calling models:
+  bdc-coder: $0.01/$0.01/M tokens
+  ling-2.6-flash: $0.01/$0.03/M tokens
+  klusterai--Meta-Llama-3.1-8B-Instruct-Turbo: $0.015/$0.02/M tokens
+  granite-4.0-h-micro: $0.017/$0.112/M tokens
+
+🆓 Free reasoning models:
+  gemma-4-26b-a4b-it: 262K context
+  gemma-4-31b-it: 262K context
+```
+
+_[View the live workflow →](https://github.com/i-need-token/ai-models/actions/workflows/demo.yml)_
+
+</details>
+
 ## Project Structure
 
 ```
-├── providers/
-│   ├── openai/
-│   │   ├── scrape.ts          # Data acquisition from OpenAI's website
-│   │   └── models/            # YAML model data files
-│   └── anthropic/
-│       ├── scrape.ts          # Data acquisition from Anthropic's website
-│       └── models/            # YAML model data files
-├── types/
-│   ├── model.ts               # Model and Snapshot type definitions
-│   ├── pricing.ts             # Pricing type definitions
-│   ├── provider.ts            # Provider type definitions
-│   ├── schemas.ts             # Zod runtime validation schemas
-│   └── index.ts               # Re-exports
-├── scripts/
-│   ├── sync.ts                # Orchestration: scrape → write YAML
-│   ├── validate.ts            # Validate all YAML against schemas
-│   └── lib/                   # Shared utilities (defineModel, defineProvider, writer)
-└── docs/
-    ├── data-acquisition.md    # How we acquire and update model data
-    └── lessons-learned.md     # Design principles and pitfalls
+├── providers/           # 95 provider directories
+│   └── <provider>/
+│       ├── provider.yaml    # Provider metadata (name, URL, API endpoints)
+│       ├── scrape.ts        # Data acquisition script
+│       ├── models/          # YAML model data files
+│       └── README.md        # Provider-specific notes
+├── types/               # TypeScript type definitions + Zod schemas
+│   ├── model.ts             # Model, Snapshot, ModelModality
+│   ├── pricing.ts           # TokenPricing, VideoPricing, UnitPricing, FreePricing
+│   ├── provider.ts          # Provider, ProviderGroup
+│   └── schemas.ts           # Zod runtime validation
+├── scripts/             # CLI tools
+│   ├── sync.ts              # Orchestration: scrape → write YAML
+│   ├── validate.ts          # Validate all YAML against schemas
+│   ├── stats.ts             # Compute catalog statistics
+│   ├── compile.ts           # Compile to dist/models.json
+│   └── lib/                 # Shared utilities
+└── docs/                # Documentation (English + 中文)
 ```
 
 ## Adding a New Provider
@@ -111,17 +487,217 @@ npx tsx scripts/validate.ts
 
 See [`docs/data-acquisition.md`](docs/data-acquisition.md) for detailed guidelines.
 
+## Documentation
+
+| Document                                                            | Description                                                     |
+| ------------------------------------------------------------------- | --------------------------------------------------------------- |
+| [Tool Calling Models](docs/tool-calling.md)                         | 2,350 tool-calling models — cheapest, largest context, free     |
+| [Vision Models](docs/vision-models.md)                              | 1,487 vision models — cheapest, largest context, open-weight    |
+| [Image Generation](docs/image-generation.md)                        | 28 image generation models — DALL·E, Imagen, GPT-5 Image        |
+| [Audio Models](docs/audio-models.md)                                | 118 audio input + 34 audio output models                        |
+| [Code Models](docs/code-models.md)                                  | 189 code-focused models across 41 providers                     |
+| [Agentic Models](docs/agentic-models.md)                            | 1,080 models with tool calling + reasoning for AI agents        |
+| [Chat Models](docs/chat-models.md)                                  | 2,350 models with tool calling for chat applications            |
+| [Multimodal Models](docs/multimodal-models.md)                      | 1,519 models with image/audio/video input                       |
+| [Embedding Models](docs/embedding-models.md)                        | 5 embedding models for search, RAG, similarity                  |
+| [Video Models](docs/video-models.md)                                | 167 video input + 4 video output models                         |
+| [Structured Output](docs/structured-output.md)                      | 829 JSON-mode models — cheapest, free, with tool calling        |
+| [🔍 Interactive Catalog](https://i-need-token.github.io/ai-models/) | Search, sort, and filter all 4,587 models in your browser       |
+| [Quick Start Guide](docs/quick-start.md)                            | Find the right model in 30 seconds                              |
+| [Model Selection Guide](docs/model-selection.md)                    | Decision framework: free, best value, large context models      |
+| [Model Selection Cheatsheet](docs/model-selection-cheatsheet.md)    | Quick-reference: best model by budget and use case              |
+| [AI Model Picker](docs/ai-model-picker.md)                          | 4-question wizard: find the best model for your use case        |
+| [Benchmarks & Leaderboards](docs/benchmarks.md)                     | MMLU, MATH, HumanEval, SWE-bench, Chatbot Arena guide           |
+| [Migration Guide](docs/migration-guide.md)                          | Switch providers — pricing, API compatibility, checklist        |
+| [API & Programmatic Access](docs/api.md)                            | Download models.json, code examples in JS/Python                |
+| [Code Examples](docs/code-examples.md)                              | Practical examples in TypeScript, Python, Go, Rust, jq          |
+| [FAQ](docs/faq.md)                                                  | Common questions about the catalog, data, and contributing      |
+| [Glossary](docs/glossary.md)                                        | Key terms and definitions for AI model terminology              |
+| [Model Comparison](docs/model-comparison.md)                        | Compare flagship, cost-effective, free, and open-weight models  |
+| [Pricing Comparison](docs/pricing-comparison.md)                    | Side-by-side pricing across providers and platforms             |
+| [Cached Pricing](docs/cached-pricing.md)                            | 1,374 models with prompt caching — 50-90% input cost savings    |
+| [Modality Matrix](docs/modality-matrix.md)                          | Vision, image gen, audio, video — which models support what     |
+| [Context Window Comparison](docs/context-windows.md)                | Largest context windows, best value per tier                    |
+| [Large Context Models](docs/large-context-models.md)                | 2,195 models with 128K+ context — 397 with 1M+                  |
+| [Small & Edge Models](docs/small-models.md)                         | 1,153 models under 10B params for on-device use                 |
+| [Provider Comparison](docs/provider-comparison.md)                  | Top 30 providers by model count, capabilities, pricing          |
+| [Free AI Models](docs/free-models.md)                               | 81 free models — tool calling, reasoning, vision at no cost     |
+| [Open-Weight Models](docs/open-weights.md)                          | 513 open-weight models — run on your own infrastructure         |
+| [Reasoning Models](docs/reasoning-models.md)                        | 1,306 reasoning models — chain-of-thought and extended thinking |
+| [OpenAI Alternatives](docs/openai-alternatives.md)                  | GPT-4/GPT-3.5 alternatives — pricing, free options, compat      |
+| [Provider Overview](docs/providers.md)                              | All 95 providers organized by type and market                   |
+| [Data Schema Reference](docs/data-schema.md)                        | Complete YAML schema — model, pricing, snapshot, provider       |
+| [Data Acquisition](docs/data-acquisition.md)                        | How we acquire and update model data                            |
+| [Design Principles & Pitfalls](docs/lessons-learned.md)             | Lessons learned from building the catalog                       |
+
+**中文文档：**
+
+| 文档                                                    | 描述                                             |
+| ------------------------------------------------------- | ------------------------------------------------ |
+| [工具调用模型](docs/zh/tool-calling.md)                 | 2,350 个工具调用模型 — 最便宜、最大上下文、免费  |
+| [视觉模型](docs/zh/vision-models.md)                    | 1,487 个视觉模型 — 最便宜、最大上下文、开源权重  |
+| [快速入门](docs/zh/quick-start.md)                      | 30 秒内找到适合的模型                            |
+| [图像生成](docs/zh/image-generation.md)                 | 28 个图像生成模型 — DALL·E、Imagen、GPT-5 Image  |
+| [音频模型](docs/zh/audio-models.md)                     | 118 个音频输入 + 34 个音频输出模型               |
+| [视频模型](docs/zh/video-models.md)                     | 167 个视频输入 + 4 个视频输出模型                |
+| [API 与编程访问](docs/zh/api.md)                        | 下载 models.json，JS/Python 代码示例             |
+| [代码示例](docs/zh/code-examples.md)                    | TypeScript、Python、Go、Rust、jq 实用示例        |
+| [常见问题](docs/zh/faq.md)                              | 关于目录、数据和贡献的常见问题                   |
+| [结构化输出](docs/zh/structured-output.md)              | 829 个 JSON 模式模型 — 最便宜、免费、带工具调用  |
+| [模型对比](docs/zh/model-comparison.md)                 | 旗舰、高性价比、免费和开源模型对比               |
+| [定价对比](docs/zh/pricing-comparison.md)               | 各提供商和平台定价并排对比                       |
+| [缓存定价](docs/zh/cached-pricing.md)                   | 1,374 个支持提示缓存的模型 — 输入成本节省 50-90% |
+| [模态矩阵](docs/zh/modality-matrix.md)                  | 视觉、图像生成、音频、视频 — 各模型支持什么      |
+| [上下文窗口对比](docs/zh/context-windows.md)            | 最大上下文窗口，各层级最佳性价比                 |
+| [大上下文模型](docs/zh/large-context-models.md)         | 2,195 个 128K+ 上下文模型 — 397 个 1M+           |
+| [小型/边缘模型](docs/zh/small-models.md)                | 1,153 个 10B 参数以下模型，适合端侧部署          |
+| [提供商对比](docs/zh/provider-comparison.md)            | 按模型数量、能力、定价对比前 30 个提供商         |
+| [免费 AI 模型](docs/zh/free-models.md)                  | 81 个免费模型 — 工具调用、推理、视觉零成本       |
+| [开源权重模型](docs/zh/open-weights.md)                 | 513 个开源权重模型 — 自有基础设施运行            |
+| [提供商概览](docs/zh/providers.md)                      | 95 个提供商按类型和市场分类                      |
+| [推理模型](docs/zh/reasoning-models.md)                 | 1,306 个推理模型 — 链式思维和扩展思考            |
+| [数据 Schema 参考](docs/zh/data-schema.md)              | 完整 YAML Schema — 模型、定价、快照、提供商      |
+| [数据采集](docs/zh/data-acquisition.md)                 | 数据采集指南                                     |
+| [设计原则与陷阱](docs/zh/lessons-learned.md)            | 经验教训                                         |
+| [智能体模型](docs/zh/agentic-models.md)                 | 1,080 个工具调用+推理模型，用于 AI 智能体        |
+| [代码模型](docs/zh/code-models.md)                      | 189 个代码模型：生成、审查、调试                 |
+| [OpenAI 替代方案](docs/zh/openai-alternatives.md)       | GPT-4/GPT-3.5 替代方案：定价、免费选项、兼容性   |
+| [聊天模型](docs/zh/chat-models.md)                      | 2,350 个带工具调用的聊天模型                     |
+| [多模态模型](docs/zh/multimodal-models.md)              | 1,519 个支持图像/音频/视频输入的模型             |
+| [嵌入模型](docs/zh/embedding-models.md)                 | 5 个嵌入模型用于搜索、RAG、相似度                |
+| [模型选择指南](docs/zh/model-selection.md)              | 决策框架：免费、最佳性价比、大上下文模型         |
+| [模型选择速查表](docs/zh/model-selection-cheatsheet.md) | 按预算和使用场景快速选择模型                     |
+| [迁移指南](docs/zh/migration-guide.md)                  | 切换提供商：定价、API 兼容性、检查清单           |
+| [术语表](docs/zh/glossary.md)                           | AI 模型术语的关键词和定义                        |
+
 ## Design Principles
 
 - **First-party data only** — all model data comes from the provider's own API or website
 - **Dynamic discovery** — scrape functions discover models from the source, not from hardcoded lists
-- **Include deprecated, exclude retired** — deprecated models are included with a `deprecated: true` flag; retired (inaccessible) models are excluded
+- **Include deprecated, exclude retired** — deprecated models are included with `deprecated: true`; retired (inaccessible) models are excluded
 - **Never fabricate data** — if required data is missing, skip the model with a warning rather than filling in guessed values
 - **YAML source format** — human-readable, supports comments, machine-parseable
 - **Snapshot inheritance** — dated model versions are nested within the parent model, inheriting all fields
 
-See [`docs/lessons-learned.md`](docs/lessons-learned.md) for the full set of design principles and pitfalls.
+## Contributing
+
+Contributions are welcome! Whether it's adding a new provider, fixing data, or improving documentation:
+
+1. Fork the repository
+2. Create your feature branch (`git checkout -b feature/my-provider`)
+3. Follow the [data acquisition guidelines](docs/data-acquisition.md)
+4. Validate your changes (`npx tsx scripts/validate.ts`)
+5. Submit a pull request
+
+Please read [CONTRIBUTING.md](CONTRIBUTING.md) for detailed guidelines.
+
+## Alternatives
+
+| Project                                                                   | Scope                       | Data Source      | Format            | Auto-Update | Free    |
+| ------------------------------------------------------------------------- | --------------------------- | ---------------- | ----------------- | ----------- | ------- |
+| **This catalog**                                                          | 95 providers, 4,587+ models | First-party APIs | YAML + JSON + CSV | Weekly CI   | ✅      |
+| [Artificial Analysis](https://artificialanalysis.ai/)                     | ~30 providers               | Mixed            | Web UI            | ✅          | Partial |
+| [LLM Price](https://llmprice.com/)                                        | ~25 providers               | Mixed            | Web UI            | ✅          | ✅      |
+| [OpenRouter models](https://openrouter.ai/models)                         | OpenRouter only             | OpenRouter API   | Web UI            | ✅          | ✅      |
+| [Helicone models](https://helicone.ai/models)                             | ~20 providers               | Mixed            | Web UI            | ✅          | Partial |
+| [BerriAI/litellm](https://github.com/BerriAI/litellm)                     | 100+ providers              | Community        | Python config     | ✅          | ✅      |
+| [dariubs/awesome-ai-models](https://github.com/dariubs/awesome-ai-models) | ~20 providers               | Manual           | Markdown list     | ❌          | ✅      |
+| [Vellum AI](https://www.vellum.ai/)                                       | ~15 providers               | Mixed            | Web UI + API      | ✅          | Partial |
+| [openai/models](https://github.com/openai/openai-python)                  | OpenAI only                 | OpenAI API       | Python SDK        | ✅          | ✅      |
+
+**Key differentiators of this catalog:**
+
+- **First-party data only** — scraped directly from provider APIs, not aggregated from third parties
+- **Machine-readable YAML** — structured data with Zod validation, not just a web UI
+- **Multiple access formats** — npm, CDN, CSV, GitHub Action, Hugging Face dataset
+- **Comprehensive metadata** — pricing, context windows, modalities, capabilities, snapshots
+- **Bilingual docs** — 34 English + 34 Chinese documentation pages
+- **Open data** — all model data is open and programmatically accessible
+
+## Ecosystem & Integrations
+
+| Integration              | Description                                             | Link                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   |
+| ------------------------ | ------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
+| **npm package**          | Install models.json via npm                             | [`npm install ai-models`](https://www.npmjs.com/package/ai-models)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                     |
+| **jsDelivr CDN**         | Fetch models.json from CDN                              | [cdn.jsdelivr.net/npm/ai-models](https://cdn.jsdelivr.net/npm/ai-models@latest/models.json)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            |
+| **GitHub Action**        | Use in CI/CD workflows                                  | [action.yml](action.yml)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
+| **Hugging Face**         | Dataset on HF Hub                                       | [huggingface.co/datasets/i-need-token/ai-models](https://huggingface.co/datasets/i-need-token/ai-models)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               |
+| **CSV download**         | Import into Excel/Sheets                                | [GitHub Releases](https://github.com/i-need-token/ai-models/releases)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  |
+| **Interactive catalog**  | Search, filter, compare, price calculator, model picker | [i-need-token.github.io/ai-models](https://i-need-token.github.io/ai-models/)                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          |
+| **SEO comparison pages** | 21 curated comparison pages for discoverability         | [Best Models](https://i-need-token.github.io/ai-models/best-ai-models.html), [Free Models](https://i-need-token.github.io/ai-models/free-ai-models.html), [Pricing](https://i-need-token.github.io/ai-models/llm-pricing.html), [OpenAI Alt](https://i-need-token.github.io/ai-models/openai-alternatives.html), [By Provider](https://i-need-token.github.io/ai-models/ai-models-by-provider.html), [Context](https://i-need-token.github.io/ai-models/context-window-comparison.html), [Coding](https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html), [Agents](https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html), [Reasoning](https://i-need-token.github.io/ai-models/reasoning-models-comparison.html), [Cheapest](https://i-need-token.github.io/ai-models/cheapest-ai-models.html), [Tool Calling](https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html), [Pricing Calc](https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html), [Image Gen](https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html), [Vision](https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html), [Structured Output](https://i-need-token.github.io/ai-models/structured-output-models-comparison.html), [Open Source](https://i-need-token.github.io/ai-models/open-source-ai-models.html), [Multimodal](https://i-need-token.github.io/ai-models/multimodal-ai-models.html), [State of AI](https://i-need-token.github.io/ai-models/state-of-ai-models.html), [Benchmarks](https://i-need-token.github.io/ai-models/ai-model-benchmarks.html), [ChatGPT vs Claude vs Gemini](https://i-need-token.github.io/ai-models/chatgpt-vs-claude-vs-gemini.html), [Comparison Chart](https://i-need-token.github.io/ai-models/ai-model-comparison-chart.html) |
+
+## What's New
+
+### v0.2.0 (May 2025)
+
+- **21 SEO comparison pages** — Best Models, Free Models, LLM Pricing, OpenAI Alternatives, By Provider, Context Windows, Coding, Agents, Reasoning, Cheapest, Tool Calling, Pricing Calculator, Image Generation, Open Source, Multimodal, State of AI Models 2025
+- **Interactive catalog** — 25+ features including dark/light theme, keyboard shortcuts, model detail modal, price calculator, model picker wizard, copy as code, share button, j/k vim navigation
+- **95 providers** — comprehensive coverage of all major AI providers
+- **4,587+ models** — with pricing, context windows, modalities, and capabilities
+- **GitHub Action v2** — version, format, and output-dir inputs
+- **npm package** — `npm install ai-models`
+- **70 docs** — 35 EN + 35 ZH, all bilingual, all cross-linked
+
+## Roadmap
+
+- [x] ~~Embedding models documentation~~ → [docs/embedding-models.md](docs/embedding-models.md)
+- [x] ~~Provider comparison~~ → [docs/provider-comparison.md](docs/provider-comparison.md)
+- [x] ~~Large context models~~ → [docs/large-context-models.md](docs/large-context-models.md)
+- [x] ~~Small/edge models~~ → [docs/small-models.md](docs/small-models.md)
+- [x] ~~Migration guide~~ → [docs/migration-guide.md](docs/migration-guide.md)
+- [ ] Model benchmarking data integration
+- [ ] Streaming support metadata
+- [ ] Fine-tuning availability tracking
+- [ ] Regional availability data
+- [ ] Community-contributed model reviews
+- 🔜 **REST API** — hosted API for querying the catalog
+- 🔜 **Historical pricing** — track pricing changes over time
+- 🔜 **Community scrapers** — enable community-contributed scrape scripts with automated validation
+
+## Who's Using This?
+
+Built something with this catalog? [Open a PR](https://github.com/i-need-token/ai-models/edit/main/README.md) to add your project!
+
+| Use Case                   | How the Catalog Is Used                                                  |
+| -------------------------- | ------------------------------------------------------------------------ |
+| **AI API gateways**        | Route requests to the cheapest provider with real-time pricing data      |
+| **Model comparison tools** | Compare capabilities, context windows, and costs across providers        |
+| **Cost optimization**      | Find the cheapest model for each task (reasoning, vision, tool calling)  |
+| **AI agent frameworks**    | Select models with tool calling + structured output for agent workflows  |
+| **Research & analysis**    | Track the AI landscape — 2,712 models with release dates and deprecation |
+| **CI/CD pipelines**        | Use the [GitHub Action](action.yml) to fetch model data in workflows     |
+| **Data dashboards**        | Import CSV into Excel/Google Sheets for visual pricing analysis          |
+| **Chatbot builders**       | Pick the right model by context window, modality, and budget             |
+
+## Contributors
+
+Thanks to everyone who has contributed to this catalog!
+
+<!-- ALL-CONTRIBUTORS-LIST:START - Do not remove or modify this section -->
+<!-- ALL-CONTRIBUTORS-LIST:END -->
+
+Want to contribute? Check out [CONTRIBUTING.md](CONTRIBUTING.md) for guidelines.
+
+- 📋 [Changelog](CHANGELOG.md) — what's new in each release
+- 🔒 [Security Policy](SECURITY.md) — reporting vulnerabilities
+
+## Project Timeline
+
+| Date    | Milestone                                                   |
+| ------- | ----------------------------------------------------------- |
+| 2026-05 | 🚀 Public launch — 4,587 models, 95 providers, 68 docs      |
+| 2026-05 | 📊 Interactive catalog live at GitHub Pages                 |
+| 2026-05 | 📦 npm package, CSV export, GitHub Action                   |
+| 2026-05 | 🌐 Bilingual docs — 34 EN + 34 ZH pages                     |
+| 2026-05 | 🤖 1,080 agentic models, 2,350 tool-calling models          |
+| Future  | 📈 More providers, REST API, historical pricing, benchmarks |
+
+[![Star History Chart](https://api.star-history.com/svg?repos=i-need-token/ai-models&type=Date)](https://star-history.com/#i-need-token/ai-models&Date)
+
+## Sponsors
+
+Support this project by [sponsoring us on GitHub](https://github.com/sponsors/i-need-token). Your sponsorship helps maintain and expand the catalog.
 
 ## License
 
-MIT
+[MIT](LICENSE)
diff --git a/SECURITY.md b/SECURITY.md
new file mode 100644
index 00000000..79af03c5
--- /dev/null
+++ b/SECURITY.md
@@ -0,0 +1,24 @@
+# Security Policy
+
+## Reporting a Vulnerability
+
+If you discover a security vulnerability in this project, please report it by opening a [GitHub Security Advisory](https://github.com/i-need-token/ai-models/security/advisories/new).
+
+Please do not report security vulnerabilities through public GitHub issues.
+
+## Scope
+
+This project is a data catalog — it contains YAML model data files, TypeScript type definitions, and scrape scripts. Security vulnerabilities in this context would include:
+
+- Malicious code in scrape scripts that could compromise the build environment
+- Supply chain vulnerabilities in dependencies
+- Data integrity issues where model data is intentionally corrupted
+
+Out of scope:
+
+- Incorrect model pricing or capability data (report as a [bug](https://github.com/i-need-token/ai-models/issues/new?labels=bug&template=bug_report.md))
+- Missing providers or models (report as a [provider request](https://github.com/i-need-token/ai-models/issues/new?labels=enhancement&template=provider_request.md))
+
+## Response Time
+
+We aim to acknowledge security reports within 48 hours and provide a fix within 7 days.
diff --git a/action.yml b/action.yml
new file mode 100644
index 00000000..af4a71c7
--- /dev/null
+++ b/action.yml
@@ -0,0 +1,71 @@
+name: "AI Models Catalog"
+description: "Download AI model metadata (pricing, context windows, capabilities) from the AI Models Catalog"
+author: "i-need-token"
+branding:
+  icon: "database"
+  color: "blue"
+
+inputs:
+  version:
+    description: "Release version to download (latest, or a specific tag like v0.1.0)"
+    required: false
+    default: "latest"
+  format:
+    description: "Output format: json or csv"
+    required: false
+    default: "json"
+  output-dir:
+    description: "Directory to save the downloaded file"
+    required: false
+    default: "ai-models"
+
+outputs:
+  model-count:
+    description: "Number of models in the catalog"
+    value: ${{ steps.download.outputs.model-count }}
+  provider-count:
+    description: "Number of providers in the catalog"
+    value: ${{ steps.download.outputs.provider-count }}
+  file-path:
+    description: "Path to the downloaded file"
+    value: ${{ steps.download.outputs.file-path }}
+
+runs:
+  using: "composite"
+  steps:
+    - id: download
+      shell: bash
+      run: |
+        VERSION="${{ inputs.version }}"
+        FORMAT="${{ inputs.format }}"
+        OUTPUT_DIR="${{ inputs.output-dir }}"
+        BASE_URL="https://github.com/i-need-token/ai-models/releases"
+
+        mkdir -p "$OUTPUT_DIR"
+
+        if [ "$VERSION" = "latest" ]; then
+          DOWNLOAD_URL="$BASE_URL/latest/download/models.$FORMAT"
+        else
+          DOWNLOAD_URL="$BASE_URL/download/$VERSION/models.$FORMAT"
+        fi
+
+        echo "📥 Downloading models.$FORMAT from $DOWNLOAD_URL"
+        HTTP_CODE=$(curl -sL -w "%{http_code}" -o "$OUTPUT_DIR/models.$FORMAT" "$DOWNLOAD_URL")
+
+        if [ "$HTTP_CODE" -ne 200 ]; then
+          echo "❌ Failed to download (HTTP $HTTP_CODE)"
+          exit 1
+        fi
+
+        FILE_SIZE=$(wc -c < "$OUTPUT_DIR/models.$FORMAT" | tr -d ' ')
+        echo "✅ Downloaded models.$FORMAT ($FILE_SIZE bytes)"
+
+        if [ "$FORMAT" = "json" ]; then
+          MODEL_COUNT=$(python3 -c "import json; d=json.load(open('$OUTPUT_DIR/models.json')); print(len(d.get('models', d)))" 2>/dev/null || echo "0")
+          PROVIDER_COUNT=$(python3 -c "import json; d=json.load(open('$OUTPUT_DIR/models.json')); print(len(d.get('providers', [])))" 2>/dev/null || echo "0")
+          echo "📊 $MODEL_COUNT models from $PROVIDER_COUNT providers"
+          echo "model-count=$MODEL_COUNT" >> "$GITHUB_OUTPUT"
+          echo "provider-count=$PROVIDER_COUNT" >> "$GITHUB_OUTPUT"
+        fi
+
+        echo "file-path=$OUTPUT_DIR/models.$FORMAT" >> "$GITHUB_OUTPUT"
diff --git a/docs/agentic-models.md b/docs/agentic-models.md
new file mode 100644
index 00000000..e2ef293f
--- /dev/null
+++ b/docs/agentic-models.md
@@ -0,0 +1,97 @@
+**English** | [中文](./zh/agentic-models.md)
+
+# Agentic AI Models — 1,080 Models for AI Agents
+
+Models with **tool calling + reasoning** capabilities — the essential building blocks for AI agents, autonomous workflows, and multi-step task execution. All data sourced from first-party APIs via the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## What Makes a Model "Agentic"?
+
+An agentic model can:
+
+- **Call tools/functions** — interact with APIs, databases, and external systems
+- **Reason step-by-step** — plan, decompose tasks, and verify results
+- **Act autonomously** — make decisions and take actions without human intervention
+
+These capabilities are what separate chatbots from AI agents.
+
+## Stats
+
+| Metric                 | Count |
+| ---------------------- | ----- |
+| Agentic models         | 1076  |
+| Providers              | 51    |
+| With vision            | 617   |
+| With structured output | 453   |
+| Free                   | 30    |
+| Open weights           | 64    |
+
+## Cheapest Agentic Models (Direct Providers)
+
+| Model                          | Provider     | Context | Input $/1M | Output $/1M | Vision |
+| ------------------------------ | ------------ | ------- | ---------- | ----------- | ------ |
+| qwen--qwen3-4b-fp8             | novitaai     | 125K    | $0.03      | $0.03       |        |
+| openai--gpt-oss-20b            | neuralwatt   | 0       | $0.03      | $0.16       |        |
+| openai--gpt-oss-120b           | novitaai     | 128K    | $0.05      | $0.25       | ✅     |
+| gpt-oss-120b                   | inferencenet | 128K    | $0.05      | $0.45       |        |
+| Qwen--Qwen3.6-35B-A3B          | neuralwatt   | 0       | $0.05      | $0.1        | ✅     |
+| qwen3-30b-a3b-fp8              | cloudflare   | 40K     | $0.051     | $0.335      |        |
+| glm-4.7-flash                  | cloudflare   | 128K    | $0.06      | $0.4        |        |
+| Nemotron-3-Nano-Omni           | nebius       | 125K    | $0.06      | $0.24       | ✅     |
+| hermes-4-llama-3.1-8b          | nousresearch | 128K    | $0.06      | $0.12       |        |
+| zai-org--glm-4.7-flash         | novitaai     | 195K    | $0.07      | $0.4        |        |
+| ring-2.6-1t                    | inclusionai  | 256K    | $0.07      | $0.62       |        |
+| seed-1.6-flash                 | bytedance    | 256K    | $0.07      | $0.3        | ✅     |
+| microsoft-phi-4-mini-reasoning | microsoft    | 125K    | $0.075     | $0.3        |        |
+| Qwen--Qwen3-32B-TEE            | chutes       | 40K     | $0.08      | $0.24       |        |
+| qwen--qwen3-30b-a3b-fp8        | novitaai     | 40K     | $0.09      | $0.45       |        |
+
+## Free Agentic Models
+
+| Model                             | Provider | Context | Vision | Structured Output |
+| --------------------------------- | -------- | ------- | ------ | ----------------- |
+| glm-4.1v-thinking-flash           | zhipuai  | 62K     | ✅     | ✅                |
+| qwen--qwen3-omni-30b-a3b-thinking | novitaai | 64K     | ✅     | ✅                |
+| qwen--qwen3.5-4b-free             | mixlayer | 128K    |        |                   |
+
+## Largest Context Agentic Models
+
+| Model                       | Provider    | Context | Input $/1M | Output $/1M |
+| --------------------------- | ----------- | ------- | ---------- | ----------- |
+| deepseek-v4-flash           | baidu       | 1024K   | $0.126     | $0.252      |
+| deepseek-v4-pro             | siliconflow | 1024K   | $1.74      | $3.48       |
+| deepseek-v4-flash           | siliconflow | 1024K   | $0.14      | $0.28       |
+| deepseek--deepseek-v4-pro   | novitaai    | 1024K   | $1.67      | $3.38       |
+| xiaomimimo--mimo-v2.5-pro   | novitaai    | 1024K   | $2         | $6          |
+| deepseek--deepseek-v4-flash | novitaai    | 1024K   | $0.14      | $0.28       |
+| gemini-2.5-flash            | google      | 1024K   | $0.15      | $3.5        |
+| gemini-2.5-pro              | google      | 1024K   | $1.25      | $10         |
+| deepseek-v4-pro             | fireworks   | 1024K   | $1.74      | $3.48       |
+| xiaomi--mimo-v2.5-pro       | hpc-ai      | 1024K   | $1         | $3          |
+| xiaomi--mimo-v2.5           | hpc-ai      | 1024K   | $0.4       | $2          |
+| mimo-v2.5-pro               | xiaomi      | 1024K   | $1         | $3          |
+| mimo-v2-pro                 | xiaomi      | 1024K   | $1         | $3          |
+| minimaxai--minimax-m1-80k   | novitaai    | 976K    | $0.55      | $2.2        |
+| qwen3.6-flash               | alibaba     | 976K    | $1.2       | $7.2        |
+
+## Building AI Agents
+
+| Agent Type       | Recommended Models          | Key Capabilities               |
+| ---------------- | --------------------------- | ------------------------------ |
+| Code agents      | Claude Sonnet 4, GPT-4.1    | Tool call + reasoning + code   |
+| Research agents  | Gemini 2.5 Pro, DeepSeek R1 | Large context + reasoning      |
+| Data agents      | Claude Sonnet 4, Qwen3      | Structured output + tool call  |
+| Vision agents    | GPT-4o, Gemini 2.5 Flash    | Vision + tool call + reasoning |
+| Customer support | Llama 4 Scout, Qwen3        | Free/cheap + tool call         |
+
+## Related Documentation
+
+- [Tool Calling Models](tool-calling.md) — 2,350 models with function calling
+- [Reasoning Models](reasoning-models.md) — 1,306 models with chain-of-thought
+- [Structured Output](structured-output.md) — 829 models with JSON mode
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4 alternatives with agent capabilities
+- [Vision Models](vision-models.md) — 1,487 models with image understanding
+- [Free AI Models](free-models.md) — 81 models at zero cost
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/ai-model-picker.md b/docs/ai-model-picker.md
new file mode 100644
index 00000000..e30d73e8
--- /dev/null
+++ b/docs/ai-model-picker.md
@@ -0,0 +1,64 @@
+# AI Model Picker
+
+Answer 4 simple questions to find the best AI model for your use case.
+
+**[Try the interactive picker →](https://i-need-token.github.io/ai-models/ai-model-picker.html)**
+
+## How It Works
+
+The AI Model Picker asks you four questions:
+
+1. **What are you building?** — AI Agents, Code Generation, Chat/RAG, Math & Reasoning, Vision/Multimodal, or High-Volume Production
+2. **What's your budget?** — Free, Under $0.10/M tokens, Under $1/M, or Premium
+3. **How much context do you need?** — Under 32K, 32K–128K, 128K–512K, or 512K+
+4. **What matters most?** — Lowest Cost, Best Quality, Lowest Latency, or Privacy/On-Device
+
+Based on your answers, the picker scores and ranks all 4,587+ models across 95 providers, filtering by budget and context requirements, then weighting by use case and priority.
+
+## Scoring Logic
+
+| Use Case               | Key Capabilities                                          | Weight                            |
+| ---------------------- | --------------------------------------------------------- | --------------------------------- |
+| AI Agents              | Tool Calling (+10), Reasoning (+5)                        | Cost penalty for expensive models |
+| Code Generation        | Tool Calling (+8), Reasoning (+5), Structured Output (+3) | —                                 |
+| Chat / RAG             | Large Context (+5), Tool Calling (+3)                     | —                                 |
+| Math & Reasoning       | Reasoning (+10), Tool Calling (+3)                        | —                                 |
+| Vision / Multimodal    | Image Input (+10), Tool Calling (+3)                      | —                                 |
+| High-Volume Production | Tool Calling (+5)                                         | Cost penalty scaled 5×            |
+
+Aggregator providers (OpenRouter, Requesty, etc.) are excluded to avoid duplicate model entries.
+
+## Quick Recommendations
+
+### Best Free Models by Use Case
+
+| Use Case        | Top Pick                 | Why                         |
+| --------------- | ------------------------ | --------------------------- |
+| AI Agents       | DeepSeek V4 Flash (Free) | Tool calling + 1M context   |
+| Code Generation | Qwen3 Coder (Free)       | Tool calling + 1M context   |
+| Chat / RAG      | DeepSeek V4 Flash (Free) | 1M context window           |
+| Reasoning       | DeepSeek R1 (Free)       | 92% MATH-500, reasoning     |
+| Vision          | —                        | Limited free vision options |
+
+### Best Budget Models (Under $0.10/M)
+
+| Use Case        | Top Pick       | Price           |
+| --------------- | -------------- | --------------- |
+| AI Agents       | ling-2.6-flash | $0.01/$0.03/M   |
+| Code Generation | bdc-coder      | $0.01/$0.01/M   |
+| Reasoning       | qwen3.5-0.8b   | $0.01/$0.05/M   |
+| General         | Mistral Nemo   | $0.008/$0.001/M |
+
+## Related Documentation
+
+- [Free Models](free-models.md) — Complete list of 81 free models
+- [Pricing Comparison](pricing-comparison.md) — Compare costs across all providers
+- [Tool Calling](tool-calling.md) — 2,350 models with tool calling
+- [Reasoning Models](reasoning-models.md) — 1,306 reasoning models
+- [Context Windows](context-windows.md) — Compare context window sizes
+- [Model Selection Cheatsheet](model-selection-cheatsheet.md) — Decision tree and budget table
+- [Quick Start](quick-start.md) — Get started with the catalog
+
+## Data Source
+
+All data is sourced from first-party APIs and official documentation. See [Data Acquisition](data-acquisition.md) for details.
diff --git a/docs/api.md b/docs/api.md
new file mode 100644
index 00000000..0ba83ea7
--- /dev/null
+++ b/docs/api.md
@@ -0,0 +1,222 @@
+**English** | [中文](./zh/api.md)
+
+# API & Programmatic Access
+
+Use the catalog data in your applications.
+
+## npm Package
+
+Install the catalog as an npm dependency:
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 models as JSON
+import type { Model } from "ai-models"; // TypeScript types
+
+// Find models with tool calling under $1/1M input
+const affordable = catalog.models.filter((m) => m.tool_call && m.pricing.input < 1);
+```
+
+The package includes:
+
+- `dist/models.json` — full catalog as JSON
+- `dist/index.d.ts` — TypeScript type definitions
+- `types/` — source type definitions (Model, Snapshot, Provider, Pricing)
+
+## CDN Access (No Install)
+
+The compiled JSON is available via [jsDelivr CDN](https://www.jsdelivr.com/package/npm/ai-models) — no download or install needed. The CDN automatically serves the latest npm release:
+
+```html
+<!-- Use in any HTML page -->
+<script type="module">
+  const catalog = await fetch(
+    "https://github.com/i-need-token/ai-models/releases/latest/download/models.json",
+  ).then((r) => r.json());
+  console.log(catalog.models.length); // 4,587
+</script>
+```
+
+```bash
+# Direct curl (always up-to-date)
+curl -s https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+
+# Pin to a specific version
+curl -s https://github.com/i-need-token/ai-models/releases/download/v0.1.0/models.json | jq '.stats'
+```
+
+```python
+# Python — no pip install needed
+import urllib.request, json
+catalog = json.loads(urllib.request.urlopen("https://github.com/i-need-token/ai-models/releases/latest/download/models.json").read())
+print(len(catalog["models"]))  # 4587
+```
+
+```go
+// Go — no dependencies needed
+resp, err := http.Get("https://github.com/i-need-token/ai-models/releases/latest/download/models.json")
+```
+
+### CDN vs GitHub Releases
+
+| Feature       | jsDelivr CDN                                 | GitHub Releases                               |
+| ------------- | -------------------------------------------- | --------------------------------------------- |
+| URL stability | `cdn.jsdelivr.net/npm/ai-models@latest/...`  | `github.com/.../releases/latest/download/...` |
+| CORS          | ✅ Yes — works in browsers                   | ❌ No — download only                         |
+| Caching       | 7 days (versioned), 5 min (`@latest`)        | No caching                                    |
+| Speed         | Global CDN, 300+ edge locations              | GitHub CDN                                    |
+| Best for      | Web apps, browser scripts, quick prototyping | CLI tools, CI/CD, batch processing            |
+
+## Compiled JSON
+
+All model data is available from [GitHub Releases](https://github.com/i-need-token/ai-models/releases/latest) in two formats:
+
+| File          | Format | Size    | Best For                                  |
+| ------------- | ------ | ------- | ----------------------------------------- |
+| `models.json` | JSON   | ~2.3 MB | Programmatic access, web apps, TypeScript |
+| `models.csv`  | CSV    | ~560 KB | Excel, Google Sheets, data analysis       |
+| `stats.json`  | JSON   | ~1 KB   | Catalog statistics summary                |
+
+Also available on [Hugging Face Datasets](https://huggingface.co/datasets/i-need-token/ai-models) for the ML community.
+
+```bash
+# Download JSON (full metadata)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# Download CSV (flat table for spreadsheets)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+
+# Specific version
+curl -LO https://github.com/i-need-token/ai-models/releases/download/v0.1.0/models.json
+```
+
+### Compile Locally
+
+```bash
+npm install
+npx tsx scripts/compile.ts
+# Output: dist/models.json (2.3 MB)
+```
+
+### JSON Structure
+
+```json
+{
+  "generated_at": "2026-05-21T02:13:04.076Z",
+  "stats": {
+    "providers": 95,
+    "models": 4587,
+    "unique_model_ids": 2712,
+    "families": 441
+  },
+  "providers": {
+    "openai": { "name": "OpenAI", "model_count": 28 },
+    "anthropic": { "name": "Anthropic", "model_count": 11 }
+  },
+  "models": [
+    {
+      "id": "gpt-4.1",
+      "name": "GPT-4.1",
+      "family": "gpt-4.1",
+      "provider": "openai",
+      "tool_call": true,
+      "structured_output": true,
+      "pricing": { "currency": "USD", "input": 2, "output": 8, "cache_read": 0.5 },
+      "limit": { "context": 1047576, "output": 32768 },
+      "modalities": { "input": ["text", "image"], "output": ["text"] }
+    }
+  ]
+}
+```
+
+### Usage Examples
+
+**JavaScript/TypeScript:**
+
+```javascript
+const catalog = require("./models.json");
+
+// Find all models with tool calling under $1/1M input tokens
+const cheap = catalog.models.filter(
+  (m) => m.tool_call && m.pricing?.input < 1 && m.pricing?.currency === "USD",
+);
+
+// Find the cheapest model per provider
+const byProvider = {};
+for (const m of catalog.models) {
+  if (!m.pricing?.input) continue;
+  if (!byProvider[m.provider] || m.pricing.input < byProvider[m.provider].pricing.input) {
+    byProvider[m.provider] = m;
+  }
+}
+
+// Get all vision models
+const vision = catalog.models.filter((m) => m.modalities?.input?.includes("image"));
+```
+
+**Python:**
+
+```python
+import json
+
+with open("models.json") as f:
+    catalog = json.load(f)
+
+# Find all reasoning models
+reasoning = [m for m in catalog["models"] if m.get("reasoning")]
+
+# Find models with largest context windows
+by_context = sorted(
+    catalog["models"],
+    key=lambda m: (m.get("limit", {}) or {}).get("context", 0),
+    reverse=True,
+)[:10]
+```
+
+## Individual YAML Files
+
+For type-safe access to individual models, use the YAML files directly with Zod validation:
+
+```typescript
+import { ModelSchema } from "./types/schemas";
+import { parse } from "yaml";
+import { readFileSync } from "fs";
+
+const raw = readFileSync("providers/openai/models/gpt-4.1.yaml", "utf-8");
+const model = ModelSchema.parse(parse(raw)); // Runtime-validated
+
+console.log(model.pricing); // { input: 2, output: 8, cache_read: 0.5 }
+```
+
+## CLI Tools
+
+```bash
+# Validate all YAML data
+npx tsx scripts/validate.ts
+
+# Compute catalog statistics
+npx tsx scripts/stats.ts          # table format
+npx tsx scripts/stats.ts json     # JSON format
+
+# Compile to models.json
+npx tsx scripts/compile.ts
+
+# Sync data from providers
+npx tsx scripts/sync.ts openai    # single provider
+npx tsx scripts/sync.ts           # all providers
+```
+
+## Related Documentation
+
+- [Quick Start](quick-start.md) — find the right model in 30 seconds
+- [Code Examples](code-examples.md) — TypeScript, Python, Go, Rust, jq
+- [Data Schema](data-schema.md) — complete YAML schema reference
+- [FAQ](faq.md) — common questions
+- [Model Selection Guide](model-selection.md) — decision framework
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/audio-models.md b/docs/audio-models.md
new file mode 100644
index 00000000..733db149
--- /dev/null
+++ b/docs/audio-models.md
@@ -0,0 +1,83 @@
+**English** | [中文](./zh/audio-models.md)
+
+# Audio AI Models — Speech, Voice, and Audio Understanding
+
+Models with **audio input** (speech recognition, voice understanding) and **audio output** (text-to-speech, voice generation) capabilities. All data sourced from first-party APIs via the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Stats
+
+| Metric              | Count |
+| ------------------- | ----- |
+| Audio input models  | 115   |
+| Audio output models | 34    |
+| Total audio models  | 133   |
+| Providers           | 20    |
+| With tool calling   | 69    |
+| Free                | 8     |
+
+## Audio Input Models (Speech/Voice Understanding)
+
+Models that can process audio input — transcribe speech, analyze audio, understand voice commands:
+
+| Model                           | Provider       | Context | Input $/1M | Output $/1M | Tool Call |
+| ------------------------------- | -------------- | ------- | ---------- | ----------- | --------- |
+| mistral-voxtral-mini            | amazon-bedrock | 125K    | $0.04      | $0.04       |           |
+| voxtral-mini                    | mistral        | 125K    | $0.04      | $0.04       |           |
+| gemini-2.0-flash-lite           | google         | 1024K   | $0.075     | $0.3        | ✅        |
+| gemini-2-0-flash-lite           | google-vertex  | 1024K   | $0.075     | $0.3        | ✅        |
+| microsoft-phi-4-mini-multimodal | microsoft      | 125K    | $0.08      | $0.32       | ✅        |
+| gemini-2.0-flash                | google         | 1024K   | $0.1       | $0.4        | ✅        |
+| gemini-2.5-flash-lite           | google         | 1024K   | $0.1       | $0.4        | ✅        |
+| mistral-voxtral-small           | amazon-bedrock | 125K    | $0.1       | $0.3        |           |
+| voxtral-small                   | mistral        | 125K    | $0.1       | $0.3        |           |
+| amazon-nova-2.0-lite            | amazon         | 62K     | $0.15      | $1.25       | ✅        |
+| gemini-2.5-flash                | google         | 1024K   | $0.15      | $3.5        | ✅        |
+| gemini-2-0-flash                | google-vertex  | 1024K   | $0.15      | $0.6        | ✅        |
+| voxtral-small-24b-2507          | scaleway       | 128K    | $0.15      | $0.35       |           |
+| amazon-nova-2.0-omni            | amazon         | 62K     | $0.2       | $1.3        | ✅        |
+| xiaomi--mimo-v2.5               | hpc-ai         | 1024K   | $0.4       | $2          | ✅        |
+
+## Audio Output Models (Text-to-Speech / Voice Generation)
+
+Models that can generate audio output — text-to-speech, voice synthesis:
+
+| Model                  | Provider | Input $/1M | Output $/1M |
+| ---------------------- | -------- | ---------- | ----------- |
+| gpt-4o-audio           | openai   | $2.5       | $10         |
+| gpt-4o-realtime        | openai   | $5         | $20         |
+| step-audio-2           | stepfun  | $10        | $70         |
+| stepaudio-2.5-realtime | stepfun  | $10        | $70         |
+| o1-realtime            | openai   | $15        | $60         |
+| step-1o-audio          | stepfun  | $25        | $60         |
+
+## Free Audio Models
+
+| Model                             | Provider | Audio In | Audio Out | Context |
+| --------------------------------- | -------- | -------- | --------- | ------- |
+| qwen--qwen3-omni-30b-a3b-instruct | novitaai | ✅       | ✅        | 64K     |
+| qwen--qwen3-omni-30b-a3b-thinking | novitaai | ✅       |           | 64K     |
+| gemma-3n-E2B-it                   | google   | ✅       |           | 128K    |
+| gemma-3n-E4B-it                   | google   | ✅       |           | 128K    |
+| step-audio-r1.1                   | stepfun  | ✅       | ✅        | 0       |
+
+## Choosing an Audio Model
+
+| Use Case            | Recommended               | Key Feature               |
+| ------------------- | ------------------------- | ------------------------- |
+| Voice assistants    | GPT-4o-audio              | Audio in/out + tool call  |
+| Transcription       | Whisper, Gemini 2.5 Flash | Fast, cheap audio input   |
+| Voice agents        | GPT-4o-realtime           | Real-time audio streaming |
+| Text-to-speech      | OpenAI TTS, ElevenLabs    | Natural voice output      |
+| Multilingual speech | Gemini 2.5 Pro            | 100+ languages            |
+
+## Related Documentation
+
+- [Multimodal Models](multimodal-models.md) — 1,519 models with image/audio/video
+- [Vision Models](vision-models.md) — 1,487 models with image understanding
+- [Chat Models](chat-models.md) — 2,350 models with tool calling
+- [Tool Calling Models](tool-calling.md) — function calling capabilities
+- [Free AI Models](free-models.md) — 81 models at zero cost
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/benchmarks.md b/docs/benchmarks.md
new file mode 100644
index 00000000..d024a867
--- /dev/null
+++ b/docs/benchmarks.md
@@ -0,0 +1,109 @@
+# AI Model Benchmarks & Leaderboards
+
+[中文](zh/benchmarks.md)
+
+How AI models are evaluated — key benchmarks, leaderboard landscape, and what the numbers mean for model selection.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Benchmarks Matter
+
+Benchmarks provide standardized ways to compare AI models across tasks. However, no single benchmark tells the whole story. This guide covers the major benchmarks, how to interpret them, and how to use them alongside our catalog data (pricing, context windows, capabilities) for informed model selection.
+
+## Major Benchmarks
+
+### General Language Understanding
+
+| Benchmark | What It Tests                      | Top Models                             | Notes                                                         |
+| --------- | ---------------------------------- | -------------------------------------- | ------------------------------------------------------------- |
+| MMLU      | Multi-task knowledge (57 subjects) | GPT-4.1, Claude Opus 4, Gemini 2.5 Pro | Standard academic benchmark; may not reflect real-world usage |
+| MMLU-Pro  | Harder MMLU with reasoning         | o3, Claude Sonnet 4, Gemini 2.5 Pro    | More challenging version                                      |
+| GPQA      | Graduate-level science Q&A         | o3, Gemini 2.5 Pro                     | Expert-level reasoning                                        |
+| HellaSwag | Common-sense reasoning             | Most frontier models near ceiling      | Near-saturated                                                |
+
+### Reasoning & Math
+
+| Benchmark     | What It Tests           | Top Models                  | Notes                      |
+| ------------- | ----------------------- | --------------------------- | -------------------------- |
+| MATH-500      | Competition mathematics | o3, DeepSeek R1, Qwen3-235B | Key for quantitative tasks |
+| AIME 2024     | Math competition        | o3, DeepSeek R1             | Very challenging           |
+| GSM8K         | Grade-school math       | Most models >90%            | Near-saturated             |
+| ARC-Challenge | Scientific reasoning    | Most frontier models        | Grade-school science       |
+
+### Coding
+
+| Benchmark     | What It Tests                | Top Models                            | Notes                         |
+| ------------- | ---------------------------- | ------------------------------------- | ----------------------------- |
+| HumanEval     | Python code generation       | Claude Sonnet 4, GPT-4.1, DeepSeek V3 | 164 Python problems           |
+| SWE-bench     | Real GitHub issue resolution | Claude Sonnet 4, o3                   | More realistic than HumanEval |
+| LiveCodeBench | Continuously updated coding  | Various                               | Avoids data contamination     |
+| MBPP          | Basic Python programming     | Most models >80%                      | Near-saturated                |
+
+### Multimodal
+
+| Benchmark | What It Tests             | Top Models                      | Notes                           |
+| --------- | ------------------------- | ------------------------------- | ------------------------------- |
+| MMMU      | Multi-modal understanding | Gemini 2.5 Pro, Claude Sonnet 4 | Images + text                   |
+| MathVista | Visual math reasoning     | Gemini 2.5 Pro                  | Diagrams + math                 |
+| AI2D      | Science diagrams          | Gemini 2.5 Pro                  | Scientific figure understanding |
+| DocVQA    | Document understanding    | Gemini 2.5 Pro                  | Text in images                  |
+
+### Tool Use & Agents
+
+| Benchmark | What It Tests             | Top Models               | Notes                                 |
+| --------- | ------------------------- | ------------------------ | ------------------------------------- |
+| BFCL v3   | Function calling accuracy | GPT-4.1, Claude Sonnet 4 | Berkeley Function Calling Leaderboard |
+| τ-bench   | Agent task completion     | Various                  | Terminal-based agent tasks            |
+| WebArena  | Web interaction           | Various                  | Realistic web tasks                   |
+
+## Key Leaderboards
+
+| Leaderboard          | Focus                     | URL                                                                     |
+| -------------------- | ------------------------- | ----------------------------------------------------------------------- |
+| LMSYS Chatbot Arena  | Human preference ranking  | https://chat.lmsys.org/                                                 |
+| Open LLM Leaderboard | Open-source model ranking | https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard |
+| AlpacaEval           | Instruction-following     | https://tatsu-lab.github.io/alpaca_eval/                                |
+| MT-Bench             | Multi-turn conversation   | Part of Chatbot Arena                                                   |
+| BigBench             | Beyond basic tasks        | https://github.com/google/BIG-bench                                     |
+| MTEB                 | Embedding models          | https://huggingface.co/spaces/mteb/leaderboard                          |
+
+## How to Use Benchmarks with Our Catalog
+
+Benchmarks alone are insufficient for model selection. Combine them with our catalog data:
+
+1. **Start with your use case** → See [Model Selection Guide](model-selection.md)
+2. **Filter by capabilities** → Tool calling, reasoning, vision, etc.
+3. **Check benchmark scores** → For your specific task domain
+4. **Compare pricing** → Use our [Pricing Comparison](pricing-comparison.md)
+5. **Consider context windows** → See [Context Windows](context-windows.md)
+6. **Test with your data** → Benchmarks are proxies; real performance may differ
+
+## Benchmark Limitations
+
+- **Data contamination**: Models may have seen benchmark data during training
+- **Task narrowness**: Benchmarks test specific skills, not general utility
+- **Leaderboard gaming**: Optimizing for benchmarks can hurt real-world performance
+- **Staleness**: Benchmarks age as models improve; saturated benchmarks become uninformative
+- **Cultural bias**: Most benchmarks are English-centric and Western-focused
+- **Cost blindness**: Benchmarks ignore pricing, latency, and availability
+
+## Practical Recommendations
+
+- For **coding**: Use SWE-bench over HumanEval (more realistic)
+- For **agents**: Test with your actual tool suite; BFCL is a starting point
+- For **reasoning**: MATH-500 and GPQA are more discriminating than MMLU
+- For **chat**: Chatbot Arena correlates best with human preference
+- For **cost-sensitive**: Use our [Free Models](free-models.md) guide first
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — Decision framework for choosing models
+- [Pricing Comparison](pricing-comparison.md) — Cost analysis across providers
+- [Free Models](free-models.md) — 81 free models with capabilities
+- [Tool Calling Models](tool-calling.md) — 2,350 models with function calling
+- [Reasoning Models](reasoning-models.md) — 1,306 models with extended thinking
+- [Vision Models](vision-models.md) — 1,487 models with image understanding
+- [Code Models](code-models.md) — Models optimized for programming
+- [Open Weights](open-weights.md) — 527 open-weight models
+- [Context Windows](context-windows.md) — Context window comparison
+- [Interactive Catalog](https://i-need-token.github.io/ai-models/) — Browse and compare all models
diff --git a/docs/cached-pricing.md b/docs/cached-pricing.md
new file mode 100644
index 00000000..edfe5629
--- /dev/null
+++ b/docs/cached-pricing.md
@@ -0,0 +1,245 @@
+# Cached Pricing
+
+[中文](zh/cached-pricing.md)
+
+AI models with prompt caching support, showing standard vs. cached pricing. Cached inputs can be **50-90% cheaper** than standard input tokens.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Cached Pricing Matters
+
+Prompt caching lets you store repeated prompt prefixes (system prompts, few-shot examples, tool definitions) and reuse them across requests. This dramatically reduces:
+
+- **Cost**: 50-90% savings on input tokens
+- **Latency**: Faster time-to-first-token for cached content
+- **Throughput**: More efficient use of rate limits
+
+## Stats
+
+| Metric                    | Count |
+| ------------------------- | ----- |
+| Models with cache pricing | 1374  |
+| Providers                 | 39    |
+
+## Providers
+
+`aihubmix`, `aion`, `amazon-bedrock`, `auriko`, `baidu`, `baseten`, `chutes`, `clarifai`, `cloudflare`, `cortecs`, `databricks`, `deepinfra`, `deepseek`, `digitalocean`, `fastrouter`, `friendli`, `google`, `google-vertex`, `groq`, `hpc-ai`, `inception`, `jiekou`, `llmgateway`, `martian`, `minimax`, `moonshotai`, `nanogpt`, `openai`, `openrouter`, `ppio`, `privatemode`, `requesty`, `siliconflow`, `stepfun`, `tencent-tokenhub`, `togetherai`, `upstage`, `venice`, `wafer`
+
+## Model Pricing
+
+| Model                                         | Provider       | Context | Input $/M           | Cache Read $/M       | Cache Write $/M | Savings |
+| --------------------------------------------- | -------------- | ------- | ------------------- | -------------------- | --------------- | ------- |
+| aistudio_gemini-2.0-flash                     | aihubmix       | —       | $0.05               | $0.125               | —               | -150%   |
+| aistudio_gpt-4.1-mini                         | aihubmix       | —       | $0.2                | $0.05                | —               | 75%     |
+| anthropic-opus-4-6                            | aihubmix       | —       | $2.5                | $0.25                | $3.125          | 90%     |
+| claude-haiku-4-5                              | aihubmix       | —       | $0.55               | $0.055               | $0.6875         | 90%     |
+| claude-sonnet-4-0                             | aihubmix       | —       | $1.65               | $0.165               | $2.0625         | 90%     |
+| claude-sonnet-4-5                             | aihubmix       | —       | $1.65               | $0.165               | $2.0625         | 90%     |
+| claude-sonnet-4-5-think                       | aihubmix       | —       | $1.65               | $0.165               | $2.0625         | 90%     |
+| codex-mini-latest                             | aihubmix       | —       | $0.75               | $0.1875              | —               | 75%     |
+| deepseek-v3.2                                 | aihubmix       | —       | $0.151              | $0.0151              | —               | 90%     |
+| deepseek-v3.2-exp                             | aihubmix       | —       | $0.137              | $0.0137              | —               | 90%     |
+| deepseek-v3.2-exp-think                       | aihubmix       | —       | $0.137              | $0.0137              | —               | 90%     |
+| deepseek-v3.2-think                           | aihubmix       | —       | $0.151              | $0.0151              | —               | 90%     |
+| doubao-1.5-lite-32k                           | aihubmix       | —       | $0.025              | $0.005               | —               | 80%     |
+| doubao-1.5-pro-32k                            | aihubmix       | —       | $0.067              | $0.0134              | —               | 80%     |
+| doubao-lite-32k                               | aihubmix       | —       | $0.03               | $0.006               | —               | 80%     |
+| doubao-pro-32k                                | aihubmix       | —       | $0.07               | $0.014               | —               | 80%     |
+| doubao-seed-1-6                               | aihubmix       | —       | $0.09               | $0.018               | —               | 80%     |
+| doubao-seed-1-6-250615                        | aihubmix       | —       | $0.09               | $0.018               | —               | 80%     |
+| doubao-seed-1-6-flash                         | aihubmix       | —       | $0.022              | $0.0044              | —               | 80%     |
+| doubao-seed-1-6-flash-250615                  | aihubmix       | —       | $0.022              | $0.0044              | —               | 80%     |
+| doubao-seed-1-6-lite                          | aihubmix       | —       | $0.041              | $0.0082              | —               | 80%     |
+| doubao-seed-1-6-thinking                      | aihubmix       | —       | $0.09               | $0.018               | —               | 80%     |
+| doubao-seed-1-6-thinking-250615               | aihubmix       | —       | $0.09               | $0.018               | —               | 80%     |
+| doubao-seed-1-6-vision-250815                 | aihubmix       | —       | $0.054795           | $0.010959            | —               | 80%     |
+| doubao-seed-1-8                               | aihubmix       | —       | $0.054795           | $0.010959            | —               | 80%     |
+| gemini-2.0-flash                              | aihubmix       | —       | $0.05               | $0.0125              | —               | 75%     |
+| gemini-2.0-flash-001                          | aihubmix       | —       | $0.05               | $0.125               | —               | -150%   |
+| gemini-2.0-flash-search                       | aihubmix       | —       | $0.05               | $0.0125              | —               | 75%     |
+| gemini-2.5-flash                              | aihubmix       | —       | $0.15               | $0.015               | —               | 90%     |
+| gemini-2.5-flash-lite                         | aihubmix       | —       | $0.05               | $0.005               | —               | 90%     |
+| gemini-2.5-flash-lite-nothink                 | aihubmix       | —       | $0.05               | $0.005               | —               | 90%     |
+| gemini-2.5-flash-lite-preview-09-2025         | aihubmix       | —       | $0.05               | $0.005               | —               | 90%     |
+| gemini-2.5-flash-lite-preview-09-2025-nothink | aihubmix       | —       | $0.05               | $0.005               | —               | 90%     |
+| gemini-2.5-flash-nothink                      | aihubmix       | —       | $0.15               | $0.015               | —               | 90%     |
+| gemini-2.5-flash-preview-05-20-nothink        | aihubmix       | —       | $0.15               | $0.015               | —               | 90%     |
+| gemini-2.5-flash-preview-05-20-search         | aihubmix       | —       | $0.15               | $0.015               | —               | 90%     |
+| gemini-2.5-flash-preview-09-2025              | aihubmix       | —       | $0.15               | $0.015               | —               | 90%     |
+| gemini-2.5-flash-search                       | aihubmix       | —       | $0.15               | $0.015               | —               | 90%     |
+| gemini-2.5-pro                                | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-exp-03-25                      | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-preview-03-25                  | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-preview-03-25-search           | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-preview-05-06                  | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-preview-05-06-search           | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-preview-06-05                  | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-preview-06-05-search           | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gemini-2.5-pro-search                         | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| glm-4.5-airx                                  | aihubmix       | —       | $0.55               | $0.11                | —               | 80%     |
+| glm-4.5-x                                     | aihubmix       | —       | $1.1                | $0.22                | —               | 80%     |
+| glm-4.6                                       | aihubmix       | —       | $0.136987           | $0.027397            | —               | 80%     |
+| glm-4.6v                                      | aihubmix       | —       | $0.0685             | $0.0137              | —               | 80%     |
+| glm-4.7                                       | aihubmix       | —       | $0.136987           | $0.027397            | —               | 80%     |
+| gpt-4.1                                       | aihubmix       | —       | $1                  | $0.25                | —               | 75%     |
+| gpt-4.1-mini                                  | aihubmix       | —       | $0.2                | $0.05                | —               | 75%     |
+| gpt-4.1-nano                                  | aihubmix       | —       | $0.05               | $0.0125              | —               | 75%     |
+| gpt-4o                                        | aihubmix       | —       | $1.25               | $0.625               | —               | 50%     |
+| gpt-4o-2024-08-06                             | aihubmix       | —       | $1.25               | $0.625               | —               | 50%     |
+| gpt-4o-2024-08-06-global                      | aihubmix       | —       | $1.25               | $0.625               | —               | 50%     |
+| gpt-4o-2024-11-20                             | aihubmix       | —       | $1.25               | $0.625               | —               | 50%     |
+| gpt-4o-mini                                   | aihubmix       | —       | $0.075              | $0.0375              | —               | 50%     |
+| gpt-4o-mini-2024-07-18                        | aihubmix       | —       | $0.075              | $0.0375              | —               | 50%     |
+| gpt-4o-mini-global                            | aihubmix       | —       | $0.075              | $0.0375              | —               | 50%     |
+| gpt-4o-mini-search-preview                    | aihubmix       | —       | $0.075              | $0.0375              | —               | 50%     |
+| gpt-4o-search-preview                         | aihubmix       | —       | $1.25               | $0.625               | —               | 50%     |
+| gpt-5                                         | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gpt-5-chat-latest                             | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gpt-5-codex                                   | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gpt-5-mini                                    | aihubmix       | —       | $0.125              | $0.0125              | —               | 90%     |
+| gpt-5-nano                                    | aihubmix       | —       | $0.025              | $0.0025              | —               | 90%     |
+| gpt-5.1                                       | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gpt-5.1-chat-latest                           | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gpt-5.1-codex                                 | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gpt-5.1-codex-max                             | aihubmix       | —       | $0.625              | $0.0625              | —               | 90%     |
+| gpt-5.1-codex-mini                            | aihubmix       | —       | $0.125              | $0.0125              | —               | 90%     |
+| gpt-5.2                                       | aihubmix       | —       | $0.875              | $0.0875              | —               | 90%     |
+| gpt-5.2-chat-latest                           | aihubmix       | —       | $0.875              | $0.0875              | —               | 90%     |
+| gpt-5.2-codex                                 | aihubmix       | —       | $0.875              | $0.0875              | —               | 90%     |
+| gpt-5.2-high                                  | aihubmix       | —       | $0.875              | $0.0875              | —               | 90%     |
+| gpt-5.2-low                                   | aihubmix       | —       | $0.875              | $0.0875              | —               | 90%     |
+| gpt-5.2-pro                                   | aihubmix       | —       | $10.5               | $1.05                | —               | 90%     |
+| grok-4                                        | aihubmix       | —       | $1.65               | $0.4125              | —               | 75%     |
+| grok-4-1-fast-non-reasoning                   | aihubmix       | —       | $0.1                | $0.025               | —               | 75%     |
+| grok-4-1-fast-reasoning                       | aihubmix       | —       | $0.1                | $0.025               | —               | 75%     |
+| grok-4-fast-non-reasoning                     | aihubmix       | —       | $0.1                | $0.025               | —               | 75%     |
+| grok-4-fast-reasoning                         | aihubmix       | —       | $0.1                | $0.025               | —               | 75%     |
+| grok-4.20-beta-0309-non-reasoning             | aihubmix       | —       | $1                  | $0.1                 | —               | 90%     |
+| grok-4.20-beta-0309-reasoning                 | aihubmix       | —       | $1                  | $0.1                 | —               | 90%     |
+| grok-4.20-multi-agent-0309                    | aihubmix       | —       | $1                  | $0.1                 | —               | 90%     |
+| grok-4.20-multi-agent-beta-0309               | aihubmix       | —       | $1                  | $0.1                 | —               | 90%     |
+| grok-code-fast-1                              | aihubmix       | —       | $0.1                | $0.025               | —               | 75%     |
+| kimi-k2-thinking                              | aihubmix       | —       | $0.274              | $0.0685              | —               | 75%     |
+| kimi-k2-turbo-preview                         | aihubmix       | —       | $0.6                | $0.15                | —               | 75%     |
+| kimi-k2.5                                     | aihubmix       | —       | $0.3                | $0.0525              | —               | 82%     |
+| mimo-v2-flash                                 | aihubmix       | —       | $0.0959             | $0.01918             | —               | 80%     |
+| mimo-v2-omni                                  | aihubmix       | —       | $0.22               | $0.044               | —               | 80%     |
+| mimo-v2-pro                                   | aihubmix       | —       | $0.55               | $0.11                | —               | 80%     |
+| nvidia-nemotron-3-super-120b-a12b             | aihubmix       | —       | $0.055              | $0.01375             | —               | 75%     |
+| o1                                            | aihubmix       | —       | $7.5                | $3.75                | —               | 50%     |
+| o1-2024-12-17                                 | aihubmix       | —       | $7.5                | $3.75                | —               | 50%     |
+| o1-global                                     | aihubmix       | —       | $7.5                | $3.75                | —               | 50%     |
+| o1-mini                                       | aihubmix       | —       | $1.5                | $0.75                | —               | 50%     |
+| o1-mini-2024-09-12                            | aihubmix       | —       | $1.5                | $0.75                | —               | 50%     |
+| o1-preview                                    | aihubmix       | —       | $7.5                | $3.75                | —               | 50%     |
+| o1-preview-2024-09-12                         | aihubmix       | —       | $7.5                | $3.75                | —               | 50%     |
+| o3                                            | aihubmix       | —       | $1                  | $0.25                | —               | 75%     |
+| o3-deep-research                              | aihubmix       | —       | $5                  | $1.25                | —               | 75%     |
+| o3-global                                     | aihubmix       | —       | $1                  | $0.25                | —               | 75%     |
+| o3-mini                                       | aihubmix       | —       | $0.55               | $0.275               | —               | 50%     |
+| o3-mini-global                                | aihubmix       | —       | $0.55               | $0.275               | —               | 50%     |
+| o4-mini                                       | aihubmix       | —       | $0.55               | $0.1375              | —               | 75%     |
+| qwen-plus                                     | aihubmix       | —       | $0.0563             | $0.01126             | $0.070375       | 80%     |
+| qwen-plus-2025-04-28                          | aihubmix       | —       | $0.0563             | $0.01126             | $0.070375       | 80%     |
+| qwen-plus-2025-07-28                          | aihubmix       | —       | $0.0563             | $0.01126             | $0.070375       | 80%     |
+| qwen-plus-latest                              | aihubmix       | —       | $0.0563             | $0.01126             | $0.070375       | 80%     |
+| qwen-turbo                                    | aihubmix       | —       | $0.023              | $0.0046              | —               | 80%     |
+| qwen-turbo-latest                             | aihubmix       | —       | $0.023              | $0.0046              | —               | 80%     |
+| qwen3-coder-plus                              | aihubmix       | —       | $0.27               | $0.054               | —               | 80%     |
+| qwen3-max                                     | aihubmix       | —       | $0.2254             | $0.04508             | $0.28175        | 80%     |
+| qwen3-max-2026-01-23                          | aihubmix       | —       | $0.2254             | $0.04508             | $0.28175        | 80%     |
+| qwen3-max-preview                             | aihubmix       | —       | $0.423              | $0.0846              | —               | 80%     |
+| qwen3-vl-flash                                | aihubmix       | —       | $0.0103             | $0.00206             | —               | 80%     |
+| qwen3-vl-plus                                 | aihubmix       | —       | $0.0685             | $0.0137              | —               | 80%     |
+| zai-glm-5-turbo                               | aihubmix       | —       | $0.6                | $0.12                | —               | 80%     |
+| aion-2.0                                      | aion           | —       | $0.7999999999999999 | $0.19999999999999998 | —               | 75%     |
+| aion-2.5                                      | aion           | —       | $1                  | $0.35                | —               | 65%     |
+| amazon-nova-2-lite                            | amazon-bedrock | —       | $0.33               | $0.0825              | —               | 75%     |
+| amazon-nova-lite                              | amazon-bedrock | —       | $0.06               | $0.015               | —               | 75%     |
+| amazon-nova-micro                             | amazon-bedrock | —       | $0.035              | $0.00875             | —               | 75%     |
+| amazon-nova-premier                           | amazon-bedrock | —       | $2.5                | $0.625               | —               | 75%     |
+| amazon-nova-pro                               | amazon-bedrock | —       | $0.8                | $0.2                 | —               | 75%     |
+| claude-haiku-4-5-20251001                     | auriko         | —       | $1                  | $0.1                 | $1.25           | 90%     |
+| claude-opus-4-1-20250805                      | auriko         | —       | $15                 | $1.5                 | $18.75          | 90%     |
+| claude-opus-4-20250514                        | auriko         | —       | $15                 | $1.5                 | $18.75          | 90%     |
+| claude-opus-4-5-20251101                      | auriko         | —       | $5                  | $0.5                 | $6.25           | 90%     |
+| claude-opus-4-6                               | auriko         | —       | $5                  | $0.5                 | $6.25           | 90%     |
+| claude-opus-4-7                               | auriko         | —       | $5                  | $0.5                 | $6.25           | 90%     |
+| claude-sonnet-4-20250514                      | auriko         | —       | $3                  | $0.3                 | $3.75           | 90%     |
+| claude-sonnet-4-5-20250929                    | auriko         | —       | $3                  | $0.3                 | $3.75           | 90%     |
+| claude-sonnet-4-6                             | auriko         | —       | $3                  | $0.3                 | $3.75           | 90%     |
+| deepseek-r1-0528                              | auriko         | —       | $0.5                | $0.35                | —               | 30%     |
+| deepseek-v3-0324                              | auriko         | —       | $0.2                | $0.135               | —               | 32%     |
+| deepseek-v3.1                                 | auriko         | —       | $0.21               | $0.13                | —               | 38%     |
+| deepseek-v3.1-terminus                        | auriko         | —       | $0.27               | $0.13                | —               | 52%     |
+| deepseek-v3.2                                 | auriko         | —       | $0.26               | $0.13                | —               | 50%     |
+| deepseek-v4-flash                             | auriko         | —       | $0.14               | $0.0028              | —               | 98%     |
+| deepseek-v4-pro                               | auriko         | —       | $0.435              | $0.003625            | —               | 99%     |
+| gemini-2.5-flash                              | auriko         | —       | $0.3                | $0.03                | —               | 90%     |
+| gemini-2.5-flash-lite                         | auriko         | —       | $0.1                | $0.01                | —               | 90%     |
+| gemini-2.5-pro                                | auriko         | —       | $1.25               | $0.125               | —               | 90%     |
+| gemini-3-flash-preview                        | auriko         | —       | $0.5                | $0.05                | —               | 90%     |
+| gemini-3.1-flash-lite                         | auriko         | —       | $0.25               | $0.025               | —               | 90%     |
+| gemini-3.1-flash-lite-preview                 | auriko         | —       | $0.25               | $0.025               | —               | 90%     |
+| gemini-3.1-pro-preview                        | auriko         | —       | $2                  | $0.2                 | —               | 90%     |
+| gemini-3.1-pro-preview-customtools            | auriko         | —       | $2                  | $0.2                 | —               | 90%     |
+| gemini-flash-latest                           | auriko         | —       | $0.5                | $0.05                | —               | 90%     |
+| gemini-flash-lite-latest                      | auriko         | —       | $0.1                | $0.01                | —               | 90%     |
+| gemini-pro-latest                             | auriko         | —       | $2                  | $0.2                 | —               | 90%     |
+| glm-4.5                                       | auriko         | —       | $0.6                | $0.11                | —               | 82%     |
+| glm-4.5-air                                   | auriko         | —       | $0.2                | $0.03                | —               | 85%     |
+| glm-4.5-airx                                  | auriko         | —       | $1.1                | $0.22                | —               | 80%     |
+| glm-4.5-x                                     | auriko         | —       | $2.2                | $0.45                | —               | 80%     |
+| glm-4.5v                                      | auriko         | —       | $0.6                | $0.11                | —               | 82%     |
+| glm-4.6                                       | auriko         | —       | $0.6                | $0.11                | —               | 82%     |
+| glm-4.6v                                      | auriko         | —       | $0.3                | $0.05                | —               | 83%     |
+| glm-4.6v-flashx                               | auriko         | —       | $0.04               | $0.004               | —               | 90%     |
+| glm-4.7                                       | auriko         | —       | $0.6                | $0.11                | —               | 82%     |
+| glm-4.7-flashx                                | auriko         | —       | $0.07               | $0.01                | —               | 86%     |
+| glm-5                                         | auriko         | —       | $1                  | $0.2                 | —               | 80%     |
+| glm-5-turbo                                   | auriko         | —       | $1.2                | $0.24                | —               | 80%     |
+| glm-5.1                                       | auriko         | —       | $1.4                | $0.26                | —               | 81%     |
+| glm-5v-turbo                                  | auriko         | —       | $1.2                | $0.24                | —               | 80%     |
+| gpt-4.1-2025-04-14                            | auriko         | —       | $2                  | $0.5                 | —               | 75%     |
+| gpt-4.1-mini-2025-04-14                       | auriko         | —       | $0.4                | $0.1                 | —               | 75%     |
+| gpt-4.1-nano-2025-04-14                       | auriko         | —       | $0.1                | $0.025               | —               | 75%     |
+| gpt-4o-2024-08-06                             | auriko         | —       | $2.5                | $1.25                | —               | 50%     |
+| gpt-4o-2024-11-20                             | auriko         | —       | $2.5                | $1.25                | —               | 50%     |
+| gpt-4o-mini-2024-07-18                        | auriko         | —       | $0.15               | $0.075               | —               | 50%     |
+| gpt-5-2025-08-07                              | auriko         | —       | $1.25               | $0.125               | —               | 90%     |
+| gpt-5-chat-latest                             | auriko         | —       | $1.25               | $0.125               | —               | 90%     |
+| gpt-5-mini-2025-08-07                         | auriko         | —       | $0.25               | $0.025               | —               | 90%     |
+| gpt-5-nano-2025-08-07                         | auriko         | —       | $0.05               | $0.005               | —               | 90%     |
+| gpt-5.1-2025-11-13                            | auriko         | —       | $1.25               | $0.125               | —               | 90%     |
+| gpt-5.1-chat-latest                           | auriko         | —       | $1.25               | $0.125               | —               | 90%     |
+| gpt-5.2-2025-12-11                            | auriko         | —       | $1.75               | $0.175               | —               | 90%     |
+| gpt-5.2-chat-latest                           | auriko         | —       | $1.75               | $0.175               | —               | 90%     |
+| gpt-5.3-chat-latest                           | auriko         | —       | $1.75               | $0.175               | —               | 90%     |
+| gpt-5.4-2026-03-05                            | auriko         | —       | $2.5                | $0.25                | —               | 90%     |
+| gpt-5.4-mini-2026-03-17                       | auriko         | —       | $0.75               | $0.075               | —               | 90%     |
+| gpt-5.4-nano-2026-03-17                       | auriko         | —       | $0.2                | $0.02                | —               | 90%     |
+| gpt-5.5-2026-04-23                            | auriko         | —       | $5                  | $0.5                 | —               | 90%     |
+| gpt-oss-120b                                  | auriko         | —       | $0.15               | $0.01                | —               | 93%     |
+| gpt-oss-20b                                   | auriko         | —       | $0.07               | $0.04                | —               | 43%     |
+| grok-4.20-0309-non-reasoning                  | auriko         | —       | $1.25               | $0.2                 | —               | 84%     |
+| grok-4.20-0309-reasoning                      | auriko         | —       | $1.25               | $0.2                 | —               | 84%     |
+| grok-4.3                                      | auriko         | —       | $1.25               | $0.2                 | —               | 84%     |
+| hy3-preview                                   | auriko         | —       | $0.066              | $0.029               | —               | 56%     |
+| kimi-k2-0711-preview                          | auriko         | —       | $0.6                | $0.15                | —               | 75%     |
+| kimi-k2-0905-preview                          | auriko         | —       | $0.6                | $0.15                | —               | 75%     |
+| kimi-k2-thinking                              | auriko         | —       | $0.6                | $0.15                | —               | 75%     |
+| kimi-k2-thinking-turbo                        | auriko         | —       | $1.15               | $0.15                | —               | 87%     |
+
+> 📄 Showing first 200 of 1374 models. Use the [interactive catalog](https://i-need-token.github.io/ai-models/) to browse all.
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — cost optimization tips
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing across providers
+- [Free AI Models](free-models.md) — 81 free models
+- [Context Window Comparison](context-windows.md) — largest context windows
+- [Open-Weight Models](open-weights.md) — 527 models you can run yourself
diff --git a/docs/chat-models.md b/docs/chat-models.md
new file mode 100644
index 00000000..e4bdd4cd
--- /dev/null
+++ b/docs/chat-models.md
@@ -0,0 +1,99 @@
+# Chat Models
+
+[中文](zh/chat-models.md)
+
+AI models with **tool calling** support — the essential capability for building chat-based applications, AI assistants, and conversational agents. These models can understand natural language, generate responses, and invoke external tools.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Chat Models Matter
+
+Chat models are the backbone of modern AI applications:
+
+- **Conversational AI** — natural language dialogue with context
+- **AI Assistants** — task-oriented chat with tool use
+- **Customer Support** — automated support with knowledge base access
+- **Content Generation** — writing, summarization, translation
+- **Data Analysis** — natural language queries over structured data
+
+Tool calling is the key differentiator — it allows models to go beyond text generation and take actions in the real world.
+
+## Stats
+
+| Metric                          | Count |
+| ------------------------------- | ----- |
+| Chat models (with tool calling) | 2350  |
+| Providers                       | 71    |
+| Free chat models                | 54    |
+| Open-weight chat models         | 278   |
+| With reasoning                  | 1080  |
+| With structured output          | 758   |
+
+## Providers
+
+`01ai`, `302ai`, `aihubmix`, `aimlapi`, `alibaba`, `amazon`, `amazon-bedrock`, `anthropic`, `arcee`, `auriko`, `baidu`, `baseten`, `berget`, `bytedance`, `cerebras`, `chutes`, `clarifai`, `cloudferro-sherlock`, `cloudflare`, `cortecs`, `databricks`, `deepseek`, `digitalocean`, `dinference`, `evroc` and 46 more
+
+## Free Chat Models
+
+Free models with tool calling — zero-cost chat applications.
+
+| Model                                                | Provider   | Context | Input $/M | Output $/M | Capabilities |
+| ---------------------------------------------------- | ---------- | ------- | --------- | ---------- | ------------ |
+| openrouter--owl-alpha                                | openrouter | 1M      | Free      | Free       | 📋           |
+| deepseek--deepseek-v4-flash--free                    | openrouter | 1M      | Free      | Free       | 🧠           |
+| qwen--qwen3-coder--free                              | openrouter | 1M      | Free      | Free       |              |
+| nvidia--nemotron-3-super-120b-a12b--free             | openrouter | 1M      | Free      | Free       | 🧠 📋        |
+| google--gemma-4-26b-a4b-it--free                     | openrouter | 262K    | Free      | Free       | 🧠 📋        |
+| arcee-ai--trinity-large-thinking--free               | openrouter | 262K    | Free      | Free       | 🧠           |
+| google--gemma-4-31b-it--free                         | openrouter | 262K    | Free      | Free       | 🧠 📋        |
+| gemma-4-26b-a4b-it                                   | auriko     | 262K    | Free      | Free       | 🧠 📋        |
+| gemma-4-31b-it                                       | auriko     | 262K    | Free      | Free       | 🧠 📋        |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter | 256K    | Free      | Free       | 🧠           |
+
+## Cheapest Chat Models
+
+Best value chat models for production.
+
+| Model                                       | Provider     | Context | Input $/M | Output $/M | Capabilities |
+| ------------------------------------------- | ------------ | ------- | --------- | ---------- | ------------ |
+| ernie-4.5-0.3b                              | aihubmix     | 0       | $0.0068   | $0.0272    | 📋           |
+| bdc-coder                                   | inferencenet | 131K    | $0.01     | $0.01      | 🔓           |
+| inclusionai--ling-2.6-flash                 | openrouter   | 262K    | $0.01     | $0.03      | 📋           |
+| ling-2.6-flash                              | inclusionai  | 262K    | $0.01     | $0.03      |              |
+| qwen-3.5-0.8b                               | auriko       | 262K    | $0.01     | $0.05      | 🧠           |
+| qwen3-vl-flash-2026-01-22                   | aihubmix     | 0       | $0.0103   | $0.103     | 📋           |
+| qwen3-vl-flash                              | aihubmix     | 0       | $0.0103   | $0.103     | 📋           |
+| klusterai--Meta-Llama-3.1-8B-Instruct-Turbo | klusterai    | 131K    | $0.015    | $0.02      |              |
+| granite-4.0-h-micro                         | cloudflare   | 131K    | $0.017    | $0.112     | 🔓           |
+| llama-3.1-8b-instruct                       | cortecs      | 0       | $0.018    | $0.054     | 🧠           |
+
+## Largest Context Chat Models
+
+Chat models with the largest context windows — for long conversations and document analysis.
+
+| Model                        | Provider   | Context | Input $/M | Output $/M | Capabilities |
+| ---------------------------- | ---------- | ------- | --------- | ---------- | ------------ |
+| meta-llama--llama-4-scout    | openrouter | 10M     | $0.08     | $0.3       | 📋           |
+| meta-llama-4-scout           | meta       | 10M     | $0.17     | $0.66      |              |
+| gemini-1.5-pro               | google     | 2M      | $1.25     | $5         | 📋           |
+| grok-code-fast-1             | jiekou     | 2M      | $0.19     | $0.475     |              |
+| gpt-4o                       | jiekou     | 2M      | $1.9      | $5.7       |              |
+| grok-4.20-0309-non-reasoning | jiekou     | 2M      | $0.19     | $0.475     |              |
+| grok-4.20-0309-reasoning     | jiekou     | 2M      | $1.9      | $5.7       |              |
+| grok-4-1-fast-reasoning      | jiekou     | 2M      | $0.19     | $0.475     |              |
+| grok-4-fast-reasoning        | jiekou     | 2M      | $0.19     | $0.475     |              |
+| x-ai--grok-4-fast            | fastrouter | 2M      | $0.2      | $0.5       |              |
+
+## Related Documentation
+
+- [Agentic Models](agentic-models.md) — 1,080 models with tool calling + reasoning
+- [Reasoning Models](reasoning-models.md) — 1,306 models with reasoning
+- [Code Models](code-models.md) — 189 code-focused models
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Structured Output](structured-output.md) — 829 JSON-mode models
+- [Model Selection Guide](model-selection.md) — decision framework
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/code-examples.md b/docs/code-examples.md
new file mode 100644
index 00000000..662fb2cd
--- /dev/null
+++ b/docs/code-examples.md
@@ -0,0 +1,371 @@
+# Code Examples
+
+**English** | [中文](./zh/code-examples.md)
+
+Practical code examples for working with the AI Models Catalog data in multiple languages.
+
+## Download the Data
+
+```bash
+# JSON — full metadata (2.3 MB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — flat table for Excel/Google Sheets (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+```
+
+Or use the [jsDelivr CDN](https://www.jsdelivr.com/package/npm/ai-models) (no download needed, CORS-enabled):
+
+```bash
+# Always up-to-date, works in browsers
+curl -s https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+```
+
+## TypeScript / JavaScript
+
+### Install the npm package
+
+```bash
+npm install ai-models
+```
+
+### Basic usage
+
+```typescript
+import catalog from "ai-models";
+import type { Model } from "ai-models";
+
+// Total number of models
+console.log(`Total models: ${catalog.models.length}`);
+
+// Find models by provider
+const openaiModels = catalog.models.filter((m) => m.provider === "openai");
+console.log(`OpenAI models: ${openaiModels.length}`);
+```
+
+### Find the cheapest tool-calling models
+
+```typescript
+import catalog from "ai-models";
+
+const affordable = catalog.models
+  .filter((m) => m.tool_call && m.pricing?.input && m.pricing.input < 1)
+  .sort((a, b) => a.pricing.input - b.pricing.input)
+  .slice(0, 10);
+
+for (const m of affordable) {
+  console.log(`${m.name}: $${m.pricing.input}/1M input, $${m.pricing.output}/1M output`);
+}
+```
+
+### Find models with the largest context windows
+
+```typescript
+import catalog from "ai-models";
+
+const largest = catalog.models
+  .filter((m) => m.limit?.context)
+  .sort((a, b) => b.limit.context - a.limit.context)
+  .slice(0, 10);
+
+for (const m of largest) {
+  console.log(`${m.name}: ${(m.limit.context / 1_000_000).toFixed(1)}M context`);
+}
+```
+
+### Find free models with vision
+
+```typescript
+import catalog from "ai-models";
+
+const freeVision = catalog.models.filter(
+  (m) => m.pricing?.unit === "free" && m.modalities?.input?.includes("image"),
+);
+
+console.log(`Free vision models: ${freeVision.length}`);
+for (const m of freeVision) {
+  console.log(`- ${m.name} (${m.provider})`);
+}
+```
+
+## Python
+
+### Using the JSON data
+
+```python
+import json
+import urllib.request
+
+# Download the latest data
+url = "https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+urllib.request.urlretrieve(url, "models.json")
+
+with open("models.json") as f:
+    catalog = json.load(f)
+
+print(f"Total models: {len(catalog['models'])}")
+```
+
+### Find reasoning models under $5/1M output
+
+```python
+reasoning_cheap = [
+    m for m in catalog["models"]
+    if m.get("reasoning")
+    and m.get("pricing", {}).get("output")
+    and m["pricing"]["output"] < 5
+]
+
+for m in sorted(reasoning_cheap, key=lambda x: x["pricing"]["output"]):
+    print(f"{m['name']}: ${m['pricing']['output']}/1M output")
+```
+
+### Using pandas with the CSV
+
+```python
+import pandas as pd
+
+df = pd.read_csv("https://github.com/i-need-token/ai-models/releases/latest/download/models.csv")
+
+# Filter and sort
+tool_calling = df[df["tool_call"] == True].sort_values("pricing_input")
+print(tool_calling[["name", "provider", "pricing_input", "pricing_output"]].head(10))
+```
+
+### Find open-weight models with tool calling
+
+```python
+open_tool = [
+    m for m in catalog["models"]
+    if m.get("open_weights") and m.get("tool_call")
+]
+
+print(f"Open-weight models with tool calling: {len(open_tool)}")
+for m in open_tool[:10]:
+    print(f"  - {m['name']} ({m['provider']})")
+```
+
+## Go
+
+```go
+package main
+
+import (
+    "encoding/json"
+    "fmt"
+    "net/http"
+)
+
+type Catalog struct {
+    Models []Model `json:"models"`
+}
+
+type Model struct {
+    ID       string  `json:"id"`
+    Name     string  `json:"name"`
+    Provider string  `json:"provider"`
+    ToolCall bool    `json:"tool_call"`
+    Pricing  Pricing `json:"pricing"`
+}
+
+type Pricing struct {
+    Input  float64 `json:"input"`
+    Output float64 `json:"output"`
+}
+
+func main() {
+    resp, err := http.Get("https://github.com/i-need-token/ai-models/releases/latest/download/models.json")
+    if err != nil {
+        panic(err)
+    }
+    defer resp.Body.Close()
+
+    var catalog Catalog
+    json.NewDecoder(resp.Body).Decode(&catalog)
+
+    fmt.Printf("Total models: %d\n", len(catalog.Models))
+
+    // Find tool-calling models under $1/1M input
+    for _, m := range catalog.Models {
+        if m.ToolCall && m.Pricing.Input > 0 && m.Pricing.Input < 1 {
+            fmt.Printf("%s: $%.2f/1M input\n", m.Name, m.Pricing.Input)
+        }
+    }
+}
+```
+
+## Rust
+
+```rust
+use serde::Deserialize;
+
+#[derive(Deserialize)]
+struct Catalog {
+    models: Vec<Model>,
+}
+
+#[derive(Deserialize)]
+struct Model {
+    id: String,
+    name: String,
+    provider: String,
+    #[serde(default)]
+    tool_call: bool,
+    pricing: Option<Pricing>,
+}
+
+#[derive(Deserialize)]
+struct Pricing {
+    input: f64,
+    output: f64,
+}
+
+fn main() -> Result<(), Box<dyn std::error::Error>> {
+    let data = reqwest::blocking::get(
+        "https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+    )?.text()?;
+
+    let catalog: Catalog = serde_json::from_str(&data)?;
+    println!("Total models: {}", catalog.models.len());
+
+    // Find reasoning models
+    let reasoning: Vec<_> = catalog.models.iter()
+        .filter(|m| m.tool_call)
+        .collect();
+
+    println!("Tool-calling models: {}", reasoning.len());
+    Ok(())
+}
+```
+
+## Shell / jq
+
+```bash
+# Download the data
+curl -sLO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# Count total models
+jq '.models | length' models.json
+
+# Find all OpenAI models
+jq '.models[] | select(.provider == "openai") | .name' models.json
+
+# Find the cheapest models with tool calling
+jq '[.models[] | select(.tool_call == true and .pricing.input != null)] | sort_by(.pricing.input) | .[:5] | .[] | {name, provider, input: .pricing.input}' models.json
+
+# Find free models
+jq '[.models[] | select(.pricing.unit == "free")] | length' models.json
+
+# List all providers
+jq '.providers | keys' models.json
+```
+
+## Excel / Google Sheets
+
+1. Download the CSV: `https://github.com/i-need-token/ai-models/releases/latest/download/models.csv`
+2. Open in Excel or import into Google Sheets
+3. Use filters to find models by provider, capability, or price range
+
+## Common Queries
+
+### Find the best model for coding
+
+```typescript
+import catalog from "ai-models";
+
+const codingModels = catalog.models.filter(
+  (m) =>
+    m.tool_call &&
+    m.structured_output &&
+    m.limit?.context >= 128000 &&
+    m.pricing?.input &&
+    m.pricing.input <= 5,
+);
+
+// Sort by context window (descending), then price (ascending)
+codingModels.sort((a, b) => {
+  const ctxDiff = (b.limit?.context ?? 0) - (a.limit?.context ?? 0);
+  if (ctxDiff !== 0) return ctxDiff;
+  return (a.pricing?.input ?? 0) - (b.pricing?.input ?? 0);
+});
+```
+
+### Compare pricing across providers for the same model family
+
+```typescript
+import catalog from "ai-models";
+
+// Group by family
+const families = new Map<string, Model[]>();
+for (const m of catalog.models) {
+  if (!m.family) continue;
+  const list = families.get(m.family) ?? [];
+  list.push(m);
+  families.set(m.family, list);
+}
+
+// Find families available on multiple providers
+for (const [family, models] of families) {
+  const providers = new Set(models.map((m) => m.provider));
+  if (providers.size > 1) {
+    console.log(`\n${family}:`);
+    for (const m of models) {
+      console.log(`  ${m.provider}: $${m.pricing?.input}/1M in, $${m.pricing?.output}/1M out`);
+    }
+  }
+}
+```
+
+### Build a model selector for your app
+
+```typescript
+import catalog from "ai-models";
+import type { Model } from "ai-models";
+
+interface ModelRequirements {
+  toolCall?: boolean;
+  vision?: boolean;
+  reasoning?: boolean;
+  structuredOutput?: boolean;
+  minContext?: number;
+  maxInputPrice?: number;
+  maxOutputPrice?: number;
+  openWeights?: boolean;
+  provider?: string;
+}
+
+function findModels(req: ModelRequirements): Model[] {
+  return catalog.models.filter((m) => {
+    if (req.toolCall && !m.tool_call) return false;
+    if (req.vision && !m.modalities?.input?.includes("image")) return false;
+    if (req.reasoning && !m.reasoning) return false;
+    if (req.structuredOutput && !m.structured_output) return false;
+    if (req.minContext && (m.limit?.context ?? 0) < req.minContext) return false;
+    if (req.maxInputPrice && (m.pricing?.input ?? Infinity) > req.maxInputPrice) return false;
+    if (req.maxOutputPrice && (m.pricing?.output ?? Infinity) > req.maxOutputPrice) return false;
+    if (req.openWeights && !m.open_weights) return false;
+    if (req.provider && m.provider !== req.provider) return false;
+    return true;
+  });
+}
+
+// Example: Find a cheap vision model with tool calling
+const results = findModels({
+  vision: true,
+  toolCall: true,
+  maxInputPrice: 1,
+  maxOutputPrice: 5,
+});
+```
+
+## Related Documentation
+
+- [API & Programmatic Access](api.md) — npm, CDN, CSV, GitHub Action
+- [Quick Start](quick-start.md) — find the right model in 30 seconds
+- [Data Schema](data-schema.md) — complete YAML schema reference
+- [FAQ](faq.md) — common questions
+- [Glossary](glossary.md) — key terms and definitions
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/code-models.md b/docs/code-models.md
new file mode 100644
index 00000000..05c7828f
--- /dev/null
+++ b/docs/code-models.md
@@ -0,0 +1,61 @@
+**English** | [中文](./zh/code-models.md)
+
+# Code AI Models — 189 Models for Code Generation & Understanding
+
+Models optimized for **code generation, code review, debugging, and software engineering** tasks. All data sourced from first-party APIs via the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Stats
+
+| Metric              | Count |
+| ------------------- | ----- |
+| Code-focused models | 0     |
+| Providers           | 0     |
+| With tool calling   | 0     |
+| With reasoning      | 0     |
+| With vision         | 0     |
+| Free                | 0     |
+| Open weights        | 0     |
+
+## Cheapest Code Models (Direct Providers)
+
+| Model | Provider | Context | Input $/1M | Output $/1M | Reasoning |
+| ----- | -------- | ------- | ---------- | ----------- | --------- |
+
+## Code Models with Reasoning (Best for Complex Tasks)
+
+| Model | Provider | Context | Input $/1M | Output $/1M | Tool Call |
+| ----- | -------- | ------- | ---------- | ----------- | --------- |
+
+## Free Code Models
+
+| Model | Provider | Context | Reasoning | Tool Call |
+| ----- | -------- | ------- | --------- | --------- |
+
+## Largest Context Code Models
+
+| Model | Provider | Context | Input $/1M | Output $/1M |
+| ----- | -------- | ------- | ---------- | ----------- |
+
+## Choosing a Code Model
+
+| Use Case     | Recommended                | Why                   |
+| ------------ | -------------------------- | --------------------- |
+| Autocomplete | Qwen2.5-Coder, DeepSeek V3 | Fast, cheap           |
+| Code review  | Claude Sonnet 4, GPT-4.1   | Reasoning + tool call |
+| Bug fixing   | DeepSeek R1, Claude Opus 4 | Deep reasoning        |
+| Refactoring  | Gemini 2.5 Pro             | Large context         |
+| Code agents  | Claude Sonnet 4, GPT-4.1   | Tool call + reasoning |
+| Self-hosted  | Qwen2.5-Coder, Llama 4     | Open weights          |
+
+## Related Documentation
+
+- [Reasoning Models](reasoning-models.md) — 1,306 models with chain-of-thought
+- [Tool Calling Models](tool-calling.md) — 2,350 models with function calling
+- [Agentic Models](agentic-models.md) — 1,080 models for AI agents
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4 alternatives
+- [Free AI Models](free-models.md) — 81 models at zero cost
+- [Open-Weight Models](open-weights.md) — 527 models with open weights
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/context-windows.md b/docs/context-windows.md
new file mode 100644
index 00000000..83f50239
--- /dev/null
+++ b/docs/context-windows.md
@@ -0,0 +1,77 @@
+**English** | [中文](./zh/context-windows.md)
+
+# Context Window Comparison
+
+Which models have the largest context windows? This page lists models by context window size and pricing.
+
+> For the full list, download [models.json](https://github.com/i-need-token/ai-models/releases/latest) or browse `providers/`.
+
+## Context Window Distribution
+
+| Tier             | Models | Description                                                |
+| ---------------- | -----: | ---------------------------------------------------------- |
+| 1M+ tokens       |    391 | Can process entire books, codebases, or long conversations |
+| 256K–1M tokens   |    459 | Large documents, multi-turn conversations                  |
+| 128K–256K tokens |  1,310 | Standard long-context, most modern models                  |
+| 32K–128K tokens  |    194 | Medium-length documents                                    |
+| 8K–32K tokens    |     97 | Short documents, single-turn queries                       |
+| <8K tokens       |     19 | Legacy models, very short inputs                           |
+
+## Largest Context Windows (1M+ tokens)
+
+| Model                         | Provider      | Context | Input $/1M | Output $/1M | Tool Call | Reasoning |
+| ----------------------------- | ------------- | ------- | ---------: | ----------: | --------- | --------- |
+| Llama 4 Scout                 | Meta          | 10M     |          — |           — | ✅        | ❌        |
+| Llama 4 Scout                 | OpenRouter    | 10M     |      $0.08 |       $0.30 | ✅        | ❌        |
+| Gemini 3 Pro Preview          | Google        | 2M      |      $2.00 |      $12.00 | ✅        | ❌        |
+| Gemini 3.1 Flash Lite Preview | Google        | 2M      |      $0.25 |       $1.50 | ✅        | ❌        |
+| Gemini 3.1 Pro Preview        | Google        | 2M      |      $2.00 |      $12.00 | ✅        | ❌        |
+| Grok 4 Fast Reasoning         | xAI           | 2M      |      $0.20 |       $0.50 | ✅        | ✅        |
+| GPT-4.1                       | OpenAI        | ~1M     |      $2.00 |       $8.00 | ✅        | ❌        |
+| Gemini 2.5 Pro                | Google        | 1M      |      $1.25 |      $10.00 | ✅        | ✅        |
+| Gemini 2.5 Flash              | Google        | 1M      |      $0.15 |       $0.60 | ✅        | ✅        |
+| Llama 4 Maverick              | Meta          | 1M      |          — |           — | ✅        | ❌        |
+| Qwen3-235B-A22B               | Alibaba Cloud | 128K\*  |      ¥1.00 |       ¥4.00 | ✅        | ✅        |
+| DeepSeek-V3                   | DeepSeek      | 128K    |      $0.27 |       $1.10 | ✅        | ❌        |
+
+\*Note: Some models have different context limits on different platforms. Check the specific provider's YAML file for exact values.
+
+## Best Value per Context Tier
+
+### 1M+ tokens (cheapest)
+
+| Model            | Provider    |         Input $/1M | Output $/1M |
+| ---------------- | ----------- | -----------------: | ----------: |
+| Llama 4 Scout    | OpenRouter  |              $0.08 |       $0.30 |
+| Gemini 2.5 Flash | Google      |              $0.15 |       $0.60 |
+| Llama 4 Scout    | Together AI |              $0.15 |       $0.60 |
+| Llama 4 Scout    | Meta        | Free (open-weight) |           — |
+
+### 128K–256K tokens (cheapest)
+
+| Model         | Provider      | Input $/1M | Output $/1M |
+| ------------- | ------------- | ---------: | ----------: |
+| DeepSeek-V3   | DeepSeek      |      $0.27 |       $1.10 |
+| Qwen3-30B-A3B | Alibaba Cloud |      ¥0.10 |       ¥0.30 |
+| Phi-4         | Microsoft     |      $0.10 |       $0.40 |
+| Gemma 3 27B   | Google        |      $0.20 |       $0.80 |
+
+## Key Takeaways
+
+- **Llama 4 Scout** has the largest context window at **10M tokens** — 10x more than any other model
+- **1M+ context** is now available from 6+ providers, including free open-weight models
+- **128K context** is the most common tier (1,310 models) — sufficient for most use cases
+- **Cost scales with context**: 1M+ context models cost 2–10x more per token than 128K models
+- **Cache read pricing** can reduce costs significantly for repeated queries (up to 90% discount)
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — large context model recommendations
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing across providers
+- [Free AI Models](free-models.md) — 81 free models by context window
+- [Vision Models](vision-models.md) — 1,487 vision models with context info
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/data-acquisition.md b/docs/data-acquisition.md
index 1cb80259..28a8ca6a 100644
--- a/docs/data-acquisition.md
+++ b/docs/data-acquisition.md
@@ -256,3 +256,15 @@ Providers that host and serve models produced by others. They are added **after
 2. Updates the YAML file directly
 3. Sets `last_updated` to current date
 4. Validates with `npm run validate`
+
+## Related Documentation
+
+- [Data Schema](data-schema.md) — complete YAML schema reference
+- [Design Principles](lessons-learned.md) — lessons learned
+- [Provider Overview](providers.md) — all 95 providers
+- [FAQ](faq.md) — common questions
+- [Contributing](https://github.com/i-need-token/ai-models/blob/main/CONTRIBUTING.md) — how to contribute
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/data-schema.md b/docs/data-schema.md
new file mode 100644
index 00000000..0fb1dc0d
--- /dev/null
+++ b/docs/data-schema.md
@@ -0,0 +1,221 @@
+**English** | [中文](./zh/data-schema.md)
+
+# Data Schema Reference
+
+Complete reference for the YAML data schema used in this catalog. All model data files conform to the TypeScript types in [`types/`](../types/) and are validated at runtime by Zod schemas in [`types/schemas.ts`](../types/schemas.ts).
+
+## Model Schema
+
+Every model is a single YAML file at `providers/<provider>/models/<model-id>.yaml`.
+
+### Required Fields
+
+| Field          | Type    | Description                              | Example                                    |
+| -------------- | ------- | ---------------------------------------- | ------------------------------------------ |
+| `id`           | string  | Stable model ID (no date suffix)         | `gpt-4o`, `claude-sonnet-4-5`              |
+| `name`         | string  | Display name                             | `GPT-4o`, `Claude Sonnet 4.5`              |
+| `family`       | string  | Model family (broad lineage)             | `gpt-4o`, `claude-sonnet`                  |
+| `pricing`      | Pricing | Model pricing (see below)                | —                                          |
+| `modalities`   | object  | Input/output modalities                  | `{ input: [text, image], output: [text] }` |
+| `last_updated` | string  | Last data update (YYYY-MM-DD or YYYY-MM) | `2024-08-06`                               |
+
+### Optional Fields
+
+| Field               | Type    | Default | Description                      | Example                              |
+| ------------------- | ------- | ------- | -------------------------------- | ------------------------------------ |
+| `reasoning`         | boolean | `false` | Supports reasoning/thinking mode | `true`                               |
+| `temperature`       | boolean | `true`  | Supports temperature parameter   | `false`                              |
+| `tool_call`         | boolean | `false` | Supports tool/function calling   | `true`                               |
+| `attachment`        | boolean | `false` | Supports file attachments        | `true`                               |
+| `structured_output` | boolean | `false` | Supports structured/JSON output  | `true`                               |
+| `open_weights`      | boolean | `false` | Open-weight model                | `true`                               |
+| `deprecated`        | boolean | `false` | Deprecated but still accessible  | `true`                               |
+| `limit`             | object  | —       | Token limits                     | `{ context: 128000, output: 16384 }` |
+| `limit.context`     | number  | —       | Context window size (tokens)     | `128000`                             |
+| `limit.output`      | number  | —       | Max output tokens                | `16384`                              |
+| `knowledge`         | string  | —       | Training data cutoff             | `2023-10`                            |
+| `release_date`      | string  | —       | Model release date               | `2024-05-13`                         |
+| `snapshots`         | array   | —       | Dated model versions             | See below                            |
+
+### Modality Types
+
+| Modality | Description           |
+| -------- | --------------------- |
+| `text`   | Text input or output  |
+| `image`  | Image input or output |
+| `video`  | Video input           |
+| `audio`  | Audio input or output |
+| `pdf`    | PDF document input    |
+
+## Pricing Schema
+
+Pricing is a union of four types. Each model uses exactly one.
+
+### TokenPricing (most common)
+
+Per-million-token pricing. Currency defaults to USD, unit defaults to `per_mtok`.
+
+```yaml
+pricing:
+  currency: USD # optional, defaults to USD
+  unit: per_mtok # optional, defaults to per_mtok
+  input: 2.5 # $/M input tokens
+  output: 10 # $/M output tokens
+  cache_write: 1.25 # optional, $/M cache write
+  cache_read: 0.625 # optional, $/M cache read
+```
+
+**Advanced: Tiered pricing by context length**
+
+```yaml
+pricing:
+  input:
+    - up_to: 128000 # ≤ 128K context
+      price: 2.5
+    - price: 5.0 # > 128K context (no up_to = final tier)
+  output: 10
+```
+
+**Advanced: Per-modality pricing**
+
+```yaml
+pricing:
+  input:
+    text: 1.25
+    image: 2.5
+    audio: 5.0
+  output:
+    text: 5.0
+    audio: 10.0
+```
+
+### VideoPricing
+
+Per-second pricing, optionally tiered by resolution.
+
+```yaml
+pricing:
+  currency: USD
+  unit: per_second
+  price: 0.03 # fixed price per second
+```
+
+```yaml
+pricing:
+  unit: per_second
+  price: # per-resolution pricing
+    720p: 0.02
+    1080p: 0.03
+    4k: 0.05
+```
+
+### UnitPricing
+
+Per-image or per-request pricing.
+
+```yaml
+pricing:
+  unit: per_image
+  price: 0.04
+```
+
+```yaml
+pricing:
+  unit: per_request
+  price: 0.005
+```
+
+### FreePricing
+
+No cost.
+
+```yaml
+pricing:
+  unit: free
+```
+
+## Snapshot Schema
+
+Snapshots represent dated versions of a model. They inherit all parent fields and only override what differs.
+
+```yaml
+id: gpt-4o
+name: GPT-4o
+# ... parent fields ...
+snapshots:
+  - id: gpt-4o-2024-08-06 # newest first
+    last_updated: "2024-08-06"
+  - id: gpt-4o-2024-05-13
+    deprecated: true # this snapshot is deprecated
+    last_updated: "2024-05-13"
+```
+
+A snapshot can override any optional field from the parent:
+
+```yaml
+snapshots:
+  - id: gemini-2.0-flash-exp
+    limit:
+      context: 1048576 # different context window
+      output: 8192
+    pricing:
+      unit: free # experimental = free
+```
+
+## Provider Schema
+
+Each provider has a `provider.yaml` file at `providers/<id>/provider.yaml`.
+
+| Field            | Type   | Required | Description                          | Example                            |
+| ---------------- | ------ | -------- | ------------------------------------ | ---------------------------------- |
+| `id`             | string | ✅       | Provider ID (matches directory name) | `openai`                           |
+| `name`           | string | ✅       | Display name                         | `OpenAI`                           |
+| `url`            | string | ✅       | Official website URL                 | `https://openai.com`               |
+| `api_docs`       | string | ❌       | API documentation URL                | `https://platform.openai.com/docs` |
+| `apis`           | object | ✅       | API endpoints keyed by format        | See below                          |
+| `apis.openai`    | string | ❌       | OpenAI-compatible API endpoint       | `https://api.openai.com/v1`        |
+| `apis.anthropic` | string | ❌       | Anthropic API endpoint               | —                                  |
+| `apis.google`    | string | ❌       | Google AI API endpoint               | —                                  |
+| `currency`       | string | ❌       | Default currency (USD/CNY/EUR)       | `USD`                              |
+
+### API Formats
+
+| Format      | Description                            | Used by           |
+| ----------- | -------------------------------------- | ----------------- |
+| `openai`    | OpenAI-compatible chat completions API | Most providers    |
+| `anthropic` | Anthropic Messages API                 | Anthropic         |
+| `google`    | Google Generative AI API               | Google, Vertex AI |
+
+## Currency Reference
+
+| Currency     | Code  | Used by                                      |
+| ------------ | ----- | -------------------------------------------- |
+| US Dollar    | `USD` | Most providers (default)                     |
+| Chinese Yuan | `CNY` | Alibaba, 302.AI, AIHubMix, PPIO, etc.        |
+| Euro         | `EUR` | Berget, CloudFerro, OVHcloud, Scaleway, etc. |
+
+## Validation
+
+All YAML files are validated against Zod schemas at runtime:
+
+```bash
+# Validate all model data
+npx tsx scripts/validate.ts
+
+# Validate a specific provider
+npx tsx scripts/validate.ts openai
+```
+
+The validation uses `ModelSchema` from [`types/schemas.ts`](../types/schemas.ts), which mirrors the TypeScript types exactly. Any YAML file that doesn't conform to the schema will produce a validation error with the specific field path and issue.
+
+## Related Documentation
+
+- [Data Acquisition](data-acquisition.md) — how we acquire and update data
+- [API & Programmatic Access](api.md) — npm, CDN, CSV access
+- [Code Examples](code-examples.md) — practical code examples
+- [Design Principles](lessons-learned.md) — lessons learned
+- [FAQ](faq.md) — common questions
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/embedding-models.md b/docs/embedding-models.md
new file mode 100644
index 00000000..bce44d64
--- /dev/null
+++ b/docs/embedding-models.md
@@ -0,0 +1,71 @@
+# Embedding Models
+
+[中文](zh/embedding-models.md)
+
+AI models that generate **vector embeddings** — numerical representations of text, images, and other data. Essential for semantic search, RAG (Retrieval-Augmented Generation), clustering, and similarity tasks.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Embedding Models Matter
+
+Embedding models are the foundation of many AI systems:
+
+- **Semantic Search** — find relevant documents by meaning, not keywords
+- **RAG** — retrieve context for LLMs to generate grounded answers
+- **Clustering** — group similar items together
+- **Similarity** — find duplicates, recommendations, and related content
+- **Classification** — zero-shot and few-shot classification via embeddings
+
+## Stats
+
+| Metric                       | Count |
+| ---------------------------- | ----- |
+| Embedding models             | 5     |
+| Providers                    | 3     |
+| Free embedding models        | 0     |
+| Open-weight embedding models | 1     |
+
+## Providers
+
+`openai`, `tencent`, `upstage`
+
+## Free Embedding Models
+
+Free embedding models — zero-cost semantic search and RAG.
+
+| Model | Provider | Context | Input $/M |
+| ----- | -------- | ------- | --------- |
+
+## Cheapest Embedding Models
+
+Best value embedding models for production.
+
+| Model                   | Provider | Context | Input $/M |
+| ----------------------- | -------- | ------- | --------- | --- |
+| text-embedding-3-small  | openai   | 8K      | $0.02     |     |
+| solar-embedding-1-large | upstage  | 0       | $0.1      | 🔓  |
+| text-embedding-ada-002  | openai   | 8K      | $0.1      |     |
+| text-embedding-3-large  | openai   | 8K      | $0.13     |     |
+| hunyuan-embedding       | tencent  | 0       | $0.7      |     |
+
+## Largest Context Embedding Models
+
+Embedding models with the largest context windows — for embedding long documents.
+
+| Model                  | Provider | Context | Input $/M |
+| ---------------------- | -------- | ------- | --------- | --- |
+| text-embedding-ada-002 | openai   | 8K      | $0.1      |     |
+| text-embedding-3-small | openai   | 8K      | $0.02     |     |
+| text-embedding-3-large | openai   | 8K      | $0.13     |     |
+
+## Related Documentation
+
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Open Weights](open-weights.md) — 527 open-weight models
+- [Model Selection Guide](model-selection.md) — decision framework
+- [API Reference](api.md) — programmatic access
+- [Quick Start](quick-start.md) — get started in 5 minutes
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/faq.md b/docs/faq.md
new file mode 100644
index 00000000..52535794
--- /dev/null
+++ b/docs/faq.md
@@ -0,0 +1,114 @@
+# Frequently Asked Questions
+
+[中文](zh/faq.md)
+
+## General
+
+### What is AI Models Catalog?
+
+AI Models Catalog is a structured YAML catalog of AI model metadata from 95+ providers. It includes pricing, context windows, modalities, capabilities, and more — all sourced from first-party APIs and official documentation.
+
+### How is this different from other model directories?
+
+- **First-party data only** — all data comes directly from provider APIs and official docs, not third-party aggregators
+- **Structured YAML** — machine-readable with TypeScript types and Zod validation
+- **Comprehensive metadata** — pricing, context windows, modalities, capabilities, snapshots
+- **Programmatic access** — npm package, CDN, GitHub Action, CSV export
+- **Open source** — community-driven with automated scraping
+
+### How often is the data updated?
+
+Data is synced weekly via automated CI workflows. Provider APIs are scraped on a Monday cron schedule, and the npm package is automatically published when new releases are created.
+
+## Access & Usage
+
+### How do I get the data?
+
+There are several ways:
+
+| Method                                                                                | Use Case                       |
+| ------------------------------------------------------------------------------------- | ------------------------------ |
+| `npm install ai-models`                                                               | TypeScript/JavaScript projects |
+| `curl https://github.com/i-need-token/ai-models/releases/latest/download/models.json` | Quick access from any language |
+| GitHub Action                                                                         | CI/CD pipelines                |
+| CSV download                                                                          | Excel, data analysis           |
+| Hugging Face dataset                                                                  | ML workflows                   |
+
+See [Quick Start](quick-start.md) for detailed instructions.
+
+### Is the data free to use?
+
+Yes! The catalog data is released under the MIT License. You can use it in commercial and non-commercial projects without restriction.
+
+### How accurate is the pricing data?
+
+Pricing data is sourced directly from each provider's official API and documentation. However, providers may change pricing without notice. Always verify critical pricing decisions against the provider's own website.
+
+## Technical
+
+### Why YAML instead of JSON?
+
+YAML supports comments, is more human-readable for manual editing, and allows snapshot inheritance within a model file. The data is compiled to JSON for programmatic consumption.
+
+### What is snapshot inheritance?
+
+Within a single model file, snapshots inherit fields from their parent model and only override what differs. This keeps model files DRY without cross-model inheritance.
+
+### How do I validate my YAML files?
+
+```bash
+# Using the built-in validator
+npx tsx scripts/validate.ts
+
+# Using the JSON Schema
+npx ajv validate -s schema.json -d providers/openai/models/gpt-4o.yaml
+```
+
+### Can I use this in my CI/CD pipeline?
+
+Yes! Use the reusable GitHub Action:
+
+```yaml
+- uses: i-need-token/ai-models@v1
+  with:
+    format: json
+    filter: "[?tool_call && open_weights]"
+```
+
+See [API Documentation](api.md) for details.
+
+## Contributing
+
+### How do I add a new provider?
+
+See [Contributing Guide](https://github.com/i-need-token/ai-models/blob/main/CONTRIBUTING.md) for step-by-step instructions. In short:
+
+1. Create `providers/<id>/provider.yaml`
+2. Create `providers/<id>/scrape.ts` with a `scrape()` function
+3. Run `npx tsx scripts/validate.ts` to verify
+
+### How do I report incorrect data?
+
+Open a [Data Update issue](https://github.com/i-need-token/ai-models/issues/new?template=data_update.md) with the provider name, model ID, and what needs correcting.
+
+### Can I help without writing code?
+
+Absolutely! You can:
+
+- ⭐ Star the repo to help others discover it
+- 📢 Share it with your network
+- 🐛 Report data issues or bugs
+- 📖 Improve documentation
+- 🏷️ Suggest new providers to add
+
+---
+
+More questions? [Open an issue](https://github.com/i-need-token/ai-models/issues/new) or start a [discussion](https://github.com/i-need-token/ai-models/discussions).
+
+## Related Documentation
+
+- [Quick Start](quick-start.md) — find the right model in 30 seconds
+- [API & Programmatic Access](api.md) — npm, CDN, CSV access
+- [Glossary](glossary.md) — key terms and definitions
+- [Data Schema](data-schema.md) — complete YAML schema
+- [Model Selection Guide](model-selection.md) — decision framework
diff --git a/docs/free-models.md b/docs/free-models.md
new file mode 100644
index 00000000..c69b1131
--- /dev/null
+++ b/docs/free-models.md
@@ -0,0 +1,124 @@
+**English** | [中文](./zh/free-models.md)
+
+# Free AI Models
+
+81 models in this catalog are free to use. This page lists them by capability so you can find the right free model for your project.
+
+> All data sourced from first-party APIs and documentation. Free tiers may have rate limits — check the provider's website for details.
+
+## Quick Stats
+
+| Capability                | Free Models |
+| ------------------------- | ----------: |
+| Total free models         |          81 |
+| With tool calling         |          45 |
+| With reasoning            |          11 |
+| With vision (image input) |          17 |
+
+## Free Models with Tool Calling
+
+These models support function/tool calling at no cost — ideal for building AI agents and automation:
+
+| Model                          | Provider | Context | Vision |
+| ------------------------------ | -------- | ------- | ------ |
+| gemini-2.0-flash               | Google   | 1M      | ✅     |
+| gemini-2.5-flash-preview-05-20 | Google   | 1M      | ✅     |
+| gemma-3-27b-it                 | Chutes   | 128K    | ✅     |
+| qwen3-235b-a22b                | Chutes   | 128K    | ✅     |
+| qwen3-30b-a3b                  | Chutes   | 128K    | ✅     |
+| qwen3-4b                       | Chutes   | 128K    | ✅     |
+| deepseek-r1                    | Chutes   | 128K    | ❌     |
+| deepseek-v3-0324               | Chutes   | 128K    | ❌     |
+| llama-4-maverick               | Chutes   | 1M      | ✅     |
+| llama-4-scout                  | Chutes   | 10M     | ✅     |
+| llama-3.3-70b-instruct         | Chutes   | 128K    | ❌     |
+| qwen2.5-72b-instruct           | Chutes   | 128K    | ❌     |
+| mistral-small-3.1-24b-instruct | Chutes   | 128K    | ✅     |
+| phi-4                          | Chutes   | 16K     | ❌     |
+| command-r                      | Chutes   | 128K    | ❌     |
+
+## Free Models with Reasoning
+
+These models support chain-of-thought reasoning at no cost:
+
+| Model                          | Provider | Context |
+| ------------------------------ | -------- | ------- |
+| gemini-2.5-flash-preview-05-20 | Google   | 1M      |
+| deepseek-r1                    | Chutes   | 128K    |
+| deepseek-r1-0528               | Chutes   | 128K    |
+| qwen3-235b-a22b                | Chutes   | 128K    |
+| qwen3-30b-a3b                  | Chutes   | 128K    |
+| qwen3-4b                       | Chutes   | 128K    |
+| gemma-3-27b-it                 | Chutes   | 128K    |
+| phi-4-reasoning                | Chutes   | 32K     |
+
+## Free Models with Vision
+
+These models accept image input at no cost:
+
+| Model                          | Provider | Context |
+| ------------------------------ | -------- | ------- |
+| gemini-2.0-flash               | Google   | 1M      |
+| gemini-2.5-flash-preview-05-20 | Google   | 1M      |
+| gemma-3-27b-it                 | Chutes   | 128K    |
+| qwen3-235b-a22b                | Chutes   | 128K    |
+| llama-4-maverick               | Chutes   | 1M      |
+| llama-4-scout                  | Chutes   | 10M     |
+| mistral-small-3.1-24b-instruct | Chutes   | 128K    |
+
+## Free Models by Provider
+
+### Google (via AI Studio)
+
+Google offers free access to Gemini models through AI Studio with rate limits:
+
+- gemini-2.0-flash — 1M context, tool calling, vision, reasoning
+- gemini-2.5-flash-preview-05-20 — 1M context, tool calling, vision, reasoning
+
+### Chutes
+
+Chutes provides free community-hosted inference for open-weight models:
+
+- 70+ free models including Llama 4, Qwen3, DeepSeek-R1, Gemma 3, Mistral, Phi-4
+- Largest free model: Llama 4 Scout (10M context)
+- Best free reasoning: DeepSeek-R1, Qwen3-235B-A22B
+
+### Cloudflare Workers AI
+
+Cloudflare offers free inference on edge for select models:
+
+- Various small and medium models with rate limits
+- Edge deployment for low latency
+
+### Cerebras
+
+Cerebras offers free tier for some models with rate limits:
+
+- Fast inference using CS-3 wafer-scale engine
+
+### Groq
+
+Groq offers free tier for some models with rate limits:
+
+- Ultra-fast inference using LPU acceleration
+
+## Key Takeaways
+
+- **Google AI Studio** offers the best free models overall — 1M context, tool calling, vision, and reasoning
+- **Chutes** has the largest selection of free models — 70+ including all major open-weight models
+- **Llama 4 Scout** on Chutes offers the largest free context window at 10M tokens
+- Free tiers typically have rate limits (requests per minute) — check provider docs for specifics
+- For production use, consider upgrading to paid tiers for reliability and higher rate limits
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Open-Weight Models](open-weights.md) — 527 models you can run yourself
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+- [Tool Calling Models](tool-calling.md) — 2,350 models with tool calling
+- [Reasoning Models](reasoning-models.md) — 1,306 models with reasoning
+- [OpenAI Alternatives](openai-alternatives.md) — free GPT-4 alternatives
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/glossary.md b/docs/glossary.md
new file mode 100644
index 00000000..e830f4f0
--- /dev/null
+++ b/docs/glossary.md
@@ -0,0 +1,83 @@
+# Glossary
+
+[中文](zh/glossary.md)
+
+A quick reference for terms used throughout the AI Models Catalog.
+
+## Model Properties
+
+| Term           | Definition                                                                                                                                    |
+| -------------- | --------------------------------------------------------------------------------------------------------------------------------------------- |
+| **Model ID**   | The stable, unique identifier for a model (e.g., `gpt-4.1`, `claude-sonnet-4`). No date suffix, no aliases.                                   |
+| **Family**     | A group of related models sharing the same architecture or brand (e.g., `gpt-4.1` family includes `gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`). |
+| **Snapshot**   | A dated version of a model, nested within the parent model file. Inherits all parent fields and only overrides what differs.                  |
+| **Deprecated** | A model still listed in the provider's API but no longer recommended for new projects. Marked with `deprecated: true`.                        |
+| **Retired**    | A model completely removed from the provider's API. Excluded from the catalog.                                                                |
+
+## Capabilities
+
+| Term                  | Definition                                                                                                                                                             |
+| --------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------- |
+| **Tool calling**      | The model can invoke external tools/functions during generation (e.g., web search, calculator, API calls). Also known as "function calling".                           |
+| **Structured output** | The model can generate responses in a specific format (typically JSON) conforming to a provided schema. Also known as "JSON mode".                                     |
+| **Reasoning**         | The model uses chain-of-thought or extended thinking to solve complex problems step-by-step before producing a final answer.                                           |
+| **Open weights**      | The model's weights are publicly available, allowing you to run it on your own infrastructure. Not all open-weight models are truly "open source" — check the license. |
+
+## Modalities
+
+| Term                     | Definition                                                                                       |
+| ------------------------ | ------------------------------------------------------------------------------------------------ |
+| **Text input**           | The model accepts text prompts as input.                                                         |
+| **Text output**          | The model generates text as output.                                                              |
+| **Image input (Vision)** | The model can process images as part of the input. Also known as "vision" or "multimodal input". |
+| **Image output**         | The model can generate images (e.g., DALL·E, Imagen). Also known as "image generation".          |
+| **Audio input**          | The model can process audio files or speech as input.                                            |
+| **Audio output**         | The model can generate audio or speech as output (e.g., TTS models).                             |
+| **Video input**          | The model can process video files as input.                                                      |
+| **Video output**         | The model can generate video as output.                                                          |
+| **Embedding output**     | The model produces vector embeddings rather than text, used for similarity search and retrieval. |
+
+## Pricing
+
+| Term                  | Definition                                                                                                 |
+| --------------------- | ---------------------------------------------------------------------------------------------------------- |
+| **Input price**       | Cost per million input tokens, in USD (or CNY/EUR for some providers).                                     |
+| **Output price**      | Cost per million output tokens, in USD (or CNY/EUR for some providers).                                    |
+| **Cache read price**  | Discounted price for reading from a previously cached prompt. Typically 50-90% cheaper than regular input. |
+| **Cache write price** | Price for writing a prompt to the provider's cache. Some providers charge this separately.                 |
+| **Free**              | The model has zero cost for both input and output tokens. May have rate limits.                            |
+| **Token**             | A unit of text processing. Approximately 4 characters or 0.75 words in English.                            |
+
+## Context & Limits
+
+| Term               | Definition                                                                                                                            |
+| ------------------ | ------------------------------------------------------------------------------------------------------------------------------------- |
+| **Context window** | Maximum number of tokens the model can process in a single request (input + output combined in some providers, input-only in others). |
+| **Output limit**   | Maximum number of tokens the model can generate in a single response.                                                                 |
+| **Rate limit**     | Maximum number of requests or tokens per minute/hour, set by the provider. Not included in the catalog (check provider docs).         |
+
+## Data & Architecture
+
+| Term                     | Definition                                                                                                                          |
+| ------------------------ | ----------------------------------------------------------------------------------------------------------------------------------- |
+| **YAML**                 | The source format for all model data. Human-readable, supports comments, and allows snapshot inheritance.                           |
+| **Snapshot inheritance** | Within a model file, snapshots inherit all fields from the parent model and only override what differs. No cross-model inheritance. |
+| **First-party data**     | Data sourced directly from the provider's own API or official documentation, never from third-party aggregators.                    |
+| **Zod schema**           | Runtime validation schema used to ensure all YAML model files conform to the expected structure.                                    |
+| **models.json**          | The compiled JSON output containing all models, generated from YAML source files. Available via npm, CDN, and GitHub Releases.      |
+
+---
+
+See [Data Schema Reference](data-schema.md) for the complete YAML field specification.
+
+## Related Documentation
+
+- [FAQ](faq.md) — common questions
+- [Data Schema](data-schema.md) — complete YAML schema reference
+- [Quick Start](quick-start.md) — find the right model in 30 seconds
+- [Model Comparison](model-comparison.md) — compare models
+- [Modality Matrix](modality-matrix.md) — all modalities at a glance
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/image-generation.md b/docs/image-generation.md
new file mode 100644
index 00000000..a50cbbfc
--- /dev/null
+++ b/docs/image-generation.md
@@ -0,0 +1,70 @@
+**English** | [中文](./zh/image-generation.md)
+
+# AI Image Generation Models
+
+28 models in this catalog can generate images (image output modality). This page covers text-to-image, image editing, and multimodal generation models.
+
+> All data sourced from first-party APIs and documentation. "Image output" means the model generates images as part of its response.
+
+## Quick Stats
+
+| Capability                    | Image Gen Models |
+| ----------------------------- | ---------------: |
+| Total image generation models |               28 |
+| Unique model IDs              |               19 |
+| With reasoning                |                5 |
+| With tool calling             |                1 |
+| Free to use                   |                9 |
+
+## All Image Generation Models
+
+| Model                          | Input                     | Output $/1M | Context | Reasoning | Free Tier |
+| ------------------------------ | ------------------------- | ----------: | ------- | --------- | --------- |
+| DALL·E 3                       | text                      |           — | —       | ❌        | ✅        |
+| Imagen 4.0 Fast                | text, image               |           — | —       | ❌        | ✅        |
+| Imagen 4.0                     | text, image               |           — | —       | ❌        | ✅        |
+| Image 01                       | text, image               |           — | —       | ❌        | ✅        |
+| Image 01 Live                  | text, image               |           — | —       | ❌        | ✅        |
+| Step 1X Edit                   | text, image               |           — | —       | ❌        | ✅        |
+| Step 1X Medium                 | text, image               |           — | —       | ❌        | ✅        |
+| Step 2X Large                  | text, image               |           — | —       | ❌        | ✅        |
+| Step Image Edit 2              | text, image               |           — | —       | ❌        | ✅        |
+| Gemini 2.5 Flash Image         | text, image               |      $0.039 | 33K     | ❌        | ❌        |
+| Gemini 3.1 Flash Image Preview | text, image               |       $1.50 | 66K     | ✅        | ❌        |
+| Gemini 3 Pro Image Preview     | text, image               |      $12.00 | 131K    | ✅        | ❌        |
+| GPT-5 Image Mini               | text, image, PDF          |       $2.00 | 400K    | ✅        | ❌        |
+| GPT-5 Image                    | text, image, PDF          |      $10.00 | 400K    | ✅        | ❌        |
+| GPT-5.4 Image 2                | text, image, PDF          |      $15.00 | 272K    | ✅        | ❌        |
+| Amazon Nova 2.0 Omni           | text, image, audio, video |       $1.30 | 64K     | ✅        | ❌        |
+
+## Best Value Image Generation
+
+| Use Case                           | Best Model                          | Why                                     |
+| ---------------------------------- | ----------------------------------- | --------------------------------------- |
+| **Free text-to-image**             | DALL·E 3, Imagen 4.0                | Zero cost, high quality                 |
+| **Free image editing**             | Step 1X Edit, Step Image Edit 2     | Edit existing images at no cost         |
+| **Cheapest API**                   | Gemini 2.5 Flash Image              | $0.039/1M output tokens                 |
+| **Best quality**                   | GPT-5.4 Image 2, Gemini 3 Pro Image | State-of-the-art generation             |
+| **Multimodal (audio+video+image)** | Amazon Nova 2.0 Omni                | Only model with all modalities          |
+| **Large context**                  | GPT-5 Image Mini                    | 400K context for complex prompts        |
+| **Reasoning + generation**         | GPT-5 Image Mini                    | $2.50/1M input, 400K context, reasoning |
+
+## Key Takeaways
+
+- **9 free image generation models** — DALL·E 3, Imagen 4.0, Step models, and more
+- **Gemini 2.5 Flash Image** is the cheapest API option at $0.039/1M output tokens
+- **GPT-5 Image Mini** offers the best combination of reasoning + generation + large context
+- **Amazon Nova 2.0 Omni** is the only model that generates images from audio and video input
+- Most image generation models accept both text and image input (for editing/reference)
+
+## Related Documentation
+
+- [Vision Models](vision-models.md) — 1,487 vision models
+- [Video Models](video-models.md) — 167 video input/output models
+- [Modality Matrix](modality-matrix.md) — all modalities at a glance
+- [Model Selection Guide](model-selection.md) — decision framework
+- [Free AI Models](free-models.md) — 81 free models
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/images/actions-demo.png b/docs/images/actions-demo.png
new file mode 100644
index 00000000..e068fd8e
Binary files /dev/null and b/docs/images/actions-demo.png differ
diff --git a/docs/images/ai-models-landscape.png b/docs/images/ai-models-landscape.png
new file mode 100644
index 00000000..4e182cca
Binary files /dev/null and b/docs/images/ai-models-landscape.png differ
diff --git a/docs/images/calculator-screenshot.png b/docs/images/calculator-screenshot.png
new file mode 100644
index 00000000..de1afc20
Binary files /dev/null and b/docs/images/calculator-screenshot.png differ
diff --git a/docs/images/catalog-dark.png b/docs/images/catalog-dark.png
new file mode 100644
index 00000000..f035da69
Binary files /dev/null and b/docs/images/catalog-dark.png differ
diff --git a/docs/images/catalog-demo.gif b/docs/images/catalog-demo.gif
new file mode 100644
index 00000000..832ffd88
Binary files /dev/null and b/docs/images/catalog-demo.gif differ
diff --git a/docs/images/catalog-light.png b/docs/images/catalog-light.png
new file mode 100644
index 00000000..9a6a5f0a
Binary files /dev/null and b/docs/images/catalog-light.png differ
diff --git a/docs/images/catalog-screenshot.png b/docs/images/catalog-screenshot.png
new file mode 100644
index 00000000..de1afc20
Binary files /dev/null and b/docs/images/catalog-screenshot.png differ
diff --git a/docs/images/picker-screenshot.png b/docs/images/picker-screenshot.png
new file mode 100644
index 00000000..77e7f31b
Binary files /dev/null and b/docs/images/picker-screenshot.png differ
diff --git a/docs/large-context-models.md b/docs/large-context-models.md
new file mode 100644
index 00000000..c45dc882
--- /dev/null
+++ b/docs/large-context-models.md
@@ -0,0 +1,112 @@
+# Large Context Models
+
+[中文](zh/large-context-models.md)
+
+AI models with **128K+ token context windows** — process entire codebases, long documents, and multi-hour conversations in a single request.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Large Context Matters
+
+Large context windows unlock capabilities impossible with smaller models:
+
+- **Full codebase analysis** — understand entire repositories in one prompt
+- **Document processing** — analyze 100+ page PDFs without chunking
+- **Multi-turn conversations** — maintain context across long chat sessions
+- **Data analysis** — process large datasets in a single request
+- **Legal/medical review** — review lengthy contracts and medical records
+- **Content creation** — maintain consistency across long-form writing
+
+## Stats
+
+| Metric                       | Count |
+| ---------------------------- | ----- |
+| Large context models (128K+) | 2195  |
+| 256K+ context                | 861   |
+| 1M+ context                  | 397   |
+| Providers                    | 78    |
+| Free large context models    | 51    |
+| With tool calling            | 1637  |
+
+## Providers
+
+`302ai`, `ai21`, `aimlapi`, `aion`, `alibaba`, `amazon`, `amazon-bedrock`, `anthropic`, `arcee`, `auriko`, `baichuan`, `baidu`, `baseten`, `bytedance`, `cerebras`, `chutes`, `clarifai`, `cloudferro-sherlock`, `cloudflare`, `databricks`, `deepinfra`, `deepseek`, `digitalocean`, `dinference`, `evroc` and 53 more
+
+## Largest Context Windows
+
+Models with the biggest context windows available.
+
+| Model                          | Provider   | Context | Input $/M | Output $/M | Capabilities |
+| ------------------------------ | ---------- | ------- | --------- | ---------- | ------------ |
+| meta-llama--llama-4-scout      | openrouter | 10M     | $0.08     | $0.3       | 🔧 📋        |
+| meta-llama-4-scout             | meta       | 10M     | $0.17     | $0.66      | 🔧           |
+| gemini-1.5-pro                 | google     | 2M      | $1.25     | $5         | 🔧 📋        |
+| grok-code-fast-1               | jiekou     | 2M      | $0.19     | $0.475     | 🔧           |
+| gpt-4o                         | jiekou     | 2M      | $1.9      | $5.7       | 🔧           |
+| grok-4.20-0309-non-reasoning   | jiekou     | 2M      | $0.19     | $0.475     | 🔧           |
+| grok-4.20-0309-reasoning       | jiekou     | 2M      | $1.9      | $5.7       | 🔧           |
+| grok-4-1-fast-reasoning        | jiekou     | 2M      | $0.19     | $0.475     | 🔧           |
+| grok-4-fast-reasoning          | jiekou     | 2M      | $0.19     | $0.475     | 🔧           |
+| x-ai--grok-4-fast              | fastrouter | 2M      | $0.2      | $0.5       | 🔧           |
+| x-ai--grok-4.1-fast            | fastrouter | 2M      | $0.2      | $0.5       | 🔧           |
+| xai--grok-4-fast-reasoning     | aimlapi    | 2M      | $0.52     | $1.3       | 🔧           |
+| xai--grok-4-fast-non-reasoning | aimlapi    | 2M      | $0.52     | $1.3       | 🔧           |
+| grok-4-20-multi-agent          | venice     | 2M      | $1.42     | $2.83      | 🧠 📋        |
+| grok-4-20                      | venice     | 2M      | $1.42     | $2.83      | 🔧 🧠 📋     |
+
+## Cheapest 1M+ Context Models
+
+Best value models with 1M+ token context — for processing very long inputs.
+
+| Model                             | Provider      | Context | Input $/M | Output $/M | Capabilities |
+| --------------------------------- | ------------- | ------- | --------- | ---------- | ------------ |
+| gemini-1.5-flash-8b               | deepinfra     | 1M      | $0.0375   | $0.15      |              |
+| gpt-5-nano                        | meganova      | 1M      | $0.04     | $0.32      | 🔧           |
+| qwen--qwen3.5-flash-02-23         | openrouter    | 1M      | $0.065    | $0.26      | 🔧 🧠 📋     |
+| google--gemini-2.0-flash-lite-001 | openrouter    | 1M      | $0.075    | $0.3       | 🔧 📋        |
+| google--gemini-2.0-flash-lite-001 | fastrouter    | 1M      | $0.075    | $0.3       | 🔧           |
+| gemini-1.5-flash                  | deepinfra     | 1M      | $0.075    | $0.3       |              |
+| gemini-2.0-flash-lite             | google        | 1M      | $0.075    | $0.3       | 🔧 📋        |
+| gemini-1.5-flash                  | google        | 1M      | $0.075    | $0.3       | 🔧 📋        |
+| gemini-1.5-flash-8b               | google        | 1M      | $0.075    | $0.3       | 🔧 📋        |
+| gemini-2-0-flash-lite             | google-vertex | 1M      | $0.075    | $0.3       | 🔧           |
+
+## Free Large Context Models
+
+Free models with 128K+ context — zero-cost long document processing.
+
+| Model                                    | Provider   | Context | Input $/M | Output $/M | Capabilities |
+| ---------------------------------------- | ---------- | ------- | --------- | ---------- | ------------ |
+| openrouter--owl-alpha                    | openrouter | 1M      | Free      | Free       | 🔧 📋        |
+| deepseek--deepseek-v4-flash--free        | openrouter | 1M      | Free      | Free       | 🔧 🧠        |
+| google--lyria-3-clip-preview             | openrouter | 1M      | Free      | Free       | 📋           |
+| google--lyria-3-pro-preview              | openrouter | 1M      | Free      | Free       | 📋           |
+| qwen--qwen3-coder--free                  | openrouter | 1M      | Free      | Free       | 🔧           |
+| nvidia--nemotron-3-super-120b-a12b--free | openrouter | 1M      | Free      | Free       | 🔧 🧠 📋     |
+| google--gemma-4-26b-a4b-it--free         | openrouter | 262K    | Free      | Free       | 🔧 🧠 📋     |
+| arcee-ai--trinity-large-thinking--free   | openrouter | 262K    | Free      | Free       | 🔧 🧠        |
+| google--gemma-4-31b-it--free             | openrouter | 262K    | Free      | Free       | 🔧 🧠 📋     |
+| gemma-4-26b-a4b-it                       | auriko     | 262K    | Free      | Free       | 🔧 🧠 📋     |
+
+## Context Window Tiers
+
+| Tier     | Context | Use Case                       | Example Models            |
+| -------- | ------- | ------------------------------ | ------------------------- |
+| Standard | 128K    | Long documents, code files     | gpt-4.1, claude-sonnet-4  |
+| Extended | 256K    | Codebases, multi-file analysis | claude-opus-4, o3         |
+| Ultra    | 1M      | Full repositories, books       | gemini-2.5-flash, gpt-4.1 |
+| Massive  | 10M     | Entire datasets, video         | llama-4-scout             |
+
+## Related Documentation
+
+- [Context Windows](context-windows.md) — detailed context window comparison
+- [Chat Models](chat-models.md) — 2,350 models with tool calling
+- [Code Models](code-models.md) — 189 code-focused models
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Model Selection Guide](model-selection.md) — decision framework
+- [Migration Guide](migration-guide.md) — switching providers
+- [Provider Comparison](provider-comparison.md) — top 30 providers
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/lessons-learned.md b/docs/lessons-learned.md
index 1ebea94a..9fe44211 100644
--- a/docs/lessons-learned.md
+++ b/docs/lessons-learned.md
@@ -298,3 +298,15 @@ Platforms like OpenRouter and nano-gpt are router/aggregators that don't produce
 - **nano-gpt**: Public API for model list + JS bundle for per-token USD pricing (555 models).
 
 These are treated as inference platforms, not rejected as "just routers", because they provide verifiable first-party per-token pricing data.
+
+## Related Documentation
+
+- [Data Acquisition](data-acquisition.md) — how we acquire and update data
+- [Data Schema](data-schema.md) — complete YAML schema reference
+- [Provider Overview](providers.md) — all 95 providers
+- [FAQ](faq.md) — common questions
+- [Contributing](https://github.com/i-need-token/ai-models/blob/main/CONTRIBUTING.md) — how to contribute
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/migration-guide.md b/docs/migration-guide.md
new file mode 100644
index 00000000..21f9760b
--- /dev/null
+++ b/docs/migration-guide.md
@@ -0,0 +1,100 @@
+# Migration Guide: Switching AI Model Providers
+
+[中文](zh/migration-guide.md)
+
+A practical guide for switching between AI model providers — compare pricing, capabilities, and context windows to find the best alternative for your use case.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Switch Providers?
+
+- **Cost savings** — some providers offer the same models at 2-10× lower prices
+- **Better capabilities** — newer models may offer tool calling, reasoning, or vision
+- **Larger context** — process more data in a single request
+- **Reliability** — reduce dependency on a single provider
+- **Compliance** — data residency requirements may require specific providers
+
+## Major Provider Comparison
+
+| Provider  | Models | Cheapest Input $/M | Largest Context | Tool Calling | Reasoning |
+| --------- | ------ | -----------------: | --------------- | ------------ | --------- |
+| openai    | 28     |              $0.02 | 1047576         | 18           | 8         |
+| anthropic | 11     |                 $1 | 1000000         | 11           | 11        |
+| google    | 21     |             $0.075 | 2097152         | 8            | 2         |
+| deepseek  | 4      |              $0.14 | 1000000         | 4            | 3         |
+| meta      | 12     |               $0.1 | 10000000        | 9            | 0         |
+| mistral   | 16     |              $0.04 | 256000          | 12           | 1         |
+| xai       | 6      |               $0.2 | 131072          | 6            | 5         |
+| alibaba   | 62     |              $0.15 | 1000000         | 62           | 52        |
+
+## Common Migration Paths
+
+### OpenAI → Cheaper Alternatives
+
+| OpenAI Model         | Cheapest Alternative | Provider  | Input $/M | Savings |
+| -------------------- | -------------------- | --------- | --------- | ------- |
+| gpt-4.1 ($2)         | gpt-4.1-mini         | openai    | $0.40     | 80%     |
+| gpt-4.1-mini ($0.40) | gpt-4.1-nano         | openai    | $0.10     | 75%     |
+| o4-mini ($1.10)      | deepseek-r1          | deepseek  | $0.55     | 50%     |
+| gpt-4.1 ($2)         | claude-haiku-4       | anthropic | $1        | 50%     |
+| gpt-4.1 ($2)         | gemini-2.5-flash     | google    | $0.15     | 93%     |
+
+### Anthropic → Cheaper Alternatives
+
+| Anthropic Model      | Cheapest Alternative | Provider | Input $/M | Savings |
+| -------------------- | -------------------- | -------- | --------- | ------- |
+| claude-opus-4 ($15)  | o4-mini              | openai   | $1.10     | 93%     |
+| claude-sonnet-4 ($3) | gemini-2.5-flash     | google   | $0.15     | 95%     |
+| claude-sonnet-4 ($3) | deepseek-chat        | deepseek | $0.14     | 95%     |
+| claude-haiku-4 ($1)  | gemini-2.5-flash     | google   | $0.15     | 85%     |
+
+### Google → Cheaper Alternatives
+
+| Google Model           | Cheapest Alternative | Provider | Input $/M | Savings |
+| ---------------------- | -------------------- | -------- | --------- | ------- |
+| gemini-2.5-pro ($1.25) | gemini-2.5-flash     | google   | $0.15     | 88%     |
+| gemini-2.5-pro ($1.25) | deepseek-chat        | deepseek | $0.14     | 89%     |
+
+## Migration Checklist
+
+When switching providers, verify these compatibility points:
+
+- [ ] **API format** — OpenAI-compatible vs proprietary API
+- [ ] **Model names** — different providers use different model IDs
+- [ ] **Tool calling format** — function calling syntax varies
+- [ ] **Streaming** — SSE vs WebSocket vs HTTP streaming
+- [ ] **Rate limits** — requests per minute, tokens per minute
+- [ ] **Context window** — may differ from original provider
+- [ ] **Modalities** — vision, audio, video support varies
+- [ ] **Structured output** — JSON mode availability
+- [ ] **Prompt caching** — can reduce costs 50-90%
+- [ ] **Data residency** — where is data processed and stored
+
+## OpenAI-Compatible Providers
+
+These providers offer OpenAI-compatible APIs — minimal code changes needed:
+
+| Provider    | Base URL                        | Notes                       |
+| ----------- | ------------------------------- | --------------------------- |
+| openrouter  | `openrouter.ai/api/v1`          | Aggregator, 356+ models     |
+| deepinfra   | `api.deepinfra.com/v1`          | Focus on open-source models |
+| togetherai  | `api.together.xyz/v1`           | Open-source model hosting   |
+| groq        | `api.groq.com/openai/v1`        | Ultra-fast inference        |
+| cerebras    | `api.cerebras.ai/v1`            | Fastest inference speed     |
+| fireworks   | `api.fireworks.ai/inference/v1` | Serverless model hosting    |
+| siliconflow | `api.siliconflow.cn/v1`         | China-focused provider      |
+
+## Related Documentation
+
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing across providers
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+- [Chat Models](chat-models.md) — 2,350 models with tool calling
+- [Agentic Models](agentic-models.md) — 1,080 models with tool calling + reasoning
+- [API Reference](api.md) — programmatic access to model data
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4/GPT-3.5 alternatives with pricing
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/modality-matrix.md b/docs/modality-matrix.md
new file mode 100644
index 00000000..9fc5a5fb
--- /dev/null
+++ b/docs/modality-matrix.md
@@ -0,0 +1,106 @@
+**English** | [中文](./zh/modality-matrix.md)
+
+# Modality Matrix
+
+Which models support vision, audio, image generation, and video? This page lists the top models for each modality.
+
+> For the full list, browse the `providers/` directory or download [models.json](https://github.com/i-need-token/ai-models/releases/latest).
+
+## Vision (Image Input)
+
+1,487 models accept images as input. Here are the most capable flagships:
+
+| Model            | Provider      | Context | Input $/1M | Output $/1M |
+| ---------------- | ------------- | ------- | ---------: | ----------: |
+| GPT-4.1          | OpenAI        | 1M      |      $2.00 |       $8.00 |
+| Claude Opus 4    | Anthropic     | 200K    |     $15.00 |      $75.00 |
+| Gemini 2.5 Pro   | Google        | 1M      |      $1.25 |      $10.00 |
+| Qwen3-235B-A22B  | Alibaba Cloud | 128K    |      ¥1.00 |       ¥4.00 |
+| DeepSeek-V3      | DeepSeek      | 128K    |      $0.27 |       $1.10 |
+| Llama 4 Maverick | Meta          | 1M      |          — |           — |
+| Mistral Large    | Mistral       | 128K    |      $2.00 |       $6.00 |
+| Grok 3           | xAI           | 131K    |      $3.00 |      $15.00 |
+
+**Cheapest vision models (USD):**
+
+| Model         | Provider      | Input $/1M | Output $/1M |
+| ------------- | ------------- | ---------: | ----------: |
+| DeepSeek-V3   | DeepSeek      |      $0.27 |       $1.10 |
+| Qwen3-30B-A3B | Alibaba Cloud |      ¥0.10 |       ¥0.30 |
+| Llama 4 Scout | Together AI   |      $0.15 |       $0.60 |
+| Gemma 3 27B   | Google        |      $0.20 |       $0.80 |
+| Phi-4         | Microsoft     |      $0.10 |       $0.40 |
+
+## Image Output (Image Generation)
+
+28 models can generate images:
+
+| Model                | Provider          | Type                    |
+| -------------------- | ----------------- | ----------------------- |
+| GPT-Image-1          | OpenAI            | Native image generation |
+| DALL-E 3             | OpenAI            | Native image generation |
+| Gemini 2.0 Flash     | Google            | Multimodal output       |
+| Flux Pro             | Black Forest Labs | Image generation        |
+| Flux Dev             | Black Forest Labs | Image generation        |
+| Ideogram 3           | Ideogram          | Image generation        |
+| Stable Diffusion 3.5 | Stability AI      | Image generation        |
+| Midjourney v7        | Midjourney        | Image generation        |
+
+## Audio Input (Speech Recognition)
+
+118 models accept audio as input:
+
+| Model           | Provider      | Capabilities                     |
+| --------------- | ------------- | -------------------------------- |
+| GPT-4o-audio    | OpenAI        | Audio understanding + generation |
+| Gemini 2.5 Pro  | Google        | Audio understanding              |
+| Claude Sonnet 4 | Anthropic     | Audio understanding              |
+| Qwen2-Audio     | Alibaba Cloud | Audio understanding              |
+| Whisper         | OpenAI        | Speech recognition               |
+
+## Audio Output (Speech Generation)
+
+34 models can generate audio:
+
+| Model          | Provider      | Type           |
+| -------------- | ------------- | -------------- |
+| GPT-4o-audio   | OpenAI        | Audio output   |
+| Gemini 2.5 Pro | Google        | Audio output   |
+| Qwen2-Audio    | Alibaba Cloud | Audio output   |
+| TTS-1          | OpenAI        | Text-to-speech |
+| TTS-1-HD       | OpenAI        | Text-to-speech |
+
+## Video Input
+
+167 models accept video as input:
+
+| Model            | Provider      | Context     |
+| ---------------- | ------------- | ----------- |
+| Gemini 2.5 Pro   | Google        | 1M tokens   |
+| GPT-4.1          | OpenAI        | 1M tokens   |
+| Claude Opus 4    | Anthropic     | 200K tokens |
+| Qwen3-235B-A22B  | Alibaba Cloud | 128K tokens |
+| Llama 4 Maverick | Meta          | 1M tokens   |
+
+## Multimodal Models (3+ Input Modalities)
+
+Models that accept text + at least 2 additional input modalities:
+
+| Model          | Provider      | Input Modalities          |
+| -------------- | ------------- | ------------------------- |
+| GPT-4o-audio   | OpenAI        | text, image, audio        |
+| Gemini 2.5 Pro | Google        | text, image, audio, video |
+| Claude Opus 4  | Anthropic     | text, image, audio        |
+| Qwen2-Audio    | Alibaba Cloud | text, image, audio        |
+
+## Related Documentation
+
+- [Vision Models](vision-models.md) — 1,487 vision models
+- [Audio Models](audio-models.md) — 118 audio input + 34 audio output models
+- [Video Models](video-models.md) — 167 video input/output models
+- [Image Generation](image-generation.md) — 28 image generation models
+- [Model Selection Guide](model-selection.md) — decision framework
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/model-comparison.md b/docs/model-comparison.md
new file mode 100644
index 00000000..b041ed7a
--- /dev/null
+++ b/docs/model-comparison.md
@@ -0,0 +1,109 @@
+**English** | [中文](./zh/model-comparison.md)
+
+# Model Comparison
+
+Quick-reference comparisons for popular AI model categories. All data sourced from first-party provider APIs and documentation.
+
+## Top-Tier Flagship Models
+
+The most capable models from each major provider. Pricing shown for direct provider API.
+
+| Model            | Provider  | Context | Input $/Mtok | Output $/Mtok | Reasoning | Tool Call | Vision |
+| ---------------- | --------- | ------: | -----------: | ------------: | :-------: | :-------: | :----: |
+| o3               | OpenAI    |    200K |        10.00 |         40.00 |    ✅     |    ✅     |   ✅   |
+| Claude Opus 4.7  | Anthropic |      1M |         5.00 |         25.00 |    ✅     |    ✅     |   ✅   |
+| Gemini 2.5 Pro   | Google    |      1M |         1.25 |         10.00 |    ✅     |    ✅     |   ✅   |
+| DeepSeek-V4-Pro  | DeepSeek  |      1M |        0.435 |          0.87 |    ✅     |    ✅     |   ❌   |
+| Grok 4           | xAI       |    131K |         3.00 |         15.00 |    ✅     |    ✅     |   ✅   |
+| Llama 4 Maverick | Meta      |      1M |         0.24 |          0.97 |    ❌     |    ✅     |   ✅   |
+| Qwen3-235B       | Alibaba   |       — |         2.00 |          8.00 |    ✅     |    ✅     |   ❌   |
+| Mistral Large    | Mistral   |    128K |         2.00 |          6.00 |    ❌     |    ✅     |   ✅   |
+
+## Cost-Effective Models
+
+Best value models for high-volume workloads.
+
+| Model             | Provider  | Context | Input $/Mtok | Output $/Mtok | Reasoning | Tool Call |
+| ----------------- | --------- | ------: | -----------: | ------------: | :-------: | :-------: |
+| GPT-4.1 Nano      | OpenAI    |      1M |         0.10 |          0.40 |    ❌     |    ✅     |
+| o4-mini           | OpenAI    |    200K |         1.10 |          4.40 |    ✅     |    ✅     |
+| Claude Haiku 4.5  | Anthropic |    200K |         1.00 |          5.00 |    ✅     |    ✅     |
+| Gemini 2.5 Flash  | Google    |      1M |         0.15 |          3.50 |    ✅     |    ✅     |
+| DeepSeek-V4-Flash | DeepSeek  |      1M |         0.14 |          0.28 |    ✅     |    ✅     |
+| Llama 4 Scout     | Meta      |     10M |         0.17 |          0.66 |    ❌     |    ✅     |
+| Qwen3-30B         | Alibaba   |       — |         0.75 |          3.00 |    ✅     |    ✅     |
+| Mistral Small     | Mistral   |    128K |         0.20 |          0.60 |    ❌     |    ✅     |
+| Grok 3 Mini       | xAI       |    131K |         0.25 |          1.27 |    ✅     |    ✅     |
+
+## Largest Context Windows
+
+Models with the biggest context windows for long-document processing.
+
+| Model             | Provider  | Context (tokens) | Input $/Mtok | Output $/Mtok |
+| ----------------- | --------- | ---------------: | -----------: | ------------: |
+| Llama 4 Scout     | Meta      |       10,000,000 |         0.17 |          0.66 |
+| Claude Opus 4.7   | Anthropic |        1,000,000 |         5.00 |         25.00 |
+| Claude Sonnet 4.6 | Anthropic |        1,000,000 |         3.00 |         15.00 |
+| GPT-4.1           | OpenAI    |        1,048,576 |         2.00 |          8.00 |
+| Gemini 2.5 Pro    | Google    |        1,048,576 |         1.25 |         10.00 |
+| Gemini 2.5 Flash  | Google    |        1,048,576 |         0.15 |          3.50 |
+| Llama 4 Maverick  | Meta      |        1,000,000 |         0.24 |          0.97 |
+| DeepSeek-V4-Pro   | DeepSeek  |        1,000,000 |        0.435 |          0.87 |
+
+## Free Models
+
+Models available at no cost (as of data collection date).
+
+| Model                         | Provider | Context | Reasoning | Tool Call |
+| ----------------------------- | -------- | ------: | :-------: | :-------: |
+| DeepSeek-V4-Flash (free tier) | DeepSeek |      1M |    ✅     |    ✅     |
+| Gemini 2.5 Flash (free tier)  | Google   |      1M |    ✅     |    ✅     |
+| Llama 4 Scout (self-hosted)   | Meta     |     10M |    ❌     |    ✅     |
+| Qwen3-30B (self-hosted)       | Alibaba  |       — |    ✅     |    ✅     |
+| Mistral Small (self-hosted)   | Mistral  |    128K |    ❌     |    ✅     |
+
+> Free tiers typically have rate limits. Self-hosted models require your own infrastructure.
+
+## Vision-Capable Models
+
+Models that accept image inputs.
+
+| Model            | Provider  | Image Input | Image Output | Video Input |
+| ---------------- | --------- | :---------: | :----------: | :---------: |
+| o3               | OpenAI    |     ✅      |      ❌      |     ❌      |
+| Claude Opus 4.7  | Anthropic |     ✅      |      ❌      |     ❌      |
+| Gemini 2.5 Pro   | Google    |     ✅      |      ❌      |     ❌      |
+| GPT-4.1          | OpenAI    |     ✅      |      ❌      |     ❌      |
+| Llama 4 Maverick | Meta      |     ✅      |      ❌      |     ❌      |
+| Grok 3           | xAI       |     ✅      |      ❌      |     ❌      |
+
+## Open-Weight Models
+
+Models with publicly available weights for self-hosting.
+
+| Model             | Provider  | Context | Input $/Mtok | Output $/Mtok | Reasoning |
+| ----------------- | --------- | ------: | -----------: | ------------: | :-------: |
+| Llama 4 Maverick  | Meta      |      1M |         0.24 |          0.97 |    ❌     |
+| Llama 4 Scout     | Meta      |     10M |         0.17 |          0.66 |    ❌     |
+| Qwen3-235B        | Alibaba   |       — |         2.00 |          8.00 |    ✅     |
+| Qwen3-30B         | Alibaba   |       — |         0.75 |          3.00 |    ✅     |
+| Mistral Small 3.2 | Mistral   |    128K |         0.20 |          0.60 |    ❌     |
+| Phi-4             | Microsoft |     16K |        0.125 |          0.50 |    ❌     |
+
+> Pricing shown for hosted inference. Self-hosted models have no per-token cost but require infrastructure.
+
+---
+
+**Note**: All pricing and capability data is from first-party sources. Prices may vary on inference platforms. Check `providers/<id>/models/` for the most current data.
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing across providers
+- [Free AI Models](free-models.md) — 81 free models
+- [Open-Weight Models](open-weights.md) — 527 models you can run yourself
+- [Context Window Comparison](context-windows.md) — largest context windows
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/model-selection-cheatsheet.md b/docs/model-selection-cheatsheet.md
new file mode 100644
index 00000000..be900691
--- /dev/null
+++ b/docs/model-selection-cheatsheet.md
@@ -0,0 +1,105 @@
+# AI Model Selection Cheatsheet
+
+> Quick-reference guide to picking the right AI model for your use case. All data from [AI Models Catalog](https://github.com/i-need-token/ai-models) — 4,587+ models across 95 providers.
+
+## 🎯 Decision Tree
+
+```
+What do you need?
+├── Cheapest model with tool calling → ling-2.6-flash ($0.01/$0.03/M)
+├── Best free reasoning model → DeepSeek R1 (92% MATH-500)
+├── Largest context window → Gemini 2.5 Pro (1M tokens)
+├── Best coding assistant → Claude Sonnet 4 / GPT-4.1
+├── Open-source with tool calling → Qwen3 4B ($0.03/$0.15/M)
+├── Free model with vision → Gemma 4 27B IT
+└── Cheapest for production → bdc-coder ($0.01/$0.01/M)
+```
+
+## 💰 By Budget
+
+| Budget        | Best Pick       | Input/Output $/M | Why                              |
+| ------------- | --------------- | ---------------- | -------------------------------- |
+| **Free**      | DeepSeek R1     | $0/$0            | Best reasoning among free models |
+| **Free**      | Gemma 4 27B IT  | $0/$0            | Free vision + tool calling       |
+| **< $0.05/M** | ling-2.6-flash  | $0.01/$0.03      | Cheapest tool calling            |
+| **< $0.10/M** | Qwen3 4B        | $0.03/$0.15      | Open-source reasoning + TC       |
+| **< $0.50/M** | GPT-4.1-mini    | $0.40/$1.60      | Best value frontier model        |
+| **< $2/M**    | Claude Sonnet 4 | $3/$15           | Top coding + reasoning           |
+| **< $5/M**    | GPT-4.1         | $2/$8            | 1M context + vision              |
+| **Premium**   | o3              | $10/$40          | Best reasoning benchmark scores  |
+
+## 🛠️ By Use Case
+
+### AI Agents
+
+Need: tool calling + reasoning + low latency
+
+- **Best value**: ling-2.6-flash ($0.01/$0.03/M) — cheapest TC model
+- **Balanced**: GPT-4.1-mini ($0.40/$1.60/M) — reliable + 1M context
+- **Premium**: Claude Sonnet 4 ($3/$15/M) — best agentic performance
+
+### Code Generation
+
+Need: tool calling + structured output + large context
+
+- **Best value**: bdc-coder ($0.01/$0.01/M) — cheapest coding model
+- **Balanced**: GPT-4.1-mini ($0.40/$1.60/M) — great code quality
+- **Premium**: Claude Sonnet 4 ($3/$15/M) — SOTA on SWE-bench
+
+### Chat / RAG
+
+Need: large context + low cost + fast responses
+
+- **Best value**: Qwen3 4B ($0.03/$0.15/M) — cheap + 262K context
+- **Balanced**: GPT-4.1-nano ($0.10/$0.40/M) — fast + cheap
+- **Premium**: Gemini 2.5 Pro ($1.25/$10/M) — 1M context + reasoning
+
+### Vision / Multimodal
+
+Need: image input + text output + tool calling
+
+- **Free**: Gemma 4 27B IT — free vision + TC
+- **Best value**: GPT-4.1-mini ($0.40/$1.60/M) — vision + 1M context
+- **Premium**: Claude Sonnet 4 ($3/$15/M) — best vision understanding
+
+### Reasoning / Math
+
+Need: reasoning capability + structured output
+
+- **Free**: DeepSeek R1 — 92% MATH-500
+- **Best value**: Qwen3.5 4B ($0.03/$0.15/M) — cheap reasoning
+- **Premium**: o3 ($10/$40/M) — SOTA on GPQA, MATH-500
+
+### High-Volume Production
+
+Need: lowest cost per token + reliability
+
+- **Cheapest TC**: ling-2.6-flash ($0.01/$0.03/M)
+- **Cheapest reasoning**: Qwen3.5 0.8B ($0.01/$0.05/M)
+- **Cheapest coding**: bdc-coder ($0.01/$0.01/M)
+
+## 📊 Quick Stats
+
+| Metric              | Count |
+| ------------------- | ----- |
+| Total models        | 4,587 |
+| Providers           | 95    |
+| Free models         | 81    |
+| Tool-calling models | 2,350 |
+| Reasoning models    | 1,306 |
+| Vision models       | 1,487 |
+| Open-weight models  | 527   |
+| Structured output   | 829   |
+
+## 🔗 Explore More
+
+- [Interactive Catalog](https://i-need-token.github.io/ai-models/) — search, filter, compare all models
+- [Free Models Guide](free-models.md) — all 81 free models
+- [Tool Calling Guide](tool-calling.md) — 2,350 models with tool calling
+- [Pricing Comparison](pricing-comparison.md) — find the cheapest model
+- [Context Windows](context-windows.md) — largest context windows
+- [Model Comparison](model-comparison.md) — head-to-head comparisons
+
+---
+
+_Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — first-party data only, updated automatically._
diff --git a/docs/model-selection.md b/docs/model-selection.md
new file mode 100644
index 00000000..d3a465fe
--- /dev/null
+++ b/docs/model-selection.md
@@ -0,0 +1,134 @@
+# Model Selection Guide
+
+> 📋 **Quick reference?** See the [Model Selection Cheatsheet](model-selection-cheatsheet.md) for a budget-by-budget guide.
+> [中文](zh/model-selection.md)
+
+How to choose the right AI model for your use case — practical recommendations based on cost, capabilities, and context windows.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Decision Framework
+
+```
+What do you need?
+├── Cheapest possible → Free models (81 available)
+│   ├── With tool calling → See "Free + Tool Calling" below
+│   ├── With reasoning → See "Free + Reasoning" below
+│   └── Best overall free → See "Best Free Models" below
+├── Best value (cheap + capable) → See "Best Value Models" below
+├── Largest context → See "Large Context Models" below
+├── Specific capability
+│   ├── Tool calling → [Tool Calling Models](tool-calling.md)
+│   ├── Reasoning → [Reasoning Models](reasoning-models.md)
+│   ├── Vision → [Vision Models](vision-models.md)
+│   ├── Structured output → [Structured Output](structured-output.md)
+│   └── Prompt caching → [Cached Pricing](cached-pricing.md)
+└── Full comparison → [Model Comparison](model-comparison.md) · [Pricing Comparison](pricing-comparison.md)
+```
+
+## Best Free Models
+
+Models with $0 input and $0 output pricing — perfect for prototyping and development.
+
+| Model | Provider | Context | Capabilities |
+| ----- | -------- | ------- | ------------ |
+
+> See [Free AI Models](free-models.md) for the complete list of 81 free models.
+
+## Free + Tool Calling
+
+Free models that support function/tool calling — ideal for building agents at zero cost.
+
+| Model | Provider | Context | Capabilities |
+| ----- | -------- | ------- | ------------ |
+
+## Free + Reasoning
+
+Free models with chain-of-thought reasoning — complex problem solving at zero cost.
+
+| Model | Provider | Context | Capabilities |
+| ----- | -------- | ------- | ------------ |
+
+## Best Value Models
+
+Cheapest models with tool calling — best bang for the buck for production agents.
+
+| Model                       | Provider     | Context | Input $/M | Output $/M | Capabilities |
+| --------------------------- | ------------ | ------- | --------- | ---------- | ------------ |
+| ernie-4.5-0.3b              | aihubmix     | 0       | $0.0068   | $0.0272    | 🔧 👁 📋     |
+| bdc-coder                   | inferencenet | 131K    | $0.01     | $0.01      | 🔧 🔓        |
+| inclusionai--ling-2.6-flash | openrouter   | 262K    | $0.01     | $0.03      | 🔧 📋        |
+| ling-2.6-flash              | inclusionai  | 262K    | $0.01     | $0.03      | 🔧           |
+| qwen-3.5-0.8b               | auriko       | 262K    | $0.01     | $0.05      | 🧠 🔧 👁     |
+
+Cheapest models with vision:
+
+| Model                | Provider  | Context | Input $/M | Output $/M | Capabilities |
+| -------------------- | --------- | ------- | --------- | ---------- | ------------ |
+| ernie-4.5-0.3b       | aihubmix  | 0       | $0.0068   | $0.0272    | 🔧 👁 📋     |
+| deepseek-ocr         | aihubmix  | 0       | $0.01     | $0.01      | 👁           |
+| gemini-2.0-flash-exp | aihubmix  | 0       | $0.01     | $0.04      | 👁           |
+| qwen-3.5-0.8b        | auriko    | 262K    | $0.01     | $0.05      | 🧠 🔧 👁     |
+| qwen3.5-0.8b         | deepinfra | 262K    | $0.01     | $0.05      | 🧠 👁        |
+
+Cheapest models with reasoning:
+
+| Model                 | Provider  | Context | Input $/M | Output $/M | Capabilities |
+| --------------------- | --------- | ------- | --------- | ---------- | ------------ |
+| qwen-3.5-0.8b         | auriko    | 262K    | $0.01     | $0.05      | 🧠 🔧 👁     |
+| qwen3.5-0.8b          | deepinfra | 262K    | $0.01     | $0.05      | 🧠 👁        |
+| gemma-2-2b-it         | cortecs   | 0       | $0.018    | $0.054     | 🧠           |
+| llama-3.1-8b-instruct | cortecs   | 0       | $0.018    | $0.054     | 🧠 🔧        |
+| qwen-3.5-2b           | auriko    | 262K    | $0.02     | $0.1       | 🧠 🔧 👁     |
+
+## Large Context Models
+
+Models with the largest context windows — for long documents, multi-turn conversations, and codebases.
+
+| Model                        | Provider   | Context | Input $/M | Output $/M | Capabilities |
+| ---------------------------- | ---------- | ------- | --------- | ---------- | ------------ |
+| meta-llama--llama-4-scout    | openrouter | 10M     | $0.08     | $0.3       | 🔧 👁 📋     |
+| meta-llama-4-scout           | meta       | 10M     | $0.17     | $0.66      | 🔧 👁        |
+| gemini-1.5-pro               | google     | 2M      | $1.25     | $5         | 🔧 👁 📋     |
+| grok-code-fast-1             | jiekou     | 2M      | $0.19     | $0.475     | 🔧 👁        |
+| gpt-4o                       | jiekou     | 2M      | $1.9      | $5.7       | 🔧 👁        |
+| grok-4.20-0309-non-reasoning | jiekou     | 2M      | $0.19     | $0.475     | 🔧 👁        |
+| grok-4.20-0309-reasoning     | jiekou     | 2M      | $1.9      | $5.7       | 🔧 👁        |
+| grok-4-1-fast-reasoning      | jiekou     | 2M      | $0.19     | $0.475     | 🔧 👁        |
+| grok-4-fast-reasoning        | jiekou     | 2M      | $0.19     | $0.475     | 🔧 👁        |
+| x-ai--grok-4-fast            | fastrouter | 2M      | $0.2      | $0.5       | 🔧 👁        |
+
+> See [Context Window Comparison](context-windows.md) for the full analysis.
+
+## Cost Optimization Tips
+
+1. **Use free models for development** — prototype with free models, switch to paid for production
+2. **Enable prompt caching** — [1,374 models](cached-pricing.md) support caching with 50-90% input cost savings
+3. **Choose the smallest capable model** — e.g., GPT-4.1 Mini instead of GPT-4.1 for simple tasks
+4. **Use open-weight models** — [527 models](open-weights.md) can run on your own infrastructure
+5. **Compare across providers** — the same model is often cheaper through alternative providers (e.g., Groq, Together AI, DeepInfra)
+6. **Batch requests** — some providers offer 50% discount for batch API calls
+7. **Monitor usage** — track input/output token ratios to optimize model selection
+
+## Related Documentation
+
+- [Model Comparison](model-comparison.md) — flagship, cost-effective, free, and open-weight models
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing across providers
+- [Cached Pricing](cached-pricing.md) — models with prompt caching support
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Open-Weight Models](open-weights.md) — 527 models you can run yourself
+- [Context Window Comparison](context-windows.md) — largest context windows
+- [Tool Calling Models](tool-calling.md) — 2,350 models with tool calling
+- [Reasoning Models](reasoning-models.md) — 1,306 models with reasoning
+- [Vision Models](vision-models.md) — 1,487 models with image understanding
+- [Quick Start Guide](quick-start.md) — get started in 30 seconds
+
+- [Chat Models](chat-models.md) — 2,350 models with tool calling for chat applications
+- [Multimodal Models](multimodal-models.md) — 1,519 models with image/audio/video input
+
+- [Large Context Models](large-context-models.md) — 2,195 models with 128K+ context
+- [Small & Edge Models](small-models.md) — 1,153 models for on-device inference
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/multimodal-models.md b/docs/multimodal-models.md
new file mode 100644
index 00000000..1745d8f0
--- /dev/null
+++ b/docs/multimodal-models.md
@@ -0,0 +1,101 @@
+# Multimodal Models
+
+[中文](zh/multimodal-models.md)
+
+AI models that can process **multiple input modalities** — images, audio, and video alongside text. These models power visual Q&A, document analysis, video understanding, and audio transcription.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Multimodal Models Matter
+
+Multimodal models break the text-only barrier:
+
+- **Visual Q&A** — ask questions about images and documents
+- **Document Analysis** — extract information from PDFs, screenshots, and scans
+- **Video Understanding** — analyze video content, summarize clips
+- **Audio Processing** — transcribe speech, analyze audio content
+- **Accessibility** — describe images for visually impaired users
+- **Content Moderation** — detect inappropriate content across modalities
+
+## Stats
+
+| Metric                        | Count |
+| ----------------------------- | ----- |
+| Multimodal models             | 1519  |
+| Providers                     | 61    |
+| Image input                   | 1487  |
+| Audio input                   | 118   |
+| Video input                   | 167   |
+| Free multimodal models        | 53    |
+| Open-weight multimodal models | 119   |
+| With tool calling             | 1179  |
+| With reasoning                | 701   |
+
+## Providers
+
+`01ai`, `302ai`, `aihubmix`, `aimlapi`, `amazon`, `amazon-bedrock`, `anthropic`, `arcee`, `auriko`, `baidu`, `berget`, `bytedance`, `chutes`, `clarifai`, `cloudferro-sherlock`, `cloudflare`, `cortecs`, `databricks`, `deepinfra`, `digitalocean`, `evroc`, `fastrouter`, `fireworks`, `google`, `google-vertex` and 36 more
+
+## Free Multimodal Models
+
+Free models with multimodal input — zero-cost visual/audio applications.
+
+| Model                                                | Provider   | Context | Input $/M | Output $/M | Modalities     |
+| ---------------------------------------------------- | ---------- | ------- | --------- | ---------- | -------------- |
+| google--lyria-3-clip-preview                         | openrouter | 1M      | Free      | Free       | 🖼️             |
+| google--lyria-3-pro-preview                          | openrouter | 1M      | Free      | Free       | 🖼️             |
+| google--gemma-4-26b-a4b-it--free                     | openrouter | 262K    | Free      | Free       | 🖼️ 🎬 🔧 🧠    |
+| google--gemma-4-31b-it--free                         | openrouter | 262K    | Free      | Free       | 🖼️ 🎬 🔧 🧠    |
+| gemma-4-26b-a4b-it                                   | auriko     | 262K    | Free      | Free       | 🖼️ 🔧 🧠       |
+| gemma-4-31b-it                                       | auriko     | 262K    | Free      | Free       | 🖼️ 🔧 🧠       |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter | 256K    | Free      | Free       | 🖼️ 🎤 🎬 🔧 🧠 |
+| spotlight                                            | arcee      | 131K    | Free      | Free       | 🖼️             |
+| gemma-3-4b-it                                        | google     | 131K    | Free      | Free       | 🖼️             |
+| gemma-3-12b-it                                       | google     | 131K    | Free      | Free       | 🖼️             |
+
+## Cheapest Multimodal Models
+
+Best value multimodal models for production.
+
+| Model                      | Provider  | Context | Input $/M | Output $/M | Modalities |
+| -------------------------- | --------- | ------- | --------- | ---------- | ---------- |
+| ernie-4.5-0.3b             | aihubmix  | 0       | $0.0068   | $0.0272    | 🖼️ 🔧      |
+| deepseek-ocr               | aihubmix  | 0       | $0.01     | $0.01      | 🖼️         |
+| gemini-2.0-flash-exp       | aihubmix  | 0       | $0.01     | $0.04      | 🖼️ 🎤 🎬   |
+| qwen-3.5-0.8b              | auriko    | 262K    | $0.01     | $0.05      | 🖼️ 🔧 🧠   |
+| qwen3.5-0.8b               | deepinfra | 262K    | $0.01     | $0.05      | 🖼️ 🧠      |
+| qwen3-vl-flash-2026-01-22  | aihubmix  | 0       | $0.0103   | $0.103     | 🖼️ 🎬 🔧   |
+| qwen3-vl-flash             | aihubmix  | 0       | $0.0103   | $0.103     | 🖼️ 🎬 🔧   |
+| glm-ocr                    | aihubmix  | 0       | $0.0141   | $0.0141    | 🖼️         |
+| paddlepaddle--paddleocr-vl | novitaai  | 16K     | $0.02     | $0.02      | 🖼️         |
+| qwen-3.5-2b                | auriko    | 262K    | $0.02     | $0.1       | 🖼️ 🔧 🧠   |
+
+## Largest Context Multimodal Models
+
+Multimodal models with the largest context windows — for processing long documents and videos.
+
+| Model                        | Provider   | Context | Input $/M | Output $/M | Modalities  |
+| ---------------------------- | ---------- | ------- | --------- | ---------- | ----------- |
+| meta-llama--llama-4-scout    | openrouter | 10M     | $0.08     | $0.3       | 🖼️ 🔧       |
+| meta-llama-4-scout           | meta       | 10M     | $0.17     | $0.66      | 🖼️ 🔧       |
+| gemini-1.5-pro               | google     | 2M      | $1.25     | $5         | 🖼️ 🎤 🎬 🔧 |
+| grok-code-fast-1             | jiekou     | 2M      | $0.19     | $0.475     | 🖼️ 🔧       |
+| gpt-4o                       | jiekou     | 2M      | $1.9      | $5.7       | 🖼️ 🔧       |
+| grok-4.20-0309-non-reasoning | jiekou     | 2M      | $0.19     | $0.475     | 🖼️ 🔧       |
+| grok-4.20-0309-reasoning     | jiekou     | 2M      | $1.9      | $5.7       | 🖼️ 🔧       |
+| grok-4-1-fast-reasoning      | jiekou     | 2M      | $0.19     | $0.475     | 🖼️ 🔧       |
+| grok-4-fast-reasoning        | jiekou     | 2M      | $0.19     | $0.475     | 🖼️ 🔧       |
+| x-ai--grok-4-fast            | fastrouter | 2M      | $0.2      | $0.5       | 🖼️ 🔧       |
+
+## Related Documentation
+
+- [Vision Models](vision-models.md) — 1,487 models with image input
+- [Video Models](video-models.md) — models with video understanding
+- [Audio Models](audio-models.md) — models with audio input/output
+- [Image Generation](image-generation.md) — 28 models that generate images
+- [Agentic Models](agentic-models.md) — 1,080 models with tool calling + reasoning
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Model Selection Guide](model-selection.md) — decision framework
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/open-weights.md b/docs/open-weights.md
new file mode 100644
index 00000000..f3f0ba3d
--- /dev/null
+++ b/docs/open-weights.md
@@ -0,0 +1,118 @@
+**English** | [中文](./zh/open-weights.md)
+
+# Open-Weight AI Models
+
+513 models in this catalog are open-weight — you can download the weights and run them on your own infrastructure. This page highlights the most capable and widely available open-weight models.
+
+> All data sourced from first-party APIs and documentation. "Open-weight" means the model weights are publicly available; license terms vary by model.
+
+## Quick Stats
+
+| Capability                | Open-Weight Models |
+| ------------------------- | -----------------: |
+| Total open-weight models  |                513 |
+| Unique model IDs          |                420 |
+| With tool calling         |                270 |
+| With reasoning            |                101 |
+| With vision (image input) |                104 |
+
+## Most Widely Available
+
+These open-weight models are available on the most providers — easy to find, easy to switch:
+
+| Model                         | Providers | Context | Tool Call | Reasoning | Vision |
+| ----------------------------- | --------: | ------- | --------- | --------- | ------ |
+| GPT-OSS-120B                  |        14 | 131K    | ✅        | ✅        | ❌     |
+| GPT-OSS-20B                   |         8 | 131K    | ✅        | ✅        | ❌     |
+| Qwen3.5-397B-A17B             |         4 | 262K    | ✅        | ✅        | ❌     |
+| Kimi K2 Thinking              |         4 | 262K    | ✅        | ✅        | ✅     |
+| DeepSeek-R1-Distill-Llama-70B |         4 | 131K    | ✅        | ✅        | ❌     |
+| Llama 4 Scout 17B             |         4 | 328K    | ✅        | ❌        | ✅     |
+| DeepSeek-R1                   |         3 | 131K    | ✅        | ✅        | ❌     |
+| Llama 4 Maverick              |         3 | 1M      | ✅        | ❌        | ✅     |
+| Qwen3-32B                     |         3 | 131K    | ✅        | ✅        | ❌     |
+| Gemma 4 31B IT                |         3 | 262K    | ✅        | ✅        | ✅     |
+
+## Largest Context Windows
+
+Open-weight models with the largest context windows:
+
+| Model             | Context | Tool Call | Reasoning | Vision |
+| ----------------- | ------- | --------- | --------- | ------ |
+| Llama 4 Scout     | 10M     | ✅        | ❌        | ✅     |
+| Qwen3.5 Flash     | 1M      | ✅        | ❌        | ✅     |
+| Qwen3.6 Flash     | 1M      | ✅        | ❌        | ✅     |
+| Llama 4 Maverick  | 1M      | ✅        | ❌        | ✅     |
+| DeepSeek-V4 Flash | 1M      | ✅        | ✅        | ❌     |
+| DeepSeek-V4 Pro   | 1M      | ✅        | ✅        | ❌     |
+| MiMo V2.5         | 1M      | ✅        | ✅        | ✅     |
+| Minimax M2.5      | 1M      | ✅        | ❌        | ❌     |
+| Gemma 4 31B IT    | 1M      | ✅        | ❌        | ✅     |
+
+## Best Open-Weight Reasoning Models
+
+These open-weight models support chain-of-thought reasoning:
+
+| Model                | Context | Tool Call | Vision | Providers |
+| -------------------- | ------- | --------- | ------ | --------: |
+| DeepSeek-V4 Flash    | 1M      | ✅        | ❌     |         2 |
+| DeepSeek-V4 Pro      | 1M      | ✅        | ❌     |         2 |
+| MiMo V2.5 Pro        | 1M      | ✅        | ❌     |         1 |
+| MiMo V2.5            | 1M      | ✅        | ✅     |         1 |
+| Gemma 4 26B A4B IT   | 262K    | ✅        | ✅     |         3 |
+| Kimi K2.6            | 262K    | ✅        | ✅     |         2 |
+| Qwen3.5-397B-A17B    | 262K    | ✅        | ❌     |         2 |
+| Nemotron-3-120B-A12B | 262K    | ✅        | ❌     |         1 |
+| DeepSeek-R1          | 131K    | ✅        | ❌     |         3 |
+| Qwen3-32B            | 131K    | ✅        | ✅     |         3 |
+
+## Best Open-Weight Vision Models
+
+Open-weight models that accept image input:
+
+| Model              | Context | Tool Call | Reasoning | Providers |
+| ------------------ | ------- | --------- | --------- | --------: |
+| MiMo V2.5          | 1M      | ✅        | ✅        |         1 |
+| Llama 4 Maverick   | 1M      | ✅        | ❌        |         3 |
+| Llama 4 Scout      | 10M     | ✅        | ❌        |         2 |
+| Gemma 4 31B IT     | 1M      | ✅        | ❌        |         3 |
+| Qwen3.5 Flash      | 1M      | ✅        | ❌        |         1 |
+| Kimi K2.6          | 262K    | ✅        | ✅        |         2 |
+| Gemma 4 26B A4B IT | 262K    | ✅        | ✅        |         3 |
+| Llama 4 Scout 17B  | 328K    | ✅        | ❌        |         4 |
+
+## Cheapest Open-Weight Models
+
+Lowest per-token pricing for open-weight inference:
+
+| Model                      | Provider     | Input $/1M | Output $/1M | Context |
+| -------------------------- | ------------ | ---------: | ----------: | ------- |
+| GLM-4-Flash                | 302AI        |    $0.0014 |     $0.0014 | 131K    |
+| Mistral-Nemo-Instruct-2407 | KlusterAI    |     $0.008 |      $0.001 | 131K    |
+| BDC-Coder                  | InferenceNet |      $0.01 |       $0.01 | 131K    |
+| Granite 4.0 H Micro        | Cloudflare   |     $0.017 |      $0.112 | 131K    |
+| Llama 3.1 8B Instruct      | InferenceNet |      $0.02 |       $0.03 | 131K    |
+| Mistral Nemo Instruct 2407 | MegaNova     |      $0.02 |       $0.04 | 131K    |
+| Meta-Llama-3.1-8B-Instruct | Nebius       |      $0.02 |       $0.06 | 131K    |
+| Llama 3.2 1B Instruct      | Cloudflare   |     $0.027 |      $0.201 | 131K    |
+
+## Key Takeaways
+
+- **513 open-weight models** across 420 unique model IDs — the largest open-weight model catalog available
+- **GPT-OSS-120B** is the most widely available, offered by 14 providers
+- **Llama 4 Scout** has the largest context window at 10M tokens
+- **DeepSeek-R1** is the most popular open-weight reasoning model, available on 3 providers
+- **MiMo V2.5** is the only open-weight model combining 1M context, reasoning, and vision
+- Pricing varies widely — the cheapest open-weight models cost under $0.01/1M tokens
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Free AI Models](free-models.md) — 81 free models
+- [Provider Overview](providers.md) — all 95 providers organized by type
+- [Reasoning Models](reasoning-models.md) — 1,306 models with reasoning
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/openai-alternatives.md b/docs/openai-alternatives.md
new file mode 100644
index 00000000..be13fdea
--- /dev/null
+++ b/docs/openai-alternatives.md
@@ -0,0 +1,156 @@
+**English** | [中文](./zh/openai-alternatives.md)
+
+# OpenAI Alternatives — GPT-4, GPT-3.5, and Beyond
+
+Comprehensive guide to AI models comparable to OpenAI's GPT-4, GPT-4o, and GPT-3.5 Turbo — with pricing, capabilities, and API compatibility. All data sourced from first-party APIs via the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Quick Comparison: GPT-4 Class Alternatives
+
+Models with **tool calling + reasoning + vision** (the full GPT-4 capability set):
+
+| Model                         | Provider   | Context | Input $/1M | Output $/1M | Open Weights |
+| ----------------------------- | ---------- | ------- | ---------- | ----------- | ------------ |
+| openai--gpt-oss-120b          | novitaai   | 128K    | $0.05      | $0.25       |              |
+| Qwen--Qwen3.6-35B-A3B         | neuralwatt | 0       | $0.05      | $0.1        |              |
+| Nemotron-3-Nano-Omni          | nebius     | 125K    | $0.06      | $0.24       | ✅           |
+| seed-1.6-flash                | bytedance  | 256K    | $0.07      | $0.3        |              |
+| gemma-4-26b-a4b-it            | cloudflare | 256K    | $0.1       | $0.3        | ✅           |
+| Gemma-3-27b-it                | nebius     | 93K     | $0.1       | $0.3        | ✅           |
+| seed-2.0-mini                 | bytedance  | 256K    | $0.1       | $0.4        |              |
+| google--gemma-4-26b-a4b-it    | novitaai   | 256K    | $0.13      | $0.4        |              |
+| google--gemma-4-31B-turbo-TEE | chutes     | 128K    | $0.13      | $0.38       |              |
+| baidu--ernie-4.5-vl-28b-a3b   | novitaai   | 29K     | $0.14      | $0.56       |              |
+| google--gemma-4-31b-it        | novitaai   | 256K    | $0.14      | $0.4        |              |
+| amazon-nova-2.0-lite          | amazon     | 62K     | $0.15      | $1.25       |              |
+| gemini-2.5-flash              | google     | 1024K   | $0.15      | $3.5        |              |
+| amazon-nova-2.0-omni          | amazon     | 62K     | $0.2       | $1.3        |              |
+| xai-grok-4.1                  | xai        | 128K    | $0.2       | $0.5        |              |
+
+> Full list: 617 models with tool calling + reasoning + vision across 50+ providers. See [Agentic Models](agentic-models.md) for the complete catalog.
+
+## Cheapest Tool-Calling Models
+
+Best value models with function/tool calling (direct providers only):
+
+| Model                                       | Provider       | Context | Input $/1M | Output $/1M |
+| ------------------------------------------- | -------------- | ------- | ---------- | ----------- |
+| ling-2.6-flash                              | inclusionai    | 256K    | $0.01      | $0.03       |
+| bdc-coder                                   | inferencenet   | 128K    | $0.01      | $0.01       |
+| klusterai--Meta-Llama-3.1-8B-Instruct-Turbo | klusterai      | 127K    | $0.015     | $0.02       |
+| granite-4.0-h-micro                         | cloudflare     | 128K    | $0.017     | $0.112      |
+| schematron-v3                               | inferencenet   | 128K    | $0.02      | $0.05       |
+| schematron-3b                               | inferencenet   | 128K    | $0.02      | $0.05       |
+| llama-3.1-8b-instruct--fp-16                | inferencenet   | 128K    | $0.02      | $0.03       |
+| liquid-ai--LFM2-24B-A2B                     | togetherai     | 128K    | $0.03      | $0.12       |
+| qwen--qwen3-4b-fp8                          | novitaai       | 125K    | $0.03      | $0.03       |
+| schematron-v2-turbo                         | inferencenet   | 128K    | $0.03      | $0.15       |
+| gpt-oss-20b                                 | inferencenet   | 128K    | $0.03      | $0.15       |
+| openai--gpt-oss-20b                         | neuralwatt     | 0       | $0.03      | $0.16       |
+| amazon-nova-micro                           | amazon         | 125K    | $0.035     | $0.14       |
+| amazon-nova-micro                           | amazon-bedrock | 125K    | $0.035     | $0.14       |
+| mistral-nemo-12b-instruct--fp-8             | inferencenet   | 128K    | $0.0375    | $0.1        |
+
+> Full list: 2,350 tool-calling models across 67 providers. See [Tool Calling Models](tool-calling.md).
+
+## Free Alternatives to GPT-4
+
+Models with tool calling at zero cost (direct providers):
+
+| Model                             | Provider | Context | Capabilities                 |
+| --------------------------------- | -------- | ------- | ---------------------------- |
+| glm-4.7-flash                     | zhipuai  | 195K    | Tool Call                    |
+| glm-4.1v-thinking-flash           | zhipuai  | 62K     | Reasoning, Vision, Tool Call |
+| glm-4-flash-250414                | zhipuai  | 125K    | Tool Call                    |
+| glm-4v-flash                      | zhipuai  | 15K     | Vision, Tool Call            |
+| autoglm-phone                     | zhipuai  | 19K     | Vision, Tool Call            |
+| glm-ocr                           | zhipuai  | 0       | Vision, Tool Call            |
+| glm-4.6v-flash                    | zhipuai  | 125K    | Vision, Tool Call            |
+| cobuddy                           | baidu    | 128K    | Tool Call                    |
+| qwen--qwen3-omni-30b-a3b-instruct | novitaai | 64K     | Vision, Tool Call            |
+| qwen--qwen3-omni-30b-a3b-thinking | novitaai | 64K     | Reasoning, Vision, Tool Call |
+| baidu--ernie-4.5-0.3b             | aimlapi  | 117K    | Tool Call                    |
+| qwen--qwen3.5-4b-free             | mixlayer | 128K    | Reasoning, Tool Call         |
+| llama-4-scout-17b-16e-instruct    | cerebras | 128K    | Tool Call                    |
+| qwen-2.5-32b                      | cerebras | 128K    | Tool Call                    |
+| llama-3.3-70b                     | cerebras | 128K    | Tool Call                    |
+
+> Full list: 81 free models. See [Free AI Models](free-models.md).
+
+## Largest Context Windows with Tool Calling
+
+| Model                                              | Provider    | Context | Input $/1M | Output $/1M |
+| -------------------------------------------------- | ----------- | ------- | ---------- | ----------- |
+| meta-llama-4-scout                                 | meta        | 9765K   | $0.17      | $0.66       |
+| xai--grok-4-fast-reasoning                         | aimlapi     | 1953K   | $0.52      | $1.3        |
+| xai--grok-4-fast-non-reasoning                     | aimlapi     | 1953K   | $0.52      | $1.3        |
+| meta-llama--Llama-4-Maverick-17B-128E-Instruct-FP8 | gmicloud    | 1024K   | $0.25      | $0.8        |
+| minimax-m2-5                                       | baseten     | 1024K   | $0.3       | $1.2        |
+| deepseek-v4-flash                                  | baidu       | 1024K   | $0.126     | $0.252      |
+| deepseek-v4-pro                                    | siliconflow | 1024K   | $1.74      | $3.48       |
+| deepseek-v4-flash                                  | siliconflow | 1024K   | $0.14      | $0.28       |
+| deepseek--deepseek-v4-pro                          | novitaai    | 1024K   | $1.67      | $3.38       |
+| xiaomimimo--mimo-v2.5-pro                          | novitaai    | 1024K   | $2         | $6          |
+| deepseek--deepseek-v4-flash                        | novitaai    | 1024K   | $0.14      | $0.28       |
+| gemini-2.0-flash-lite                              | google      | 1024K   | $0.075     | $0.3        |
+| gemini-2.5-flash                                   | google      | 1024K   | $0.15      | $3.5        |
+| gemini-2.5-pro                                     | google      | 1024K   | $1.25      | $10         |
+| gemini-2.0-flash                                   | google      | 1024K   | $0.1       | $0.4        |
+
+> Full list: 2,195 models with 128K+ context. See [Large Context Models](large-context-models.md).
+
+## OpenAI-Compatible Providers
+
+70 providers offer OpenAI-compatible API endpoints — switch with minimal code changes:
+
+| Provider        | API Endpoint                                 | Model Count | Free Tier |
+| --------------- | -------------------------------------------- | ----------- | --------- |
+| Regolo          | `https://api.regolo.ai/v1`                   | 1           | —         |
+| MegaNova        | `https://api.meganova.ai/v1`                 | 1           | —         |
+| GMI Cloud       | `https://api.gmi-serving.com/v1`             | 1           | —         |
+| Cohere          | `https://api.cohere.com`                     | 1           | —         |
+| Requesty        | `https://router.requesty.ai/v1`              | 1           | —         |
+| 接口 AI         | `https://api.jiekou.ai/v1`                   | 1           | —         |
+| Zhipu AI (智谱) | `https://open.bigmodel.cn/api/paas/v4`       | 1           | —         |
+| SambaNova       | `https://api.sambanova.ai/v1`                | 1           | —         |
+| Baseten         | `https://model-api.baseten.co/v1`            | 1           | —         |
+| Wafer           | `https://pass.wafer.ai/v1`                   | 1           | —         |
+| Arcee AI        | `https://api.arcee.ai/v1`                    | 1           | —         |
+| Moonshot AI     | `https://api.moonshot.cn/v1`                 | 1           | —         |
+| Amazon Nova     | `https://bedrock.us-east-1.amazonaws.com/v1` | 1           | —         |
+| Baidu           | `https://qianfan.baidubce.com/v1`            | 1           | —         |
+| Together AI     | `https://api.together.xyz/v1`                | 1           | —         |
+| OpenRouter      | `https://openrouter.ai/api/v1`               | 1           | —         |
+| FastRouter      | `https://api.fastrouter.ai/v1`               | 1           | —         |
+| SubModel        | `https://api.submodel.ai/v1`                 | 1           | —         |
+| Inception Labs  | `https://api.inceptionlabs.ai/v1`            | 1           | —         |
+| SiliconFlow     | `https://api.siliconflow.cn/v1`              | 1           | —         |
+
+> See [Migration Guide](migration-guide.md) for step-by-step instructions on switching from OpenAI.
+
+## Choosing Your Alternative
+
+| Need                          | Best Option                        | See                                         |
+| ----------------------------- | ---------------------------------- | ------------------------------------------- |
+| Cheapest tool calling         | DeepSeek, Qwen3                    | [Pricing Comparison](pricing-comparison.md) |
+| GPT-4-level reasoning         | Claude Opus 4, Gemini 2.5 Pro      | [Reasoning Models](reasoning-models.md)     |
+| Free for prototyping          | Google Gemini, Cloudflare          | [Free Models](free-models.md)               |
+| Largest context               | Gemini 2.5 Pro (1M), Llama 4 (10M) | [Context Windows](context-windows.md)       |
+| Open weights for self-hosting | Llama 4, Qwen3                     | [Open-Weight Models](open-weights.md)       |
+| Easy migration from OpenAI    | Any OpenAI-compatible provider     | [Migration Guide](migration-guide.md)       |
+| Running AI agents             | Models with tool_call + reasoning  | [Agentic Models](agentic-models.md)         |
+
+## Related Documentation
+
+- [Tool Calling Models](tool-calling.md) — 2,350 models with function calling
+- [Reasoning Models](reasoning-models.md) — 1,306 models with chain-of-thought
+- [Vision Models](vision-models.md) — 1,487 models with image understanding
+- [Free AI Models](free-models.md) — 81 models at zero cost
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing across providers
+- [Migration Guide](migration-guide.md) — switch providers with minimal code changes
+- [Provider Comparison](provider-comparison.md) — top 30 providers by model count
+- [Agentic Models](agentic-models.md) — 1,080 models for AI agents
+- [Code Models](code-models.md) — 189 code-focused models
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/pricing-comparison.md b/docs/pricing-comparison.md
new file mode 100644
index 00000000..d49b2ff4
--- /dev/null
+++ b/docs/pricing-comparison.md
@@ -0,0 +1,134 @@
+**English** | [中文](./zh/pricing-comparison.md)
+
+# Pricing Comparison
+
+Side-by-side pricing comparison for AI model inference across providers and platforms. All prices in USD per million tokens, sourced from first-party APIs.
+
+## Direct Provider Pricing
+
+Pricing from the model producer's own API.
+
+### OpenAI
+
+| Model        | Input $/Mtok | Output $/Mtok | Cache Read $/Mtok | Context |
+| ------------ | -----------: | ------------: | ----------------: | ------: |
+| GPT-4.1 Nano |         0.10 |          0.40 |             0.025 |      1M |
+| GPT-4o Mini  |         0.15 |          0.60 |             0.075 |    128K |
+| GPT-4.1 Mini |         0.40 |          1.60 |              0.10 |      1M |
+| GPT-4.1      |         2.00 |          8.00 |              0.50 |      1M |
+| GPT-4o       |         2.50 |         10.00 |              1.25 |    128K |
+| o4-mini      |         1.10 |          4.40 |             0.275 |    200K |
+| o3           |        10.00 |         40.00 |              2.50 |    200K |
+
+### Anthropic
+
+| Model             | Input $/Mtok | Output $/Mtok | Context |
+| ----------------- | -----------: | ------------: | ------: |
+| Claude Haiku 4.5  |         1.00 |          5.00 |    200K |
+| Claude Sonnet 4.0 |         3.00 |         15.00 |      1M |
+| Claude Sonnet 4.5 |         3.00 |         15.00 |      1M |
+| Claude Sonnet 4.6 |         3.00 |         15.00 |      1M |
+| Claude Opus 4.5   |         5.00 |         25.00 |    200K |
+| Claude Opus 4.7   |         5.00 |         25.00 |      1M |
+
+### Google
+
+| Model                 | Input $/Mtok | Output $/Mtok | Cache Read $/Mtok | Context |
+| --------------------- | -----------: | ------------: | ----------------: | ------: |
+| Gemini 1.5 Flash 8B   |        0.075 |          0.30 |                 — |      1M |
+| Gemini 2.0 Flash Lite |        0.075 |          0.30 |                 — |      1M |
+| Gemini 2.0 Flash      |         0.10 |          0.40 |                 — |      1M |
+| Gemini 2.5 Flash Lite |         0.10 |          0.40 |                 — |      1M |
+| Gemini 2.5 Flash      |         0.15 |          3.50 |            0.0375 |      1M |
+| Gemini 2.5 Pro        |         1.25 |         10.00 |             0.315 |      1M |
+
+### DeepSeek
+
+| Model             | Input $/Mtok | Output $/Mtok | Cache Read $/Mtok | Context |
+| ----------------- | -----------: | ------------: | ----------------: | ------: |
+| DeepSeek-V4-Flash |         0.14 |          0.28 |            0.0028 |      1M |
+| DeepSeek-V4-Pro   |        0.435 |          0.87 |          0.003625 |      1M |
+
+### xAI
+
+| Model       | Input $/Mtok | Output $/Mtok | Context |
+| ----------- | -----------: | ------------: | ------: |
+| Grok 4 Fast |         0.20 |          0.50 |    131K |
+| Grok 4.1    |         0.20 |          0.50 |    131K |
+| Grok 3 Mini |         0.25 |          1.27 |    131K |
+| Grok 4.2    |         2.00 |          6.00 |    131K |
+| Grok 3      |         3.00 |         15.00 |    131K |
+| Grok 4      |         3.00 |         15.00 |    131K |
+
+### Meta (via hosted inference)
+
+| Model            | Input $/Mtok | Output $/Mtok | Context |
+| ---------------- | -----------: | ------------: | ------: |
+| Llama 3.2 1B     |         0.10 |          0.10 |    128K |
+| Llama 4 Scout    |         0.17 |          0.66 |     10M |
+| Llama 4 Maverick |         0.24 |          0.97 |      1M |
+
+### Mistral
+
+| Model         | Input $/Mtok | Output $/Mtok | Context |
+| ------------- | -----------: | ------------: | ------: |
+| Ministral 3B  |         0.04 |          0.04 |    128K |
+| Ministral 8B  |         0.10 |          0.10 |    128K |
+| Mistral Small |         0.20 |          0.60 |    128K |
+| Mistral Large |         2.00 |          6.00 |    128K |
+
+## Cross-Platform Price Comparison
+
+Same model on different inference platforms — prices can vary significantly.
+
+### Llama 4 Scout (10M context)
+
+| Platform      | Input $/Mtok | Output $/Mtok |
+| ------------- | -----------: | ------------: |
+| AIHubMix      |        0.061 |         0.183 |
+| Auriko        |         0.08 |          0.30 |
+| DeepInfra     |         0.08 |          0.30 |
+| Kluster AI    |         0.08 |          0.45 |
+| Meta (direct) |         0.17 |          0.66 |
+
+### Llama 4 Maverick (1M context)
+
+| Platform        | Input $/Mtok | Output $/Mtok |
+| --------------- | -----------: | ------------: |
+| AIHubMix        |         0.10 |          0.10 |
+| 接口 AI         |         0.10 |          0.50 |
+| AIHubMix (Groq) |         0.11 |          0.33 |
+| Cortecs         |        0.124 |         0.603 |
+| Auriko          |         0.15 |          0.60 |
+| Meta (direct)   |         0.24 |          0.97 |
+
+## Cheapest Models Overall
+
+The absolute cheapest per-token models across all providers.
+
+| Model               | Provider | Input $/Mtok | Output $/Mtok | Context |
+| ------------------- | -------- | -----------: | ------------: | ------: |
+| Ministral 3B        | Mistral  |         0.04 |          0.04 |    128K |
+| Voxtral Mini        | Mistral  |         0.04 |          0.04 |    128K |
+| Ministral 8B        | Mistral  |         0.10 |          0.10 |    128K |
+| Llama 3.2 1B        | Meta     |         0.10 |          0.10 |    128K |
+| GPT-4.1 Nano        | OpenAI   |         0.10 |          0.40 |      1M |
+| Gemini 1.5 Flash 8B | Google   |        0.075 |          0.30 |      1M |
+| DeepSeek-V4-Flash   | DeepSeek |         0.14 |          0.28 |      1M |
+
+---
+
+**Note**: All pricing from first-party sources as of data collection date. Inference platform prices may differ. Check `providers/<id>/models/` for current data. CNY and EUR pricing available in provider YAML files.
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+- [Free AI Models](free-models.md) — 81 free models
+- [Context Window Comparison](context-windows.md) — largest context windows
+- [Provider Overview](providers.md) — all 95 providers
+- [OpenAI Alternatives](openai-alternatives.md) — cheapest GPT-4 alternatives
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/provider-comparison.md b/docs/provider-comparison.md
new file mode 100644
index 00000000..22c13572
--- /dev/null
+++ b/docs/provider-comparison.md
@@ -0,0 +1,127 @@
+# Provider Comparison
+
+[中文](zh/provider-comparison.md)
+
+Side-by-side comparison of AI model providers — model count, capabilities, pricing, and context windows at a glance.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Top 30 Providers by Model Count
+
+| Provider       | Models | Free | Tool Call | Reasoning | Vision | Cheapest $/M | Capabilities |
+| -------------- | -----: | ---: | --------: | --------: | -----: | -----------: | ------------ |
+| nanogpt        |    547 |    0 |         0 |         0 |      0 |        $0.02 |              |
+| aihubmix       |    476 |    0 |       132 |        74 |    145 |        $0.00 | 🔧 🧠 👁️ 🎤  |
+| openrouter     |    356 |   29 |       263 |       190 |    160 |        $0.01 | 🔧 🧠 👁️ 🎤  |
+| martian        |    304 |    0 |         0 |         3 |      2 |        $0.02 | 🧠 👁️        |
+| requesty       |    277 |    0 |       251 |       139 |    151 |        $0.02 | 🔧 🧠 👁️     |
+| 302ai          |    268 |    0 |       190 |        44 |    144 |        $0.00 | 🔧 🧠 👁️ 🔓  |
+| auriko         |    181 |    5 |       154 |       108 |     93 |        $0.01 | 🔧 🧠 👁️ 🖼️  |
+| llmgateway     |    163 |    3 |       158 |        85 |     89 |        $0.03 | 🔧 🧠 👁️ 🖼️  |
+| aimlapi        |    147 |    2 |        21 |         0 |     14 |        $0.01 | 🔧 👁️        |
+| fastrouter     |    120 |    2 |        94 |        66 |     65 |        $0.02 | 🔧 🧠 👁️ 🎤  |
+| orcarouter     |    120 |    0 |       102 |        64 |    111 |        $0.05 | 🔧 🧠 👁️ 🔓  |
+| cortecs        |    105 |    0 |        97 |        82 |     52 |        $0.02 | 🔧 🧠 👁️ 🎤  |
+| novitaai       |    104 |    2 |        72 |        53 |     33 |        $0.02 | 🔧 🧠 👁️ 🎤  |
+| vultr          |     98 |    0 |        11 |        22 |     23 |        $0.55 | 🔧 🧠 👁️ 🎤  |
+| deepinfra      |     88 |    0 |         0 |        51 |     38 |        $0.01 | 🧠 👁️        |
+| venice         |     75 |    0 |        64 |        55 |     39 |        $0.05 | 🔧 🧠 👁️     |
+| jiekou         |     73 |    0 |        73 |         0 |     49 |        $0.03 | 🔧 👁️ 🔓     |
+| meganova       |     63 |    4 |        60 |         7 |     37 |        $0.02 | 🔧 🧠 👁️ 🔓  |
+| alibaba        |     62 |    0 |        62 |        52 |      0 |        $0.15 | 🔧 🧠        |
+| ppio           |     60 |    1 |        46 |        12 |     11 |        $0.21 | 🔧 🧠 👁️ 🔓  |
+| amazon-bedrock |     57 |    0 |        37 |         0 |     16 |        $0.04 | 🔧 👁️ 🎤 🎬  |
+| google-vertex  |     38 |    0 |        32 |         0 |     19 |        $0.07 | 🔧 👁️ 🎤 🎬  |
+| siliconflow-cn |     37 |    0 |         2 |         7 |      9 |        $0.50 | 🔧 🧠 👁️     |
+| stepfun        |     31 |   14 |         0 |         0 |     11 |        $0.70 | 👁️ 🎤 🖼️     |
+| cloudflare     |     30 |    0 |        15 |        10 |      7 |        $0.02 | 🔧 🧠 👁️ 🔓  |
+| gmicloud       |     29 |    0 |        11 |        10 |      0 |        $0.07 | 🔧 🧠 🔓     |
+| databricks     |     29 |    0 |         4 |         0 |     10 |        $0.05 | 🔧 👁️ 🔓     |
+| openai         |     28 |    5 |        18 |         8 |     12 |        $0.02 | 🔧 🧠 👁️ 🎤  |
+| siliconflow    |     27 |    0 |        24 |         2 |      3 |        $0.04 | 🔧 🧠 👁️ 🔓  |
+| togetherai     |     24 |    0 |        22 |         2 |      0 |        $0.03 | 🔧 🧠 🔓     |
+
+## Provider Categories
+
+### Aggregators (Multi-Provider Access)
+
+These providers offer access to models from multiple AI companies through a single API:
+
+| Provider   | Models | Notes                                           |
+| ---------- | -----: | ----------------------------------------------- |
+| openrouter |    356 | Largest model aggregator, OpenAI-compatible API |
+| requesty   |    277 | Smart routing across providers                  |
+| martian    |    304 | Multi-provider with load balancing              |
+| aihubmix   |    476 | Chinese market aggregator                       |
+| nanogpt    |    547 | Pay-per-token, no subscription                  |
+| llmgateway |    163 | Enterprise API gateway                          |
+| fastrouter |    120 | Fast model routing                              |
+| orcarouter |    120 | Multi-provider routing                          |
+
+### Direct Providers (First-Party APIs)
+
+| Provider  | Models | Specialty                          |
+| --------- | -----: | ---------------------------------- |
+| openai    |     28 | GPT-4.1, o3/o4 reasoning models    |
+| anthropic |     11 | Claude 4 family, best for agents   |
+| google    |     21 | Gemini 2.5, 1M+ context            |
+| deepseek  |      4 | DeepSeek R1, best open reasoning   |
+| meta      |     12 | Llama 4, open weights              |
+| mistral   |     16 | Mistral Large, Codestral           |
+| xai       |      6 | Grok 3, real-time data             |
+| alibaba   |     62 | Qwen 3, largest open-source family |
+
+### Infrastructure Providers (Hosted Open-Source)
+
+| Provider   | Models | Specialty                      |
+| ---------- | -----: | ------------------------------ |
+| groq       |     12 | Fastest inference (LPU)        |
+| cerebras   |     11 | Ultra-fast inference (CS-3)    |
+| togetherai |     24 | Serverless open-source hosting |
+| deepinfra  |     88 | Cost-effective inference       |
+| fireworks  |     10 | Serverless model hosting       |
+| cloudflare |     30 | Edge inference (Workers AI)    |
+
+### Regional Providers
+
+| Provider            | Models | Region           |
+| ------------------- | -----: | ---------------- |
+| siliconflow         |     27 | China            |
+| siliconflow-cn      |     37 | China (domestic) |
+| stepfun             |     31 | China            |
+| zhipuai             |     20 | China            |
+| baichuan            |     11 | China            |
+| baidu               |      8 | China            |
+| iflytek             |      6 | China            |
+| tencent             |     14 | China            |
+| ppio                |     60 | China            |
+| ovhcloud            |     12 | Europe (France)  |
+| scaleway            |     13 | Europe (France)  |
+| cloudferro-sherlock |     12 | Europe (EU)      |
+
+## Choosing a Provider
+
+| If you need...        | Best provider                  | Why                       |
+| --------------------- | ------------------------------ | ------------------------- |
+| **Cheapest prices**   | deepseek, google               | Input from $0.14/M tokens |
+| **Fastest inference** | groq, cerebras                 | Sub-100ms latency         |
+| **Largest context**   | google, meta                   | 1M-10M token context      |
+| **Most models**       | nanogpt, aihubmix              | 500+ models each          |
+| **Best for agents**   | anthropic, openai              | Tool calling + reasoning  |
+| **Open weights**      | meta, deepseek                 | Run on your own hardware  |
+| **EU data residency** | ovhcloud, scaleway, cloudferro | EU-hosted inference       |
+| **China access**      | siliconflow, ppio, stepfun     | China-based endpoints     |
+
+## Related Documentation
+
+- [Migration Guide](migration-guide.md) — switching providers with pricing comparison
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing across providers
+- [Providers Overview](providers.md) — all 95 providers listed
+- [Model Selection Guide](model-selection.md) — decision framework
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Chat Models](chat-models.md) — 2,350 models with tool calling
+- [Agentic Models](agentic-models.md) — 1,080 models with tool calling + reasoning
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/providers.md b/docs/providers.md
new file mode 100644
index 00000000..526b1379
--- /dev/null
+++ b/docs/providers.md
@@ -0,0 +1,172 @@
+**English** | [中文](./zh/providers.md)
+
+# Provider Overview
+
+A comprehensive overview of all 95 AI model providers in this catalog, organized by type.
+
+## Model Producers
+
+Providers that develop and produce their own AI models. Their APIs and documentation are the authoritative source for model data.
+
+| Provider                | ID            | Models | Key Models                         | API Format |
+| ----------------------- | ------------- | -----: | ---------------------------------- | ---------- |
+| 01.AI (零一万物)        | `01ai`        |      5 | Yi-Lightning, Yi-Vision            | OpenAI     |
+| AI21 Labs               | `ai21`        |      2 | Jamba 1.5                          | OpenAI     |
+| Alibaba Cloud (Bailian) | `alibaba`     |     62 | Qwen 3, Qwen 2.5                   | OpenAI     |
+| Amazon Nova             | `amazon`      |      7 | Nova Pro, Nova Lite                | OpenAI     |
+| Anthropic               | `anthropic`   |     11 | Claude Opus 4.7, Claude Sonnet 4.6 | Anthropic  |
+| ByteDance               | `bytedance`   |      5 | Doubao-Pro, Doubao-Lite            | OpenAI     |
+| Cloudflare Workers AI   | `cloudflare`  |     30 | Llama 3.3, Mistral                 | OpenAI     |
+| Cohere                  | `cohere`      |      — | Command R+, Embed 3                | OpenAI     |
+| DeepSeek                | `deepseek`    |      4 | DeepSeek-V4-Pro, DeepSeek-R1       | OpenAI     |
+| Google                  | `google`      |     21 | Gemini 3.5 Flash, Gemini 3.1 Pro   | Google     |
+| IBM Granite             | `ibm`         |      — | Granite 3.3                        | OpenAI     |
+| iFlytek SparkDesk       | `iflytek`     |      6 | SparkDesk 4.0 Ultra                | OpenAI     |
+| Inception Labs          | `inception`   |      5 | Mercury Coder                      | OpenAI     |
+| InclusionAI             | `inclusionai` |      3 | Book3R                             | OpenAI     |
+| Meta Llama              | `meta`        |     12 | Llama 4 Maverick, Llama 4 Scout    | OpenAI     |
+| Microsoft Phi           | `microsoft`   |     12 | Phi-4, Phi-4-Mini                  | OpenAI     |
+| MiniMax                 | `minimax`     |     21 | MiniMax-Text-01, MiniMax-M1        | OpenAI     |
+| Mistral AI              | `mistral`     |     16 | Mistral Large, Codestral           | OpenAI     |
+| Moonshot AI             | `moonshotai`  |     16 | Kimi K2.6, Kimi K2.5               | OpenAI     |
+| NVIDIA                  | `nvidia`      |      — | Nemotron Ultra                     | OpenAI     |
+| OpenAI                  | `openai`      |     28 | GPT-5.5, GPT-5.4, o3               | OpenAI     |
+| Perplexity              | `perplexity`  |      4 | Sonar, Sonar Pro                   | OpenAI     |
+| Reka AI                 | `reka`        |      2 | Reka Core, Reka Flash              | OpenAI     |
+| Sarvam AI               | `sarvam`      |      — | Sarvam-M                           | OpenAI     |
+| StepFun                 | `stepfun`     |     31 | Step-2, Step-1.5V                  | OpenAI     |
+| Tencent Hunyuan         | `tencent`     |     14 | Hunyuan-Turbos                     | OpenAI     |
+| Upstage                 | `upstage`     |      8 | Solar Pro, Solar Mini              | OpenAI     |
+| Voyage AI               | `voyage`      |     21 | Voyage 3, Voyage Code 3            | OpenAI     |
+| Writer                  | `writer`      |      6 | Palmyra X5                         | OpenAI     |
+| xAI Grok                | `xai`         |      6 | Grok 3, Grok 3 Mini                | OpenAI     |
+| Xiaomi                  | `xiaomi`      |      5 | MiMo                               | OpenAI     |
+| Zhipu AI (智谱)         | `zhipuai`     |     20 | GLM-4, GLM-Z1                      | OpenAI     |
+
+## Inference Platforms
+
+Providers that host and serve models produced by others. They offer their own per-token pricing and API access.
+
+| Provider               | ID                    | Models | Pricing Currency | API Format |
+| ---------------------- | --------------------- | -----: | ---------------- | ---------- |
+| 302.AI                 | `302ai`               |    268 | CNY              | OpenAI     |
+| AIHubMix               | `aihubmix`            |    476 | CNY              | OpenAI     |
+| AI/ML API              | `aimlapi`             |    147 | USD              | OpenAI     |
+| Aion Labs              | `aion`                |      5 | USD              | OpenAI     |
+| Arcee AI               | `arcee`               |      7 | USD              | OpenAI     |
+| Auriko                 | `auriko`              |    181 | USD              | OpenAI     |
+| Baseten                | `baseten`             |      9 | USD              | OpenAI     |
+| Berget                 | `berget`              |      7 | EUR              | OpenAI     |
+| Cerebras               | `cerebras`            |     11 | USD              | OpenAI     |
+| Chutes                 | `chutes`              |     12 | USD              | OpenAI     |
+| Clarifai               | `clarifai`            |     12 | USD              | OpenAI     |
+| CloudFerro Sherlock    | `cloudferro-sherlock` |     12 | EUR              | OpenAI     |
+| Cortecs                | `cortecs`             |    105 | USD              | OpenAI     |
+| Databricks             | `databricks`          |     29 | USD              | OpenAI     |
+| DeepInfra              | `deepinfra`           |     88 | USD              | OpenAI     |
+| DigitalOcean           | `digitalocean`        |     20 | USD              | OpenAI     |
+| DInference             | `dinference`          |      6 | CNY              | OpenAI     |
+| evroc                  | `evroc`               |      8 | EUR              | OpenAI     |
+| FastRouter             | `fastrouter`          |    120 | USD              | OpenAI     |
+| Fireworks AI           | `fireworks`           |     10 | USD              | OpenAI     |
+| FriendliAI             | `friendli`            |      8 | USD              | OpenAI     |
+| GMI Cloud              | `gmicloud`            |     29 | USD              | OpenAI     |
+| Google Vertex AI       | `google-vertex`       |     38 | USD              | Google     |
+| Groq                   | `groq`                |     12 | USD              | OpenAI     |
+| HPC-AI Cloud           | `hpc-ai`              |     11 | CNY              | OpenAI     |
+| Hyperbolic             | `hyperbolic`          |     11 | USD              | OpenAI     |
+| Inference.net          | `inferencenet`        |     20 | USD              | OpenAI     |
+| 接口 AI                | `jiekou`              |     73 | CNY              | OpenAI     |
+| Kluster AI             | `klusterai`           |     12 | USD              | OpenAI     |
+| LLM Gateway            | `llmgateway`          |    163 | USD              | OpenAI     |
+| Martian                | `martian`             |    304 | USD              | OpenAI     |
+| MegaNova               | `meganova`            |     63 | USD              | OpenAI     |
+| Mixlayer               | `mixlayer`            |      5 | USD              | OpenAI     |
+| MoArk AI               | `moark`               |      — | USD              | OpenAI     |
+| Morph                  | `morph`               |      7 | USD              | OpenAI     |
+| NanoGPT                | `nanogpt`             |    547 | USD              | OpenAI     |
+| Nebius                 | `nebius`              |     23 | USD              | OpenAI     |
+| NeuralWatt             | `neuralwatt`          |     14 | USD              | OpenAI     |
+| Nous Research          | `nousresearch`        |      7 | USD              | OpenAI     |
+| Novita AI              | `novitaai`            |    104 | USD              | OpenAI     |
+| OrcaRouter             | `orcarouter`          |    120 | USD              | OpenAI     |
+| OVHcloud AI Endpoints  | `ovhcloud`            |     12 | EUR              | OpenAI     |
+| PPIO                   | `ppio`                |     60 | CNY              | OpenAI     |
+| Privatemode AI         | `privatemode`         |      5 | EUR              | OpenAI     |
+| Qiniu AI               | `qiniu-ai`            |      — | CNY              | OpenAI     |
+| Regolo                 | `regolo`              |      — | EUR              | OpenAI     |
+| Requesty               | `requesty`            |    277 | USD              | OpenAI     |
+| SambaNova              | `sambanova`           |      7 | USD              | OpenAI     |
+| Scaleway               | `scaleway`            |     13 | EUR              | OpenAI     |
+| SiliconFlow            | `siliconflow`         |     27 | USD              | OpenAI     |
+| SiliconFlow CN         | `siliconflow-cn`      |     37 | CNY              | OpenAI     |
+| SubModel               | `submodel`            |      6 | USD              | OpenAI     |
+| Tencent Cloud TokenHub | `tencent-tokenhub`    |     19 | CNY              | OpenAI     |
+| TextSynth              | `textsynth`           |      6 | USD              | OpenAI     |
+| Together AI            | `togetherai`          |     24 | USD              | OpenAI     |
+| Venice AI              | `venice`              |     75 | USD              | OpenAI     |
+| Vultr Cloud Inference  | `vultr`               |     98 | USD              | OpenAI     |
+| Wafer                  | `wafer`               |      2 | USD              | OpenAI     |
+
+## Cloud Provider Hosted Services
+
+Major cloud providers offering hosted AI model services.
+
+| Provider             | ID               | Models | Cloud Platform |
+| -------------------- | ---------------- | -----: | -------------- |
+| Amazon Bedrock       | `amazon-bedrock` |     57 | AWS            |
+| Azure OpenAI Service | `azure`          |      — | Azure          |
+| Google Vertex AI     | `google-vertex`  |     38 | GCP            |
+
+## Chinese Market Providers
+
+Providers primarily serving the Chinese market with CNY pricing.
+
+| Provider                | ID                 | Models |
+| ----------------------- | ------------------ | -----: |
+| 302.AI                  | `302ai`            |    268 |
+| AIHubMix                | `aihubmix`         |    476 |
+| Alibaba Cloud (Bailian) | `alibaba`          |     62 |
+| Baichuan AI             | `baichuan`         |     11 |
+| Baidu                   | `baidu`            |      8 |
+| ByteDance               | `bytedance`        |      5 |
+| DInference              | `dinference`       |      6 |
+| HPC-AI Cloud            | `hpc-ai`           |     11 |
+| iFlytek SparkDesk       | `iflytek`          |      6 |
+| 接口 AI                 | `jiekou`           |     73 |
+| MiniMax                 | `minimax`          |     21 |
+| Moonshot AI             | `moonshotai`       |     16 |
+| PPIO                    | `ppio`             |     60 |
+| Qiniu AI                | `qiniu-ai`         |      — |
+| SiliconFlow CN          | `siliconflow-cn`   |     37 |
+| StepFun                 | `stepfun`          |     31 |
+| Tencent Cloud TokenHub  | `tencent-tokenhub` |     19 |
+| Tencent Hunyuan         | `tencent`          |     14 |
+| Xiaomi                  | `xiaomi`           |      5 |
+| Zhipu AI (智谱)         | `zhipuai`          |     20 |
+
+## European Market Providers
+
+Providers with EUR pricing, serving the European market.
+
+| Provider              | ID                    | Models |
+| --------------------- | --------------------- | -----: |
+| Berget                | `berget`              |      7 |
+| CloudFerro Sherlock   | `cloudferro-sherlock` |     12 |
+| evroc                 | `evroc`               |      8 |
+| OVHcloud AI Endpoints | `ovhcloud`            |     12 |
+| Privatemode AI        | `privatemode`         |      5 |
+| Regolo                | `regolo`              |      — |
+| Scaleway              | `scaleway`            |     13 |
+
+## Related Documentation
+
+- [Model Comparison](model-comparison.md) — flagship, cost-effective, free models
+- [Pricing Comparison](pricing-comparison.md) — side-by-side pricing
+- [Open-Weight Models](open-weights.md) — 527 models you can run yourself
+- [Free AI Models](free-models.md) — 81 free models
+- [Data Schema](data-schema.md) — complete YAML schema
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/quick-start.md b/docs/quick-start.md
new file mode 100644
index 00000000..b645b839
--- /dev/null
+++ b/docs/quick-start.md
@@ -0,0 +1,142 @@
+**English** | [中文](./zh/quick-start.md)
+
+# Quick Start Guide
+
+Find the right AI model for your needs in 30 seconds.
+
+## I want to find the cheapest model
+
+→ See [Pricing Comparison](pricing-comparison.md) for the cheapest models per provider and cross-platform price comparisons.
+
+**Cheapest models with tool calling:**
+
+| Model            | Provider      | Input (per 1M tokens) | Output (per 1M tokens) |
+| ---------------- | ------------- | --------------------: | ---------------------: |
+| DeepSeek-V3      | DeepSeek      |                 $0.27 |                  $1.10 |
+| Qwen3-235B-A22B  | Alibaba Cloud |                 $0.14 |                  $0.42 |
+| Llama 4 Maverick | Together AI   |                 $0.20 |                  $0.80 |
+
+## I want the most capable model
+
+→ See [Model Comparison](model-comparison.md) for flagship model comparisons.
+
+**Top-tier flagships:**
+
+| Model          | Context | Tool Call | Vision | Input $/1M | Output $/1M |
+| -------------- | ------- | --------- | ------ | ---------: | ----------: |
+| GPT-4.1        | 1M      | ✅        | ✅     |      $2.00 |       $8.00 |
+| Claude Opus 4  | 200K    | ✅        | ✅     |     $15.00 |      $75.00 |
+| Gemini 2.5 Pro | 1M      | ✅        | ✅     |      $1.25 |      $10.00 |
+| DeepSeek-R1    | 128K    | ✅        | ❌     |      $0.55 |       $2.19 |
+
+## I want a free model
+
+→ See [Model Comparison](model-comparison.md#free-models) for the full list.
+
+**Free models with tool calling:**
+
+- Google Gemini 2.0 Flash (via Google AI Studio)
+- Cloudflare Workers AI models (edge inference)
+- Various models on Chutes, Cerebras, Groq free tiers
+
+## I want the largest context window
+
+→ See [Model Comparison](model-comparison.md#largest-context-windows) for the full list.
+
+| Model           | Context Window |
+| --------------- | -------------: |
+| Llama 4 Scout   |     10M tokens |
+| Gemini 2.5 Pro  |      1M tokens |
+| GPT-4.1         |     ~1M tokens |
+| Claude Sonnet 4 |    200K tokens |
+
+## I want to browse all providers
+
+→ See [Provider Overview](providers.md) for all 95 providers organized by type.
+
+## I want to use the data programmatically
+
+### npm package
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 models as JSON
+import type { Model } from "ai-models"; // TypeScript types
+```
+
+### Download data files
+
+```bash
+# JSON — full metadata (2.3 MB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — flat table for Excel/Google Sheets (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+```
+
+### CDN access (no install)
+
+The compiled JSON is available via [jsDelivr CDN](https://www.jsdelivr.com/package/npm/ai-models) — no download or install needed:
+
+```bash
+# Always up-to-date, CORS-enabled, works in browsers
+curl -s https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+```
+
+```html
+<script type="module">
+  const catalog = await fetch(
+    "https://github.com/i-need-token/ai-models/releases/latest/download/models.json",
+  ).then((r) => r.json());
+  console.log(catalog.models.length);
+</script>
+```
+
+### From source
+
+```bash
+# Install dependencies
+npm install
+
+# Compute catalog statistics
+npx tsx scripts/stats.ts
+
+# Validate all model data
+npx tsx scripts/validate.ts
+```
+
+```typescript
+import { ModelSchema } from "./types/schemas";
+import { parse } from "yaml";
+import { readFileSync } from "fs";
+
+// Load and validate a model
+const raw = readFileSync("providers/openai/models/gpt-4.1.yaml", "utf-8");
+const model = ModelSchema.parse(parse(raw));
+
+console.log(model.pricing); // { input: 2, output: 8, cache_read: 0.5 }
+console.log(model.limit); // { context: 1047576, output: 32768 }
+```
+
+## I want to add a new provider
+
+→ See [Contributing Guide](../CONTRIBUTING.md) and [Data Acquisition Guide](data-acquisition.md).
+
+## I want to understand the data format
+
+→ See [Data Schema Reference](data-schema.md) for the complete YAML schema.
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [FAQ](faq.md) — common questions about the catalog
+- [API & Programmatic Access](api.md) — download and use the data
+- [Code Examples](code-examples.md) — practical examples in TypeScript, Python, Go, Rust
+- [Glossary](glossary.md) — key terms and definitions
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/reasoning-models.md b/docs/reasoning-models.md
new file mode 100644
index 00000000..8703ba33
--- /dev/null
+++ b/docs/reasoning-models.md
@@ -0,0 +1,104 @@
+**English** | [中文](./zh/reasoning-models.md)
+
+# AI Reasoning Models
+
+1,306 models in this catalog support reasoning (chain-of-thought / extended thinking). This page highlights the most capable and cost-effective reasoning models available.
+
+> All data sourced from first-party APIs and documentation. "Reasoning" means the model can produce extended chain-of-thought before answering.
+
+## Quick Stats
+
+| Capability                | Reasoning Models |
+| ------------------------- | ---------------: |
+| Total reasoning models    |            1,306 |
+| Unique model IDs          |              868 |
+| With tool calling         |            1,076 |
+| With vision (image input) |              697 |
+| Open-weight               |              119 |
+
+## Top Reasoning Models by Context
+
+The largest-context reasoning models — ideal for complex, multi-step tasks:
+
+| Model                         | Context | Tool Call | Vision | Input $/1M | Providers |
+| ----------------------------- | ------- | --------- | ------ | ---------: | --------: |
+| Grok 4 Fast Reasoning         | 2M      | ✅        | ✅     |      $0.20 |         2 |
+| Grok 4.1 Fast Reasoning       | 2M      | ✅        | ✅     |      $0.20 |         2 |
+| Grok 4.20                     | 2M      | ✅        | ✅     |      $1.42 |         1 |
+| GPT-5.4                       | 1M      | ✅        | ✅     |      $2.50 |         4 |
+| GPT-5.5                       | 1M      | ✅        | ✅     |      $5.00 |         4 |
+| Gemini 2.5 Pro                | 1M      | ✅        | ✅     |      $1.25 |         4 |
+| Gemini 2.5 Flash              | 1M      | ✅        | ✅     |      $0.15 |         3 |
+| Gemini 2.5 Flash Lite         | 1M      | ✅        | ✅     |      $0.10 |         3 |
+| Gemini 3 Flash Preview        | 1M      | ✅        | ✅     |      $0.50 |         4 |
+| Gemini 3.1 Flash Lite Preview | 1M      | ✅        | ✅     |      $0.25 |         3 |
+| DeepSeek Reasoner             | 1M      | ✅        | ✅     |      $0.43 |         1 |
+
+## Cheapest Reasoning Models
+
+Best value for reasoning capability:
+
+| Model                 | Provider  | Input $/1M | Output $/1M | Context |
+| --------------------- | --------- | ---------: | ----------: | ------- |
+| Qwen 3.5 0.8B         | Auriko    |      $0.01 |       $0.05 | 262K    |
+| Qwen 3.5 0.8B         | DeepInfra |      $0.01 |       $0.05 | 262K    |
+| Qwen 3.5 2B           | Auriko    |      $0.02 |       $0.10 | 262K    |
+| Qwen 3.5 2B           | DeepInfra |      $0.02 |       $0.10 | 262K    |
+| GPT-5 Nano            | Requesty  |     $0.025 |       $0.20 | 400K    |
+| Qwen 3.5 4B           | Auriko    |      $0.03 |       $0.15 | 262K    |
+| Qwen 3.5 4B           | DeepInfra |      $0.03 |       $0.15 | 262K    |
+| Gemini 2.5 Flash Lite | Google    |      $0.10 |       $0.60 | 1M      |
+| Gemini 2.5 Flash      | Google    |      $0.15 |       $0.60 | 1M      |
+| Grok 4 Fast Reasoning | xAI       |      $0.20 |       $0.50 | 2M      |
+
+## Best Reasoning + Vision Models
+
+Models that can reason about images — ideal for visual analysis:
+
+| Model                   | Context | Input $/1M | Providers |
+| ----------------------- | ------- | ---------: | --------: |
+| Grok 4 Fast Reasoning   | 2M      |      $0.20 |         2 |
+| Gemini 2.5 Flash        | 1M      |      $0.15 |         3 |
+| Gemini 2.5 Pro          | 1M      |      $1.25 |         4 |
+| GPT-5.4                 | 1M      |      $2.50 |         4 |
+| DeepSeek Reasoner       | 1M      |      $0.43 |         1 |
+| MiMo V2.5 (open-weight) | 1M      |     varies |         2 |
+
+## Open-Weight Reasoning Models
+
+119 open-weight models support reasoning — run them on your own hardware:
+
+| Model                   | Context | Tool Call | Vision | Providers |
+| ----------------------- | ------- | --------- | ------ | --------: |
+| MiMo V2.5 Pro           | 1M      | ✅        | ❌     |         2 |
+| MiMo V2.5               | 1M      | ✅        | ✅     |         2 |
+| DeepSeek-V4 Pro         | 1M      | ✅        | ❌     |         1 |
+| Qwen3 Next 80B Thinking | 262K    | ✅        | ❌     |         4 |
+| Kimi K2.6               | 262K    | ✅        | ✅     |         4 |
+| Trinity Large Thinking  | 262K    | ✅        | ❌     |         1 |
+| Nemotron 3 120B         | 262K    | ✅        | ❌     |         1 |
+| Qwen3.5 397B A17B       | 262K    | ✅        | ❌     |         2 |
+
+## Key Takeaways
+
+- **1,306 reasoning models** across 868 unique IDs — the largest reasoning model catalog available
+- **Grok 4 Fast Reasoning** offers the best value at 2M context for $0.20/1M input
+- **Gemini 2.5 Flash Lite** is the cheapest 1M-context reasoning model at $0.10/1M
+- **MiMo V2.5** is the only open-weight model combining 1M context, reasoning, and vision
+- **697 reasoning models** also support vision — the most common combined capability
+- Small reasoning models (Qwen 3.5 0.8B–4B) cost as little as $0.01–$0.03/1M tokens
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Tool Calling Models](tool-calling.md) — 2,350 models with tool calling
+- [Structured Output](structured-output.md) — 829 JSON-mode models
+- [Free AI Models](free-models.md) — 81 free models, some with reasoning
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4 class alternatives with reasoning
+- [Agentic Models](agentic-models.md) — 1,080 models with tool_call + reasoning for agents
+- [Code Models](code-models.md) — 189 code-focused models
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/small-language-models.md b/docs/small-language-models.md
new file mode 100644
index 00000000..accd9328
--- /dev/null
+++ b/docs/small-language-models.md
@@ -0,0 +1,126 @@
+# Small Language Models (SLM) Guide
+
+> Complete guide to 2,000+ small language models for edge deployment, mobile apps, and cost-efficient production.
+
+## What Are Small Language Models?
+
+Small Language Models (SLMs) are AI models with fewer than ~10 billion parameters, designed for efficiency, low latency, and deployment on resource-constrained hardware. They offer a practical alternative to large frontier models when cost, speed, or privacy matters.
+
+### Key Advantages
+
+| Factor                | Small Model (SLM)      | Large Model (LLM)          |
+| --------------------- | ---------------------- | -------------------------- |
+| Cost per 1M tokens    | $0.01 – $0.20          | $1 – $40                   |
+| Latency (first token) | 50 – 200ms             | 200 – 2000ms               |
+| Deployment            | On-device, edge, cloud | Cloud only                 |
+| Privacy               | Data stays on device   | Data sent to cloud         |
+| Customization         | Easy fine-tuning       | Expensive fine-tuning      |
+| Complex reasoning     | Good for simple tasks  | Superior for complex tasks |
+
+## Quick Stats
+
+| Metric                | Count |
+| --------------------- | ----- |
+| Total small models    | 2,002 |
+| With tool calling     | 928   |
+| With reasoning        | 557   |
+| Free SLMs             | 48    |
+| First-party providers | 689   |
+
+## Best SLMs by Use Case
+
+### AI Agents on a Budget
+
+Need tool calling + reasoning + low latency for high-volume agent workflows.
+
+- **Best value**: ling-2.6-flash ($0.01/$0.03/M) — cheapest tool-calling model with 262K context
+- **Balanced**: GPT-4.1-mini ($0.40/$1.60/M) — reliable + 1M context
+- **Free**: Gemma 4 27B IT — free vision + tool calling
+
+### On-Device / Edge Deployment
+
+Need models that run on smartphones, IoT devices, or edge servers.
+
+- **Ultra-compact**: Qwen3.5 0.8B — reasoning in a tiny package
+- **Balanced**: Qwen3 4B ($0.03/$0.15/M) — open-source with reasoning
+- **Vision**: Gemma 4 27B IT — free with vision + tool calling
+
+### Code Completion
+
+Need tool calling + structured output for coding assistance.
+
+- **Cheapest**: bdc-coder ($0.01/$0.01/M) — cheapest coding model
+- **Balanced**: GPT-4.1-nano ($0.10/$0.40/M) — fast + cheap
+- **Open-source**: Qwen3 4B ($0.03/$0.15/M) — reasoning + tool calling
+
+### Math & Reasoning
+
+Need reasoning capability for step-by-step problem solving.
+
+- **Free**: DeepSeek R1 Distill Llama 8B — free reasoning model
+- **Cheapest**: Qwen3.5 0.8B ($0.01/$0.05/M) — cheapest reasoning
+- **Balanced**: Qwen3.5 4B ($0.03/$0.15/M) — open-source reasoning
+
+### Chat & RAG
+
+Need large context + low cost for retrieval-augmented generation.
+
+- **Cheapest**: Qwen3 4B ($0.03/$0.15/M) — cheap + 262K context
+- **Fast**: GPT-4.1-nano ($0.10/$0.40/M) — fast + cheap
+- **Large context**: Gemini 2.5 Flash ($0.15/$0.60/M) — 1M context + reasoning
+
+## Cheapest Small Models with Tool Calling
+
+| Model                                       | Provider  | Input $/M | Output $/M | Context | Reasoning |
+| ------------------------------------------- | --------- | --------- | ---------- | ------- | --------- |
+| ling-2.6-flash                              | ling      | $0.01     | $0.03      | 262K    | —         |
+| klusterai--Meta-Llama-3.1-8B-Instruct-Turbo | klusterai | $0.015    | $0.02      | 131K    | —         |
+| granite-4.0-h-micro                         | ibm       | $0.017    | $0.112     | 131K    | —         |
+| llama-3.1-8b-instruct--fp-16                | fireworks | $0.02     | $0.03      | 131K    | —         |
+| schematron-3b                               | fireworks | $0.02     | $0.05      | 131K    | —         |
+
+## Free Small Language Models
+
+48 small models available at zero cost — perfect for prototyping and development:
+
+| Model                          | Provider | Context | Tool Calling | Reasoning |
+| ------------------------------ | -------- | ------- | ------------ | --------- |
+| deepseek-r1-distill-llama-8b   | cerebras | 131K    | —            | ✓         |
+| llama-4-scout-17b-16e-instruct | cerebras | 131K    | ✓            | —         |
+| qwen-2.5-32b                   | cerebras | 131K    | ✓            | —         |
+| gemma-4-26b-a4b-it             | auriko   | 262K    | ✓            | —         |
+| glm-4.5-flash                  | auriko   | 200K    | ✓            | —         |
+
+## Small Models with Reasoning
+
+557 small models with reasoning capabilities:
+
+| Model                        | Provider  | Input $/M | Output $/M | Context | Tool Calling |
+| ---------------------------- | --------- | --------- | ---------- | ------- | ------------ |
+| qwen3.5-0.8b                 | qwen      | $0.01     | $0.05      | 262K    | —            |
+| qwen3.5-2b                   | qwen      | $0.02     | $0.10      | 262K    | —            |
+| qwen--qwen3-4b-fp8           | fireworks | $0.03     | $0.03      | 128K    | —            |
+| qwen3.5-4b                   | qwen      | $0.03     | $0.15      | 262K    | —            |
+| deepseek-r1-distill-llama-8b | cerebras  | Free      | Free       | 131K    | —            |
+
+## How to Choose the Right SLM
+
+1. **Define your constraints**: Budget, latency, deployment target (cloud vs edge)
+2. **Identify required capabilities**: Tool calling? Reasoning? Vision? Structured output?
+3. **Check context window**: How much text do you need to process?
+4. **Compare pricing**: Use the [interactive catalog](https://i-need-token.github.io/ai-models/) or [pricing calculator](https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html)
+5. **Test with your data**: Small models vary significantly in quality for specific domains
+
+## Related Documentation
+
+- [Free Models Guide](free-models.md) — all 81 free models
+- [Tool Calling Guide](tool-calling.md) — 2,350 models with tool calling
+- [Reasoning Models Guide](reasoning-models.md) — 1,306 reasoning models
+- [Pricing Comparison](pricing-comparison.md) — find the cheapest model
+- [Context Windows](context-windows.md) — largest context windows
+- [Model Selection Cheatsheet](model-selection-cheatsheet.md) — quick-reference guide
+- [Small Language Models Comparison](https://i-need-token.github.io/ai-models/small-language-models.html) — interactive SEO page
+
+---
+
+_Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — first-party data only, updated automatically._
diff --git a/docs/small-models.md b/docs/small-models.md
new file mode 100644
index 00000000..ec3cc772
--- /dev/null
+++ b/docs/small-models.md
@@ -0,0 +1,80 @@
+# Small & Edge Models
+
+[中文](zh/small-models.md)
+
+AI models designed for **edge deployment, on-device inference, and resource-constrained environments** — models under ~16B parameters that can run on consumer hardware, mobile devices, and embedded systems.
+
+Data sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Why Small Models Matter
+
+Small models enable AI where cloud connectivity is limited or latency is critical:
+
+- **On-device inference** — run AI without internet, on phones and laptops
+- **Edge computing** — deploy in IoT devices, robotics, and vehicles
+- **Low latency** — sub-100ms response times for real-time applications
+- **Cost efficiency** — cheaper to run, especially at scale
+- **Privacy** — data never leaves the device
+- **Offline capability** — AI that works without connectivity
+
+## Stats
+
+| Metric                   | Count |
+| ------------------------ | ----- |
+| Small/edge models        | 1153  |
+| Providers                | 63    |
+| Free small models        | 30    |
+| Open-weight small models | 272   |
+| With tool calling        | 434   |
+| With reasoning           | 250   |
+
+## Providers
+
+`302ai`, `aihubmix`, `aimlapi`, `aion`, `alibaba`, `amazon-bedrock`, `auriko`, `baichuan`, `berget`, `bytedance`, `cerebras`, `chutes`, `clarifai`, `cloudferro-sherlock`, `cloudflare`, `cortecs`, `databricks`, `deepinfra`, `digitalocean`, `evroc`, `fastrouter`, `fireworks`, `friendli`, `gmicloud`, `google`, `google-vertex`, `groq`, `hpc-ai`, `hyperbolic`, `inferencenet`, `jiekou`, `klusterai`, `llmgateway`, `martian`, `meganova`, `meta`, `microsoft`, `mistral`, `mixlayer`, `moonshotai`, `morph`, `nanogpt`, `nebius`, `neuralwatt`, `nousresearch`, `novitaai`, `openrouter`, `orcarouter`, `ovhcloud`, `ppio`, `privatemode`, `requesty`, `sambanova`, `scaleway`, `siliconflow`, `siliconflow-cn`, `submodel`, `tencent`, `textsynth`, `togetherai`, `venice`, `vultr`, `wafer`
+
+## Free Small Models
+
+Free small models — zero-cost edge AI.
+
+| Model                                                | Provider   | Context | Input $/M | Output $/M | Capabilities |
+| ---------------------------------------------------- | ---------- | ------- | --------- | ---------- | ------------ |
+| nvidia--nemotron-3-super-120b-a12b--free             | openrouter | 1M      | Free      | Free       | 🔧 🧠 📋     |
+| google--gemma-4-26b-a4b-it--free                     | openrouter | 262K    | Free      | Free       | 🔧 🧠 📋     |
+| google--gemma-4-31b-it--free                         | openrouter | 262K    | Free      | Free       | 🔧 🧠 📋     |
+| gemma-4-26b-a4b-it                                   | auriko     | 262K    | Free      | Free       | 🔧 🧠 📋     |
+| gemma-4-31b-it                                       | auriko     | 262K    | Free      | Free       | 🔧 🧠 📋     |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter | 256K    | Free      | Free       | 🔧 🧠        |
+| gemma-3-4b-it                                        | google     | 131K    | Free      | Free       |              |
+| gemma-3-12b-it                                       | google     | 131K    | Free      | Free       |              |
+| gemma-3-27b-it                                       | google     | 131K    | Free      | Free       |              |
+| gemma-3n-E2B-it                                      | google     | 131K    | Free      | Free       |              |
+
+## Cheapest Small Models
+
+Best value small models for production.
+
+| Model                                           | Provider | Context | Input $/M | Output $/M | Capabilities |
+| ----------------------------------------------- | -------- | ------- | --------- | ---------- | ------------ |
+| llama3-groq-8b-8192-tool-use-preview            | aihubmix | 0       | $9.5e-05  | $9.5e-05   |              |
+| mistralai--mistral-7b-instruct--free            | aihubmix | 0       | $0.001    | $0.001     |              |
+| deepseek-ai--deepseek-r1-distill-llama-8b       | aihubmix | 0       | $0.005    | $0.005     |              |
+| deepseek-ai--deepseek-r1-distill-qwen-7b        | aihubmix | 0       | $0.005    | $0.005     |              |
+| deepseek-ai--deepseek-r1-distill-qwen-1.5b      | aihubmix | 0       | $0.005    | $0.005     |              |
+| ernie-4.5-0.3b                                  | aihubmix | 0       | $0.0068   | $0.0272    | 🔧 📋        |
+| google--gemma-2-9b-it--free                     | aihubmix | 0       | $0.01     | $0.01      |              |
+| meta-llama--llama-3.2-3b-instruct--free         | aihubmix | 0       | $0.01     | $0.01      |              |
+| meta-llama--llama-3.2-11b-vision-instruct--free | aihubmix | 0       | $0.01     | $0.01      |              |
+| meta-llama--llama-3.1-8b-instruct--free         | aihubmix | 0       | $0.01     | $0.01      |              |
+
+## Related Documentation
+
+- [Open Weights](open-weights.md) — 527 open-weight models
+- [Free AI Models](free-models.md) — 81 free models by capability
+- [Chat Models](chat-models.md) — 2,350 models with tool calling
+- [Code Models](code-models.md) — 189 code-focused models
+- [Model Selection Guide](model-selection.md) — decision framework
+- [Provider Comparison](provider-comparison.md) — top 30 providers
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/structured-output.md b/docs/structured-output.md
new file mode 100644
index 00000000..efabf5a6
--- /dev/null
+++ b/docs/structured-output.md
@@ -0,0 +1,84 @@
+**English** | [中文](./zh/structured-output.md)
+
+# AI Structured Output Models (JSON Mode)
+
+829 models in this catalog support structured output — the ability to generate responses that conform to a specified JSON schema. This is essential for building reliable AI-powered APIs, data pipelines, and automation.
+
+> All data sourced from first-party APIs and documentation. "Structured output" means the model can enforce a JSON schema on its response (also known as JSON mode, constrained decoding, or guided generation).
+
+## Quick Stats
+
+| Capability                     | Structured Output Models |
+| ------------------------------ | -----------------------: |
+| Total structured output models |                      829 |
+| Unique model IDs               |                      704 |
+| With tool calling              |                      749 |
+| With reasoning                 |                      473 |
+| With vision                    |                      411 |
+| Open-weight                    |                       24 |
+
+## Cheapest Structured Output Models
+
+Best value for generating reliable JSON responses:
+
+| Model                 | Provider   | Input $/1M | Output $/1M | Context | Tool Call | Reasoning |
+| --------------------- | ---------- | ---------: | ----------: | ------- | --------- | --------- |
+| Ernie 4.5 0.3B        | AIHubMix   |    $0.0068 |     $0.0272 | —       | ✅        | ❌        |
+| Ling 2.6 Flash        | OpenRouter |      $0.01 |       $0.03 | 262K    | ✅        | ❌        |
+| Qwen3 VL Flash        | AIHubMix   |    $0.0103 |      $0.103 | —       | ✅        | ❌        |
+| Llama 3.1 8B Instruct | Auriko     |      $0.02 |       $0.03 | 131K    | ✅        | ❌        |
+| Mistral Nemo          | OpenRouter |      $0.02 |       $0.02 | —       | ✅        | ❌        |
+| Doubao Seed 1.6 Flash | AIHubMix   |     $0.022 |      $0.022 | —       | ✅        | ❌        |
+| GPT-5 Nano            | AIHubMix   |     $0.025 |       $0.20 | —       | ✅        | ✅        |
+| GPT-OSS 20B           | NeuralWatt |      $0.03 |       $0.03 | —       | ✅        | ✅        |
+| Granite 4.0 H Micro   | Cloudflare |     $0.017 |      $0.112 | 131K    | ✅        | ❌        |
+| Gemini 2.5 Flash Lite | Google     |      $0.10 |       $0.60 | 1M      | ✅        | ✅        |
+
+## Free Structured Output Models
+
+24 models offer free structured output — ideal for prototyping:
+
+| Model                     | Provider   | Context | Tool Call | Reasoning |
+| ------------------------- | ---------- | ------- | --------- | --------- |
+| Ernie 4.5 0.3B            | AIMLAPI    | —       | ✅        | ❌        |
+| Gemma 4 26B A4B IT        | Auriko     | —       | ✅        | ✅        |
+| Gemma 4 31B IT            | Auriko     | —       | ✅        | ❌        |
+| Qwen3 Omni 30B A3B        | NovitaAI   | —       | ✅        | ✅        |
+| Dolphin Mistral 24B       | OpenRouter | —       | ✅        | ❌        |
+| Gemma 4 26B A4B IT (free) | OpenRouter | —       | ✅        | ✅        |
+| Gemma 4 31B IT (free)     | OpenRouter | —       | ✅        | ❌        |
+
+## Best Structured Output + Tool Calling + Reasoning
+
+For AI agents that need to return structured data, call tools, and reason:
+
+| Model                 | Context | Input $/1M | Tool Call | Reasoning | Providers |
+| --------------------- | ------- | ---------: | --------- | --------- | --------: |
+| Grok 4 Fast Reasoning | 2M      |      $0.20 | ✅        | ✅        |         2 |
+| Gemini 2.5 Flash      | 1M      |      $0.15 | ✅        | ✅        |         3 |
+| Gemini 2.5 Pro        | 1M      |      $1.25 | ✅        | ✅        |         4 |
+| GPT-5.4               | 1M      |      $2.50 | ✅        | ✅        |         4 |
+| DeepSeek Reasoner     | 1M      |      $0.43 | ✅        | ✅        |         1 |
+| GPT-5 Nano            | —       |     $0.025 | ✅        | ✅        |         4 |
+
+## Key Takeaways
+
+- **829 structured output models** — the largest catalog of JSON-mode models
+- **749 models** combine structured output with tool calling — perfect for AI agents
+- **24 free models** support structured output — start building at zero cost
+- **Gemini 2.5 Flash** is the best value: 1M context, structured output, tool calling, and reasoning for $0.15/1M
+- Small models (Ernie 4.5 0.3B, Ling 2.6 Flash) cost as little as $0.01/1M with structured output
+- 91% of structured output models also support tool calling — these capabilities go hand-in-hand
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Tool Calling Models](tool-calling.md) — 2,350 models with tool calling
+- [Reasoning Models](reasoning-models.md) — 1,306 models with reasoning
+- [Free AI Models](free-models.md) — 81 free models, some with structured output
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+- [Agentic Models](agentic-models.md) — 1,080 models with tool_call + reasoning for agents
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/tool-calling.md b/docs/tool-calling.md
new file mode 100644
index 00000000..2b70a89d
--- /dev/null
+++ b/docs/tool-calling.md
@@ -0,0 +1,102 @@
+**English** | [中文](./zh/tool-calling.md)
+
+# AI Tool Calling Models
+
+2,350 models in this catalog support tool calling (function calling). This page highlights the most capable and cost-effective models for building AI agents and automation.
+
+> All data sourced from first-party APIs and documentation. "Tool calling" means the model can invoke external functions/tools as part of its response.
+
+## Quick Stats
+
+| Capability                | Tool-Calling Models |
+| ------------------------- | ------------------: |
+| Total tool-calling models |               2,350 |
+| Unique model IDs          |               1,540 |
+| With reasoning            |               1,076 |
+| With vision (image input) |               1,063 |
+| With structured output    |                 829 |
+| Open-weight               |                 270 |
+
+## Cheapest Tool-Calling Models
+
+Best value for building AI agents:
+
+| Model                      | Provider     | Input $/1M | Output $/1M | Context | Reasoning |
+| -------------------------- | ------------ | ---------: | ----------: | ------- | --------- |
+| GLM-4-Flash                | 302AI        |    $0.0014 |     $0.0014 | 131K    | ❌        |
+| Mistral-Nemo-Instruct-2407 | KlusterAI    |     $0.008 |      $0.001 | 131K    | ❌        |
+| BDC-Coder                  | InferenceNet |      $0.01 |       $0.01 | 131K    | ❌        |
+| Qwen 3.5 0.8B              | Auriko       |      $0.01 |       $0.05 | 262K    | ✅        |
+| Qwen 3.5 0.8B              | DeepInfra    |      $0.01 |       $0.05 | 262K    | ✅        |
+| Qwen 3.5 2B                | Auriko       |      $0.02 |       $0.10 | 262K    | ✅        |
+| Qwen 3.5 2B                | DeepInfra    |      $0.02 |       $0.10 | 262K    | ✅        |
+| GPT-5 Nano                 | Requesty     |     $0.025 |       $0.20 | 400K    | ✅        |
+| Gemini 2.5 Flash Lite      | Google       |      $0.10 |       $0.60 | 1M      | ✅        |
+| Gemini 2.5 Flash           | Google       |      $0.15 |       $0.60 | 1M      | ✅        |
+| Grok 4 Fast Reasoning      | xAI          |      $0.20 |       $0.50 | 2M      | ✅        |
+
+## Largest Context Tool-Calling Models
+
+For agents that need to process large documents or long conversation histories:
+
+| Model                 | Context | Input $/1M | Reasoning | Providers |
+| --------------------- | ------- | ---------: | --------- | --------: |
+| Llama 4 Scout         | 10M     |      $0.08 | ❌        |         4 |
+| Grok 4 Fast Reasoning | 2M      |      $0.20 | ✅        |         2 |
+| GPT-5.4               | 1M      |      $2.50 | ✅        |         4 |
+| Gemini 2.5 Pro        | 1M      |      $1.25 | ✅        |         4 |
+| Gemini 2.5 Flash      | 1M      |      $0.15 | ✅        |         3 |
+| DeepSeek-V4 Flash     | 1M      |      $0.27 | ✅        |         2 |
+| GPT-4.1               | 1M      |      $2.00 | ❌        |         4 |
+| Llama 4 Maverick      | 1M      |      $0.15 | ❌        |         3 |
+
+## Best Tool-Calling + Reasoning + Vision
+
+The "holy trinity" for advanced AI agents — tool calling, reasoning, and vision in one model:
+
+| Model                   | Context | Input $/1M | Providers |
+| ----------------------- | ------- | ---------: | --------: |
+| Grok 4 Fast Reasoning   | 2M      |      $0.20 |         2 |
+| Gemini 2.5 Flash        | 1M      |      $0.15 |         3 |
+| Gemini 2.5 Pro          | 1M      |      $1.25 |         4 |
+| GPT-5.4                 | 1M      |      $2.50 |         4 |
+| DeepSeek Reasoner       | 1M      |      $0.43 |         1 |
+| MiMo V2.5 (open-weight) | 1M      |     varies |         2 |
+| Kimi K2.6 (open-weight) | 262K    |     varies |         4 |
+
+## Free Tool-Calling Models
+
+45 free models support tool calling — ideal for prototyping and testing:
+
+| Model                          | Provider | Context | Reasoning | Vision |
+| ------------------------------ | -------- | ------- | --------- | ------ |
+| gemini-2.0-flash               | Google   | 1M      | ✅        | ✅     |
+| gemini-2.5-flash-preview-05-20 | Google   | 1M      | ✅        | ✅     |
+| llama-4-scout                  | Chutes   | 10M     | ❌        | ✅     |
+| llama-4-maverick               | Chutes   | 1M      | ❌        | ✅     |
+| deepseek-r1                    | Chutes   | 128K    | ✅        | ❌     |
+| qwen3-235b-a22b                | Chutes   | 128K    | ✅        | ✅     |
+| gemma-3-27b-it                 | Chutes   | 128K    | ✅        | ✅     |
+
+## Key Takeaways
+
+- **2,350 tool-calling models** across 1,540 unique IDs — the largest tool-calling model catalog
+- **Gemini 2.5 Flash** is the best value: 1M context, tool calling, reasoning, and vision for $0.15/1M
+- **Grok 4 Fast Reasoning** offers the largest context (2M) with all three capabilities
+- **45 free models** support tool calling — start building agents at zero cost
+- **829 models** also support structured output — perfect for reliable JSON responses
+- Small models (Qwen 3.5 0.8B–4B) cost as little as $0.01–$0.03/1M tokens with tool calling
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Free AI Models](free-models.md) — 81 free models, many with tool calling
+- [Structured Output](structured-output.md) — 829 JSON-mode models
+- [Reasoning Models](reasoning-models.md) — 1,306 models with reasoning
+- [Cached Pricing](cached-pricing.md) — 1,374 models with prompt caching
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4/GPT-3.5 alternatives with tool calling
+- [Agentic Models](agentic-models.md) — 1,080 models with tool_call + reasoning for agents
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/video-models.md b/docs/video-models.md
new file mode 100644
index 00000000..2c34019f
--- /dev/null
+++ b/docs/video-models.md
@@ -0,0 +1,210 @@
+# Video Models
+
+[中文](zh/video-models.md)
+
+AI models that support video input or output, sourced from the [AI Models Catalog](https://github.com/i-need-token/ai-models).
+
+## Stats
+
+| Metric             | Count |
+| ------------------ | ----- |
+| Total video models | 171   |
+| Video input        | 167   |
+| Video output       | 4     |
+| Free               | 0     |
+| Open weights       | 6     |
+| Providers          | 18    |
+
+## Providers
+
+`aihubmix`, `amazon`, `amazon-bedrock`, `bytedance`, `chutes`, `fastrouter`, `google`, `google-vertex`, `hpc-ai`, `inferencenet`, `minimax`, `novitaai`, `openrouter`, `tencent`, `tencent-tokenhub`, `voyage`, `vultr`, `xiaomi`
+
+## Models
+
+| Model                                                | Provider         | Context | Input Price | Capabilities   |
+| ---------------------------------------------------- | ---------------- | ------- | ----------- | -------------- |
+| doubao-seed-1-6                                      | aihubmix         | —       | $0.09       | 📹 in 🔧       |
+| doubao-seed-1-6-flash                                | aihubmix         | —       | $0.022      | 📹 in 🔧       |
+| doubao-seed-1-6-lite                                 | aihubmix         | —       | $0.041      | 📹 in 🔧       |
+| doubao-seed-1-6-thinking                             | aihubmix         | —       | $0.09       | 📹 in 🔧       |
+| doubao-seed-1-8                                      | aihubmix         | —       | $0.054795   | 📹 in 🔧 🧠    |
+| gemini-2.0-flash                                     | aihubmix         | —       | $0.05       | 📹 in 🔧       |
+| gemini-2.0-flash-exp                                 | aihubmix         | —       | $0.01       | 📹 in          |
+| gemini-2.0-flash-lite                                | aihubmix         | —       | $0.038      | 📹 in          |
+| gemini-2.0-flash-search                              | aihubmix         | —       | $0.05       | 📹 in          |
+| gemini-2.0-flash-thinking-exp-01-21                  | aihubmix         | —       | $0.038      | 📹 in 🧠       |
+| gemini-2.0-pro-exp-02-05                             | aihubmix         | —       | $0.625      | 📹 in          |
+| gemini-2.0-pro-exp-02-05-search                      | aihubmix         | —       | $0.625      | 📹 in          |
+| gemini-2.5-flash                                     | aihubmix         | —       | $0.15       | 📹 in 🔧       |
+| gemini-2.5-flash-lite                                | aihubmix         | —       | $0.05       | 📹 in 🔧       |
+| gemini-2.5-flash-lite-nothink                        | aihubmix         | —       | $0.05       | 📹 in 🔧       |
+| gemini-2.5-flash-lite-preview-09-2025                | aihubmix         | —       | $0.05       | 📹 in 🔧       |
+| gemini-2.5-flash-lite-preview-09-2025-nothink        | aihubmix         | —       | $0.05       | 📹 in 🔧       |
+| gemini-2.5-flash-nothink                             | aihubmix         | —       | $0.15       | 📹 in 🔧       |
+| gemini-2.5-flash-preview-05-20-nothink               | aihubmix         | —       | $0.15       | 📹 in 🔧       |
+| gemini-2.5-flash-preview-05-20-search                | aihubmix         | —       | $0.15       | 📹 in 🔧       |
+| gemini-2.5-flash-preview-09-2025                     | aihubmix         | —       | $0.15       | 📹 in 🔧       |
+| gemini-2.5-flash-search                              | aihubmix         | —       | $0.15       | 📹 in 🔧       |
+| gemini-2.5-pro                                       | aihubmix         | —       | $0.625      | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-exp-03-25                             | aihubmix         | —       | $0.625      | 📹 in 🔧       |
+| gemini-2.5-pro-preview-03-25-search                  | aihubmix         | —       | $0.625      | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-preview-05-06                         | aihubmix         | —       | $0.625      | 📹 in 🧠       |
+| gemini-2.5-pro-preview-05-06-search                  | aihubmix         | —       | $0.625      | 📹 in 🧠       |
+| gemini-2.5-pro-preview-06-05                         | aihubmix         | —       | $0.625      | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-preview-06-05-search                  | aihubmix         | —       | $0.625      | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-search                                | aihubmix         | —       | $0.625      | 📹 in 🔧 🧠    |
+| gemini-3.1-flash-lite-preview-nothink                | aihubmix         | —       | $0.125      | 📹 in 🔧 🧠    |
+| glm-4.5v                                             | aihubmix         | —       | $0.137      | 📹 in          |
+| glm-4.6v                                             | aihubmix         | —       | $0.0685     | 📹 in          |
+| gme-qwen2-vl-2b-instruct                             | aihubmix         | —       | $0.069      | 📹 in          |
+| kimi-k2.5                                            | aihubmix         | —       | $0.3        | 📹 in 🔧 🧠    |
+| mimo-v2-omni                                         | aihubmix         | —       | $0.22       | 📹 in          |
+| mimo-v2-pro                                          | aihubmix         | —       | $0.55       | 📹 in          |
+| qwen--qwen2.5-vl-32b-instruct                        | aihubmix         | —       | $0.12       | 📹 in 🔧       |
+| qwen--qwen2.5-vl-72b-instruct                        | aihubmix         | —       | $0.25       | 📹 in          |
+| qwen2-vl-72b-instruct                                | aihubmix         | —       | $1.09       | 📹 in          |
+| qwen2-vl-7b-instruct                                 | aihubmix         | —       | $0.14       | 📹 in          |
+| qwen3-vl-235b-a22b-instruct                          | aihubmix         | —       | $0.137      | 📹 in 🔧       |
+| qwen3-vl-235b-a22b-thinking                          | aihubmix         | —       | $0.137      | 📹 in 🔧 🧠    |
+| qwen3-vl-30b-a3b-instruct                            | aihubmix         | —       | $0.0514     | 📹 in 🔧       |
+| qwen3-vl-30b-a3b-thinking                            | aihubmix         | —       | $0.0514     | 📹 in 🔧 🧠    |
+| qwen3-vl-flash                                       | aihubmix         | —       | $0.0103     | 📹 in 🔧       |
+| qwen3-vl-flash-2026-01-22                            | aihubmix         | —       | $0.0103     | 📹 in 🔧       |
+| qwen3-vl-plus                                        | aihubmix         | —       | $0.0685     | 📹 in 🔧       |
+| veo-2.0-generate-001                                 | aihubmix         | —       | $1          | 📹 in          |
+| veo-3                                                | aihubmix         | —       | $1          | 📹 in          |
+| veo-3.0-generate-preview                             | aihubmix         | —       | $1          | 📹 in          |
+| veo-3.1-fast-generate-preview                        | aihubmix         | —       | $1          | 📹 in          |
+| veo-3.1-generate-preview                             | aihubmix         | —       | $1          | 📹 in          |
+| veo-3.1-lite-generate-preview                        | aihubmix         | —       | $1          | 📹 in          |
+| veo3                                                 | aihubmix         | —       | $1          | 📹 in          |
+| amazon-nova-2.0-lite                                 | amazon           | —       | $0.15       | 📹 in 🔧 🧠    |
+| amazon-nova-2.0-omni                                 | amazon           | —       | $0.2        | 📹 in 🔧 🧠    |
+| amazon-nova-2.0-pro                                  | amazon           | —       | $0.625      | 📹 in 🔧 🧠    |
+| amazon-nova-lite                                     | amazon           | —       | $0.06       | 📹 in 🔧       |
+| amazon-nova-premier                                  | amazon           | —       | $2.5        | 📹 in 🔧       |
+| amazon-nova-pro                                      | amazon           | —       | $0.8        | 📹 in 🔧       |
+| amazon-nova-2-lite                                   | amazon-bedrock   | —       | $0.33       | 📹 in 🔧       |
+| amazon-nova-lite                                     | amazon-bedrock   | —       | $0.06       | 📹 in 🔧       |
+| amazon-nova-premier                                  | amazon-bedrock   | —       | $2.5        | 📹 in 🔧       |
+| amazon-nova-pro                                      | amazon-bedrock   | —       | $0.8        | 📹 in 🔧       |
+| amazon-nova-pro-latency-optimized                    | amazon-bedrock   | —       | $1          | 📹 in 🔧       |
+| seed-1.6                                             | bytedance        | —       | $0.25       | 📹 in 🔧 🧠    |
+| seed-1.6-flash                                       | bytedance        | —       | $0.07       | 📹 in 🔧 🧠    |
+| seed-2.0-lite                                        | bytedance        | —       | $0.25       | 📹 in 🔧 🧠    |
+| seed-2.0-mini                                        | bytedance        | —       | $0.1        | 📹 in 🔧 🧠    |
+| moonshotai--Kimi-K2.5-TEE                            | chutes           | —       | $0.44       | 📹 in 🔧 🧠    |
+| moonshotai--Kimi-K2.6-TEE                            | chutes           | —       | $0.74       | 📹 in 🔧 🧠    |
+| google--gemini-3-flash-preview                       | fastrouter       | —       | $0.5        | 📹 in 🔧 🧠    |
+| google--gemini-3.1-flash-lite-preview                | fastrouter       | —       | $0.25       | 📹 in 🔧 🧠    |
+| google--gemini-3.1-pro-preview                       | fastrouter       | —       | $2          | 📹 in 🔧 🧠    |
+| google--gemma-4-31b-it                               | fastrouter       | —       | $0.2        | 📹 in 🔧 🧠    |
+| gemini-1.5-flash                                     | google           | —       | $0.075      | 📹 in 🔧       |
+| gemini-1.5-flash-8b                                  | google           | —       | $0.075      | 📹 in 🔧       |
+| gemini-1.5-pro                                       | google           | —       | $1.25       | 📹 in 🔧       |
+| gemini-2.0-flash                                     | google           | —       | $0.1        | 📹 in 🔧       |
+| gemini-2.0-flash-lite                                | google           | —       | $0.075      | 📹 in 🔧       |
+| gemini-2.5-flash                                     | google           | —       | $0.15       | 📹 in 🔧 🧠    |
+| gemini-2.5-flash-lite                                | google           | —       | $0.1        | 📹 in 🔧       |
+| gemini-2.5-pro                                       | google           | —       | $1.25       | 📹 in 🔧 🧠    |
+| gemma-3n-E2B-it                                      | google           | —       | —           | 📹 in          |
+| gemma-3n-E4B-it                                      | google           | —       | —           | 📹 in          |
+| veo-2.0-generate                                     | google           | —       | —           | 📹 out         |
+| gemini-2-5-flash                                     | google-vertex    | —       | $0.3        | 📹 in 🔧       |
+| gemini-2-5-flash-lite                                | google-vertex    | —       | $0.1        | 📹 in 🔧       |
+| gemini-2-5-pro                                       | google-vertex    | —       | $1.25       | 📹 in 🔧       |
+| gemini-3-1-flash-lite                                | google-vertex    | —       | $0.25       | 📹 in 🔧       |
+| gemini-3-flash                                       | google-vertex    | —       | $0.5        | 📹 in 🔧       |
+| gemini-3-pro                                         | google-vertex    | —       | $2          | 📹 in 🔧       |
+| xiaomi--mimo-v2.5                                    | hpc-ai           | —       | $0.4        | 📹 in 🔧 🧠 🔓 |
+| cliptagger-12b                                       | inferencenet     | —       | $0.3        | 📹 in 🔓       |
+| MiniMax-Hailuo-02                                    | minimax          | —       | —           | 📹 out         |
+| MiniMax-Hailuo-2.3                                   | minimax          | —       | —           | 📹 out         |
+| MiniMax-Hailuo-2.3-Fast                              | minimax          | —       | —           | 📹 out         |
+| baidu--ernie-4.5-vl-28b-a3b-thinking                 | novitaai         | —       | $0.39       | 📹 in 🔧 🧠    |
+| moonshotai--kimi-k2.5                                | novitaai         | —       | $0.6        | 📹 in 🔧 🧠    |
+| moonshotai--kimi-k2.6                                | novitaai         | —       | $0.8        | 📹 in 🔧 🧠    |
+| qwen--qwen2.5-vl-72b-instruct                        | novitaai         | —       | $0.8        | 📹 in          |
+| qwen--qwen3-omni-30b-a3b-instruct                    | novitaai         | —       | —           | 📹 in 🔧       |
+| qwen--qwen3-omni-30b-a3b-thinking                    | novitaai         | —       | —           | 📹 in 🔧 🧠    |
+| qwen--qwen3-vl-235b-a22b-instruct                    | novitaai         | —       | $0.3        | 📹 in 🔧       |
+| qwen--qwen3-vl-235b-a22b-thinking                    | novitaai         | —       | $0.98       | 📹 in 🔧 🧠    |
+| qwen--qwen3-vl-30b-a3b-instruct                      | novitaai         | —       | $0.2        | 📹 in 🔧       |
+| qwen--qwen3-vl-30b-a3b-thinking                      | novitaai         | —       | $0.2        | 📹 in 🔧       |
+| qwen--qwen3-vl-8b-instruct                           | novitaai         | —       | $0.08       | 📹 in 🔧       |
+| qwen--qwen3.5-122b-a10b                              | novitaai         | —       | $0.4        | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-27b                                    | novitaai         | —       | $0.3        | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-35b-a3b                                | novitaai         | —       | $0.25       | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-397b-a17b                              | novitaai         | —       | $0.6        | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-27b                                    | novitaai         | —       | $0.6        | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-35b-a3b                                | novitaai         | —       | $0.248      | 📹 in 🔧 🧠    |
+| zai-org--glm-4.5v                                    | novitaai         | —       | $0.6        | 📹 in 🔧 🧠    |
+| zai-org--glm-4.6v                                    | novitaai         | —       | $0.3        | 📹 in 🔧 🧠    |
+| amazon--nova-2-lite-v1                               | openrouter       | —       | $0.3        | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-1.6                             | openrouter       | —       | $0.25       | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-1.6-flash                       | openrouter       | —       | $0.075      | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-2.0-lite                        | openrouter       | —       | $0.25       | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-2.0-mini                        | openrouter       | —       | $0.1        | 📹 in 🔧 🧠    |
+| google--gemini-2.0-flash-001                         | openrouter       | —       | $0.1        | 📹 in 🔧       |
+| google--gemini-2.0-flash-lite-001                    | openrouter       | —       | $0.075      | 📹 in 🔧       |
+| google--gemini-2.5-flash                             | openrouter       | —       | $0.3        | 📹 in 🔧 🧠    |
+| google--gemini-2.5-flash-lite                        | openrouter       | —       | $0.1        | 📹 in 🔧 🧠    |
+| google--gemini-2.5-flash-lite-preview-09-2025        | openrouter       | —       | $0.1        | 📹 in 🔧 🧠    |
+| google--gemini-2.5-pro                               | openrouter       | —       | $1.25       | 📹 in 🔧 🧠    |
+| google--gemini-2.5-pro-preview-05-06                 | openrouter       | —       | $1.25       | 📹 in 🔧 🧠    |
+| google--gemini-3-flash-preview                       | openrouter       | —       | $0.5        | 📹 in 🔧 🧠    |
+| google--gemini-3.1-flash-lite                        | openrouter       | —       | $0.25       | 📹 in 🔧 🧠    |
+| google--gemini-3.1-flash-lite-preview                | openrouter       | —       | $0.25       | 📹 in 🔧 🧠    |
+| google--gemini-3.1-pro-preview                       | openrouter       | —       | $2          | 📹 in 🔧 🧠    |
+| google--gemini-3.1-pro-preview-customtools           | openrouter       | —       | $2          | 📹 in 🔧 🧠    |
+| google--gemini-3.5-flash                             | openrouter       | —       | $1.5        | 📹 in 🔧 🧠    |
+| google--gemma-4-26b-a4b-it                           | openrouter       | —       | $0.06       | 📹 in 🔧 🧠    |
+| google--gemma-4-26b-a4b-it--free                     | openrouter       | —       | —           | 📹 in 🔧 🧠    |
+| google--gemma-4-31b-it                               | openrouter       | —       | $0.12       | 📹 in 🔧 🧠    |
+| google--gemma-4-31b-it--free                         | openrouter       | —       | —           | 📹 in 🔧 🧠    |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter       | —       | —           | 📹 in 🔧 🧠    |
+| nvidia--nemotron-nano-12b-v2-vl--free                | openrouter       | —       | —           | 📹 in 🔧 🧠    |
+| perceptron--perceptron-mk1                           | openrouter       | —       | $0.15       | 📹 in 🧠       |
+| qwen--qwen3.5-122b-a10b                              | openrouter       | —       | $0.26       | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-27b                                    | openrouter       | —       | $0.195      | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-35b-a3b                                | openrouter       | —       | $0.139      | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-397b-a17b                              | openrouter       | —       | $0.39       | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-9b                                     | openrouter       | —       | $0.04       | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-flash-02-23                            | openrouter       | —       | $0.065      | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-plus-02-15                             | openrouter       | —       | $0.26       | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-plus-20260420                          | openrouter       | —       | $0.3        | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-27b                                    | openrouter       | —       | $0.32       | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-35b-a3b                                | openrouter       | —       | $0.15       | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-flash                                  | openrouter       | —       | $0.1875     | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-plus                                   | openrouter       | —       | $0.325      | 📹 in 🔧 🧠    |
+| rekaai--reka-edge                                    | openrouter       | —       | $0.1        | 📹 in 🔧       |
+| xiaomi--mimo-v2-omni                                 | openrouter       | —       | $0.4        | 📹 in 🔧 🧠    |
+| xiaomi--mimo-v2.5                                    | openrouter       | —       | $0.4        | 📹 in 🔧 🧠    |
+| z-ai--glm-4.6v                                       | openrouter       | —       | $0.3        | 📹 in 🔧 🧠    |
+| z-ai--glm-5v-turbo                                   | openrouter       | —       | $1.2        | 📹 in 🔧 🧠    |
+| ~google--gemini-flash-latest                         | openrouter       | —       | $1.5        | 📹 in 🔧 🧠    |
+| ~google--gemini-pro-latest                           | openrouter       | —       | $2          | 📹 in 🔧 🧠    |
+| hunyuan-turbos-vision-video                          | tencent          | —       | $3          | 📹 in          |
+| yt-vita                                              | tencent-tokenhub | —       | $1.2        | 📹 in          |
+| voyage-multimodal-3                                  | voyage           | —       | $0.12       | 📹 in          |
+| voyage-multimodal-3.5                                | voyage           | —       | $0.12       | 📹 in          |
+| gemma-4-26b-a4b-it                                   | vultr            | —       | $0.55       | 📹 in 🔓       |
+| gemma-4-31b-it                                       | vultr            | —       | $0.55       | 📹 in 🔓       |
+| gemma-4-e2b-it                                       | vultr            | —       | $0.55       | 📹 in 🔓       |
+| gemma-4-e4b-it                                       | vultr            | —       | $0.55       | 📹 in 🔓       |
+| mimo-v2-omni                                         | xiaomi           | —       | $0.4        | 📹 in 🔧       |
+| mimo-v2.5                                            | xiaomi           | —       | $0.4        | 📹 in 🔧       |
+
+> 💡 Use the [interactive catalog](https://i-need-token.github.io/ai-models/) to search and filter models with more criteria.
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
+
+## Related Documentation
+
+- [Audio Models](audio-models.md) — 118 audio input + 34 audio output models
+- [Vision Models](vision-models.md) — 1,487 vision models
+- [Image Generation](image-generation.md) — 28 image generation models
+- [Modality Matrix](modality-matrix.md) — all modalities at a glance
+- [Model Selection Guide](model-selection.md) — decision framework
diff --git a/docs/vision-models.md b/docs/vision-models.md
new file mode 100644
index 00000000..7d43b4e9
--- /dev/null
+++ b/docs/vision-models.md
@@ -0,0 +1,101 @@
+**English** | [中文](./zh/vision-models.md)
+
+# AI Vision Models
+
+1,487 models in this catalog accept image input (vision). This page highlights the most capable and cost-effective vision models for image understanding, document analysis, and visual reasoning.
+
+> All data sourced from first-party APIs and documentation. "Vision" means the model accepts image input; image generation is a separate capability.
+
+## Quick Stats
+
+| Capability          | Vision Models |
+| ------------------- | ------------: |
+| Total vision models |         1,487 |
+| Unique model IDs    |           930 |
+| With tool calling   |         1,063 |
+| With reasoning      |           697 |
+| Open-weight         |           104 |
+
+## Cheapest Vision Models
+
+Best value for image understanding:
+
+| Model                 | Provider    | Input $/1M | Output $/1M | Context | Tool Call | Reasoning |
+| --------------------- | ----------- | ---------: | ----------: | ------- | --------- | --------- |
+| Qwen 3.5 0.8B         | Auriko      |      $0.01 |       $0.05 | 262K    | ✅        | ✅        |
+| Qwen 3.5 0.8B         | DeepInfra   |      $0.01 |       $0.05 | 262K    | ✅        | ✅        |
+| Qwen 3.5 2B           | Auriko      |      $0.02 |       $0.10 | 262K    | ✅        | ✅        |
+| Qwen 3.5 2B           | DeepInfra   |      $0.02 |       $0.10 | 262K    | ✅        | ✅        |
+| Qwen 3.5 4B           | Auriko      |      $0.03 |       $0.15 | 262K    | ✅        | ✅        |
+| Qwen 3.5 4B           | DeepInfra   |      $0.03 |       $0.15 | 262K    | ✅        | ✅        |
+| Gemini 2.5 Flash Lite | Google      |      $0.10 |       $0.60 | 1M      | ✅        | ✅        |
+| Gemini 2.5 Flash      | Google      |      $0.15 |       $0.60 | 1M      | ✅        | ✅        |
+| Llama 4 Maverick      | Together AI |      $0.15 |       $0.60 | 1M      | ✅        | ❌        |
+| Grok 4 Fast Reasoning | xAI         |      $0.20 |       $0.50 | 2M      | ✅        | ✅        |
+
+## Largest Context Vision Models
+
+For analyzing large documents, multi-page PDFs, or long image sequences:
+
+| Model                 | Context | Input $/1M | Tool Call | Reasoning | Providers |
+| --------------------- | ------- | ---------: | --------- | --------- | --------: |
+| Llama 4 Scout         | 10M     |      $0.08 | ✅        | ❌        |         4 |
+| Grok 4 Fast Reasoning | 2M      |      $0.20 | ✅        | ✅        |         2 |
+| GPT-5.4               | 1M      |      $2.50 | ✅        | ✅        |         4 |
+| Gemini 2.5 Pro        | 1M      |      $1.25 | ✅        | ✅        |         4 |
+| Gemini 2.5 Flash      | 1M      |      $0.15 | ✅        | ✅        |         3 |
+| DeepSeek Reasoner     | 1M      |      $0.43 | ✅        | ✅        |         1 |
+| GPT-4.1               | 1M      |      $2.00 | ✅        | ❌        |         4 |
+| Llama 4 Maverick      | 1M      |      $0.15 | ✅        | ❌        |         3 |
+
+## Best Vision + Tool Calling + Reasoning
+
+The most capable vision models — can see, reason, and act:
+
+| Model                   | Context | Input $/1M | Providers |
+| ----------------------- | ------- | ---------: | --------: |
+| Grok 4 Fast Reasoning   | 2M      |      $0.20 |         2 |
+| Gemini 2.5 Flash        | 1M      |      $0.15 |         3 |
+| Gemini 2.5 Pro          | 1M      |      $1.25 |         4 |
+| GPT-5.4                 | 1M      |      $2.50 |         4 |
+| DeepSeek Reasoner       | 1M      |      $0.43 |         1 |
+| MiMo V2.5 (open-weight) | 1M      |     varies |         2 |
+| Kimi K2.6 (open-weight) | 262K    |     varies |         4 |
+
+## Open-Weight Vision Models
+
+104 open-weight models accept image input — run vision AI on your own hardware:
+
+| Model              | Context | Tool Call | Reasoning | Providers |
+| ------------------ | ------- | --------- | --------- | --------: |
+| MiMo V2.5          | 1M      | ✅        | ✅        |         2 |
+| Llama 4 Maverick   | 1M      | ✅        | ❌        |         3 |
+| Llama 4 Scout      | 10M     | ✅        | ❌        |         2 |
+| Gemma 4 31B IT     | 1M      | ✅        | ❌        |         3 |
+| Qwen3.5 Flash      | 1M      | ✅        | ❌        |         1 |
+| Kimi K2.6          | 262K    | ✅        | ✅        |         4 |
+| Gemma 4 26B A4B IT | 262K    | ✅        | ✅        |         3 |
+| Llama 4 Scout 17B  | 328K    | ✅        | ❌        |         4 |
+
+## Key Takeaways
+
+- **1,487 vision models** across 930 unique IDs — the largest vision model catalog available
+- **Gemini 2.5 Flash** is the best value: 1M context, vision, tool calling, and reasoning for $0.15/1M
+- **Llama 4 Scout** has the largest vision context at 10M tokens
+- **Grok 4 Fast Reasoning** is the only model combining 2M context, vision, tool calling, and reasoning
+- **104 open-weight vision models** available — run vision AI on your own infrastructure
+- Small vision models (Qwen 3.5 0.8B–4B) cost as little as $0.01–$0.03/1M tokens
+
+## Related Documentation
+
+- [Model Selection Guide](model-selection.md) — decision framework for choosing models
+- [Image Generation](image-generation.md) — 28 image generation models
+- [Video Models](video-models.md) — 167 video input/output models
+- [Modality Matrix](modality-matrix.md) — all modalities at a glance
+- [Free AI Models](free-models.md) — 81 free models, some with vision
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4 class alternatives with vision
+- [Audio Models](audio-models.md) — 118 audio input + 34 audio output models
+
+---
+
+Data sourced from [AI Models Catalog](https://github.com/i-need-token/ai-models) — structured YAML with pricing, context windows, and capabilities for 4,587+ models across 95 providers.
diff --git a/docs/zh/agentic-models.md b/docs/zh/agentic-models.md
new file mode 100644
index 00000000..c83aa7c8
--- /dev/null
+++ b/docs/zh/agentic-models.md
@@ -0,0 +1,97 @@
+[English](../agentic-models.md) | **中文**
+
+# 智能体 AI 模型 — 1,080 个用于 AI 智能体的模型
+
+具备 **工具调用 + 推理** 能力的模型 — AI 智能体、自主工作流和多步任务执行的核心构建块。所有数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) 一手 API。
+
+## 什么使模型成为"智能体"？
+
+智能体模型可以：
+
+- **调用工具/函数** — 与 API、数据库和外部系统交互
+- **逐步推理** — 规划、分解任务和验证结果
+- **自主行动** — 无需人工干预即可做出决策和采取行动
+
+这些能力是聊天机器人和 AI 智能体的关键区别。
+
+## 统计
+
+| Metric                 | Count |
+| ---------------------- | ----- |
+| Agentic models         | 1076  |
+| Providers              | 51    |
+| With vision            | 617   |
+| With structured output | 453   |
+| Free                   | 30    |
+| Open weights           | 64    |
+
+## 最便宜的智能体模型（直连提供商）
+
+| Model                          | Provider     | Context | Input $/1M | Output $/1M | Vision |
+| ------------------------------ | ------------ | ------- | ---------- | ----------- | ------ |
+| qwen--qwen3-4b-fp8             | novitaai     | 125K    | $0.03      | $0.03       |        |
+| openai--gpt-oss-20b            | neuralwatt   | 0       | $0.03      | $0.16       |        |
+| openai--gpt-oss-120b           | novitaai     | 128K    | $0.05      | $0.25       | ✅     |
+| gpt-oss-120b                   | inferencenet | 128K    | $0.05      | $0.45       |        |
+| Qwen--Qwen3.6-35B-A3B          | neuralwatt   | 0       | $0.05      | $0.1        | ✅     |
+| qwen3-30b-a3b-fp8              | cloudflare   | 40K     | $0.051     | $0.335      |        |
+| glm-4.7-flash                  | cloudflare   | 128K    | $0.06      | $0.4        |        |
+| Nemotron-3-Nano-Omni           | nebius       | 125K    | $0.06      | $0.24       | ✅     |
+| hermes-4-llama-3.1-8b          | nousresearch | 128K    | $0.06      | $0.12       |        |
+| zai-org--glm-4.7-flash         | novitaai     | 195K    | $0.07      | $0.4        |        |
+| ring-2.6-1t                    | inclusionai  | 256K    | $0.07      | $0.62       |        |
+| seed-1.6-flash                 | bytedance    | 256K    | $0.07      | $0.3        | ✅     |
+| microsoft-phi-4-mini-reasoning | microsoft    | 125K    | $0.075     | $0.3        |        |
+| Qwen--Qwen3-32B-TEE            | chutes       | 40K     | $0.08      | $0.24       |        |
+| qwen--qwen3-30b-a3b-fp8        | novitaai     | 40K     | $0.09      | $0.45       |        |
+
+## 免费智能体模型
+
+| Model                             | Provider | Context | Vision | Structured Output |
+| --------------------------------- | -------- | ------- | ------ | ----------------- |
+| glm-4.1v-thinking-flash           | zhipuai  | 62K     | ✅     | ✅                |
+| qwen--qwen3-omni-30b-a3b-thinking | novitaai | 64K     | ✅     | ✅                |
+| qwen--qwen3.5-4b-free             | mixlayer | 128K    |        |                   |
+
+## 最大上下文智能体模型
+
+| Model                       | Provider    | Context | Input $/1M | Output $/1M |
+| --------------------------- | ----------- | ------- | ---------- | ----------- |
+| deepseek-v4-flash           | baidu       | 1024K   | $0.126     | $0.252      |
+| deepseek-v4-pro             | siliconflow | 1024K   | $1.74      | $3.48       |
+| deepseek-v4-flash           | siliconflow | 1024K   | $0.14      | $0.28       |
+| deepseek--deepseek-v4-pro   | novitaai    | 1024K   | $1.67      | $3.38       |
+| xiaomimimo--mimo-v2.5-pro   | novitaai    | 1024K   | $2         | $6          |
+| deepseek--deepseek-v4-flash | novitaai    | 1024K   | $0.14      | $0.28       |
+| gemini-2.5-flash            | google      | 1024K   | $0.15      | $3.5        |
+| gemini-2.5-pro              | google      | 1024K   | $1.25      | $10         |
+| deepseek-v4-pro             | fireworks   | 1024K   | $1.74      | $3.48       |
+| xiaomi--mimo-v2.5-pro       | hpc-ai      | 1024K   | $1         | $3          |
+| xiaomi--mimo-v2.5           | hpc-ai      | 1024K   | $0.4       | $2          |
+| mimo-v2.5-pro               | xiaomi      | 1024K   | $1         | $3          |
+| mimo-v2-pro                 | xiaomi      | 1024K   | $1         | $3          |
+| minimaxai--minimax-m1-80k   | novitaai    | 976K    | $0.55      | $2.2        |
+| qwen3.6-flash               | alibaba     | 976K    | $1.2       | $7.2        |
+
+## 构建 AI 智能体
+
+| Agent Type       | Recommended Models          | Key Capabilities               |
+| ---------------- | --------------------------- | ------------------------------ |
+| Code agents      | Claude Sonnet 4, GPT-4.1    | Tool call + reasoning + code   |
+| Research agents  | Gemini 2.5 Pro, DeepSeek R1 | Large context + reasoning      |
+| Data agents      | Claude Sonnet 4, Qwen3      | Structured output + tool call  |
+| Vision agents    | GPT-4o, Gemini 2.5 Flash    | Vision + tool call + reasoning |
+| Customer support | Llama 4 Scout, Qwen3        | Free/cheap + tool call         |
+
+## 相关文档
+
+- [Tool Calling Models](tool-calling.md) — 2,350 models with function calling
+- [Reasoning Models](reasoning-models.md) — 1,306 models with chain-of-thought
+- [Structured Output](structured-output.md) — 829 models with JSON mode
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4 alternatives with agent capabilities
+- [Vision Models](vision-models.md) — 1,487 models with image understanding
+- [Free AI Models](free-models.md) — 81 models at zero cost
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/ai-model-picker.md b/docs/zh/ai-model-picker.md
new file mode 100644
index 00000000..f72287cd
--- /dev/null
+++ b/docs/zh/ai-model-picker.md
@@ -0,0 +1,64 @@
+# AI 模型选择器
+
+回答 4 个简单问题，找到最适合你用例的 AI 模型。
+
+**[试用交互式选择器 →](https://i-need-token.github.io/ai-models/ai-model-picker.html)**
+
+## 工作原理
+
+AI 模型选择器会问你四个问题：
+
+1. **你在构建什么？** — AI 代理、代码生成、对话/RAG、数学推理、视觉/多模态、或大规模生产
+2. **你的预算是多少？** — 免费、低于 $0.10/M token、低于 $1/M、或高端
+3. **你需要多少上下文？** — 低于 32K、32K–128K、128K–512K、或 512K+
+4. **什么最重要？** — 最低成本、最佳质量、最低延迟、或隐私/本地部署
+
+根据你的回答，选择器对 95 个提供商的 4,587+ 模型进行评分和排名，按预算和上下文需求过滤，然后按用例和优先级加权。
+
+## 评分逻辑
+
+| 用例        | 关键能力                                  | 权重               |
+| ----------- | ----------------------------------------- | ------------------ |
+| AI 代理     | 工具调用 (+10)、推理 (+5)                 | 昂贵模型有成本惩罚 |
+| 代码生成    | 工具调用 (+8)、推理 (+5)、结构化输出 (+3) | —                  |
+| 对话/RAG    | 大上下文 (+5)、工具调用 (+3)              | —                  |
+| 数学推理    | 推理 (+10)、工具调用 (+3)                 | —                  |
+| 视觉/多模态 | 图像输入 (+10)、工具调用 (+3)             | —                  |
+| 大规模生产  | 工具调用 (+5)                             | 成本惩罚放大 5 倍  |
+
+聚合提供商（OpenRouter、Requesty 等）被排除以避免重复模型条目。
+
+## 快速推荐
+
+### 按用例的最佳免费模型
+
+| 用例     | 首选                     | 原因                   |
+| -------- | ------------------------ | ---------------------- |
+| AI 代理  | DeepSeek V4 Flash (免费) | 工具调用 + 1M 上下文   |
+| 代码生成 | Qwen3 Coder (免费)       | 工具调用 + 1M 上下文   |
+| 对话/RAG | DeepSeek V4 Flash (免费) | 1M 上下文窗口          |
+| 推理     | DeepSeek R1 (免费)       | 92% MATH-500，推理能力 |
+| 视觉     | —                        | 免费视觉选项有限       |
+
+### 最佳预算模型（低于 $0.10/M）
+
+| 用例     | 首选           | 价格            |
+| -------- | -------------- | --------------- |
+| AI 代理  | ling-2.6-flash | $0.01/$0.03/M   |
+| 代码生成 | bdc-coder      | $0.01/$0.01/M   |
+| 推理     | qwen3.5-0.8b   | $0.01/$0.05/M   |
+| 通用     | Mistral Nemo   | $0.008/$0.001/M |
+
+## 相关文档
+
+- [免费模型](free-models.md) — 81 个免费模型完整列表
+- [价格比较](pricing-comparison.md) — 跨所有提供商比较成本
+- [工具调用](tool-calling.md) — 2,350 个支持工具调用的模型
+- [推理模型](reasoning-models.md) — 1,306 个推理模型
+- [上下文窗口](context-windows.md) — 比较上下文窗口大小
+- [模型选择速查表](model-selection-cheatsheet.md) — 决策树和预算表
+- [快速入门](quick-start.md) — 开始使用目录
+
+## 数据来源
+
+所有数据均来自第一方 API 和官方文档。详见[数据获取](data-acquisition.md)。
diff --git a/docs/zh/api.md b/docs/zh/api.md
new file mode 100644
index 00000000..5d19645f
--- /dev/null
+++ b/docs/zh/api.md
@@ -0,0 +1,222 @@
+[English](../api.md) | **中文**
+
+# API 与编程访问
+
+在你的应用中使用目录数据。
+
+## npm 包
+
+将目录作为 npm 依赖安装：
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 个模型 JSON
+import type { Model } from "ai-models"; // TypeScript 类型
+
+// 查找支持工具调用且输入价格低于 $1/1M 的模型
+const affordable = catalog.models.filter((m) => m.tool_call && m.pricing.input < 1);
+```
+
+包内容包括：
+
+- `dist/models.json` — 完整目录 JSON
+- `dist/index.d.ts` — TypeScript 类型定义
+- `types/` — 源类型定义（Model、Snapshot、Provider、Pricing）
+
+## CDN 访问（无需安装）
+
+编译后的 JSON 可通过 [jsDelivr CDN](https://www.jsdelivr.com/package/npm/ai-models) 访问 — 无需下载或安装。CDN 自动提供最新的 npm 发布版本：
+
+```html
+<!-- 在任何 HTML 页面中使用 -->
+<script type="module">
+  const catalog = await fetch(
+    "https://github.com/i-need-token/ai-models/releases/latest/download/models.json",
+  ).then((r) => r.json());
+  console.log(catalog.models.length); // 4,587
+</script>
+```
+
+```bash
+# 直接 curl（始终最新）
+curl -s https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+
+# 锁定特定版本
+curl -s https://github.com/i-need-token/ai-models/releases/download/v0.1.0/models.json | jq '.stats'
+```
+
+```python
+# Python — 无需 pip install
+import urllib.request, json
+catalog = json.loads(urllib.request.urlopen("https://github.com/i-need-token/ai-models/releases/latest/download/models.json").read())
+print(len(catalog["models"]))  # 4587
+```
+
+```go
+// Go — 无需依赖
+resp, err := http.Get("https://github.com/i-need-token/ai-models/releases/latest/download/models.json")
+```
+
+### CDN 与 GitHub Releases 对比
+
+| 特性       | jsDelivr CDN                                | GitHub Releases                               |
+| ---------- | ------------------------------------------- | --------------------------------------------- |
+| URL 稳定性 | `cdn.jsdelivr.net/npm/ai-models@latest/...` | `github.com/.../releases/latest/download/...` |
+| CORS       | ✅ 支持 — 可在浏览器中使用                  | ❌ 不支持 — 仅下载                            |
+| 缓存       | 7 天（版本化），5 分钟（`@latest`）         | 无缓存                                        |
+| 速度       | 全球 CDN，300+ 边缘节点                     | GitHub CDN                                    |
+| 适用场景   | Web 应用、浏览器脚本、快速原型              | CLI 工具、CI/CD、批处理                       |
+
+## 编译 JSON
+
+所有模型数据可以从 [GitHub Releases](https://github.com/i-need-token/ai-models/releases/latest) 下载，提供两种格式：
+
+| 文件          | 格式 | 大小    | 适用场景                       |
+| ------------- | ---- | ------- | ------------------------------ |
+| `models.json` | JSON | ~2.3 MB | 编程访问、Web 应用、TypeScript |
+| `models.csv`  | CSV  | ~560 KB | Excel、Google Sheets、数据分析 |
+| `stats.json`  | JSON | ~1 KB   | 目录统计摘要                   |
+
+也可在 [Hugging Face Datasets](https://huggingface.co/datasets/i-need-token/ai-models) 上获取，方便机器学习社区使用。
+
+```bash
+# 下载 JSON（完整元数据）
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# 下载 CSV（适合电子表格）
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+
+# 特定版本
+curl -LO https://github.com/i-need-token/ai-models/releases/download/v0.1.0/models.json
+```
+
+### 本地编译
+
+```bash
+npm install
+npx tsx scripts/compile.ts
+# 输出：dist/models.json (2.3 MB)
+```
+
+### JSON 结构
+
+```json
+{
+  "generated_at": "2026-05-21T02:13:04.076Z",
+  "stats": {
+    "providers": 95,
+    "models": 4587,
+    "unique_model_ids": 2712,
+    "families": 441
+  },
+  "providers": {
+    "openai": { "name": "OpenAI", "model_count": 28 },
+    "anthropic": { "name": "Anthropic", "model_count": 11 }
+  },
+  "models": [
+    {
+      "id": "gpt-4.1",
+      "name": "GPT-4.1",
+      "family": "gpt-4.1",
+      "provider": "openai",
+      "tool_call": true,
+      "structured_output": true,
+      "pricing": { "currency": "USD", "input": 2, "output": 8, "cache_read": 0.5 },
+      "limit": { "context": 1047576, "output": 32768 },
+      "modalities": { "input": ["text", "image"], "output": ["text"] }
+    }
+  ]
+}
+```
+
+### 使用示例
+
+**JavaScript/TypeScript：**
+
+```javascript
+const catalog = require("./models.json");
+
+// 查找所有支持工具调用且输入价格低于 $1/1M token 的模型
+const cheap = catalog.models.filter(
+  (m) => m.tool_call && m.pricing?.input < 1 && m.pricing?.currency === "USD",
+);
+
+// 查找每个提供商最便宜的模型
+const byProvider = {};
+for (const m of catalog.models) {
+  if (!m.pricing?.input) continue;
+  if (!byProvider[m.provider] || m.pricing.input < byProvider[m.provider].pricing.input) {
+    byProvider[m.provider] = m;
+  }
+}
+
+// 获取所有视觉模型
+const vision = catalog.models.filter((m) => m.modalities?.input?.includes("image"));
+```
+
+**Python：**
+
+```python
+import json
+
+with open("models.json") as f:
+    catalog = json.load(f)
+
+# 查找所有推理模型
+reasoning = [m for m in catalog["models"] if m.get("reasoning")]
+
+# 查找上下文窗口最大的模型
+by_context = sorted(
+    catalog["models"],
+    key=lambda m: (m.get("limit", {}) or {}).get("context", 0),
+    reverse=True,
+)[:10]
+```
+
+## 单个 YAML 文件
+
+对于单个模型的类型安全访问，直接使用 YAML 文件配合 Zod 校验：
+
+```typescript
+import { ModelSchema } from "./types/schemas";
+import { parse } from "yaml";
+import { readFileSync } from "fs";
+
+const raw = readFileSync("providers/openai/models/gpt-4.1.yaml", "utf-8");
+const model = ModelSchema.parse(parse(raw)); // 运行时校验
+
+console.log(model.pricing); // { input: 2, output: 8, cache_read: 0.5 }
+```
+
+## CLI 工具
+
+```bash
+# 验证所有 YAML 数据
+npx tsx scripts/validate.ts
+
+# 计算目录统计
+npx tsx scripts/stats.ts          # 表格格式
+npx tsx scripts/stats.ts json     # JSON 格式
+
+# 编译为 models.json
+npx tsx scripts/compile.ts
+
+# 从提供商同步数据
+npx tsx scripts/sync.ts openai    # 单个提供商
+npx tsx scripts/sync.ts           # 所有提供商
+```
+
+## 相关文档
+
+- [快速入门](quick-start.md) — 30 秒内找到适合的模型
+- [代码示例](code-examples.md) — TypeScript、Python、Go、Rust、jq
+- [数据模式](data-schema.md) — 完整 YAML 模式参考
+- [常见问题](faq.md) — 常见问题
+- [模型选择指南](model-selection.md) — 决策框架
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/audio-models.md b/docs/zh/audio-models.md
new file mode 100644
index 00000000..24379b44
--- /dev/null
+++ b/docs/zh/audio-models.md
@@ -0,0 +1,83 @@
+[English](../audio-models.md) | **中文**
+
+# 音频 AI 模型 — 语音、声音和音频理解
+
+具备 **音频输入**（语音识别、语音理解）和 **音频输出**（文本转语音、语音生成）能力的模型。所有数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) 一手 API。
+
+## 统计
+
+| Metric              | Count |
+| ------------------- | ----- |
+| Audio input models  | 115   |
+| Audio output models | 34    |
+| Total audio models  | 133   |
+| Providers           | 20    |
+| With tool calling   | 69    |
+| Free                | 8     |
+
+## 音频输入模型（语音/声音理解）
+
+可以处理音频输入的模型 — 转录语音、分析音频、理解语音命令：
+
+| Model                           | Provider       | Context | Input $/1M | Output $/1M | Tool Call |
+| ------------------------------- | -------------- | ------- | ---------- | ----------- | --------- |
+| mistral-voxtral-mini            | amazon-bedrock | 125K    | $0.04      | $0.04       |           |
+| voxtral-mini                    | mistral        | 125K    | $0.04      | $0.04       |           |
+| gemini-2.0-flash-lite           | google         | 1024K   | $0.075     | $0.3        | ✅        |
+| gemini-2-0-flash-lite           | google-vertex  | 1024K   | $0.075     | $0.3        | ✅        |
+| microsoft-phi-4-mini-multimodal | microsoft      | 125K    | $0.08      | $0.32       | ✅        |
+| gemini-2.0-flash                | google         | 1024K   | $0.1       | $0.4        | ✅        |
+| gemini-2.5-flash-lite           | google         | 1024K   | $0.1       | $0.4        | ✅        |
+| mistral-voxtral-small           | amazon-bedrock | 125K    | $0.1       | $0.3        |           |
+| voxtral-small                   | mistral        | 125K    | $0.1       | $0.3        |           |
+| amazon-nova-2.0-lite            | amazon         | 62K     | $0.15      | $1.25       | ✅        |
+| gemini-2.5-flash                | google         | 1024K   | $0.15      | $3.5        | ✅        |
+| gemini-2-0-flash                | google-vertex  | 1024K   | $0.15      | $0.6        | ✅        |
+| voxtral-small-24b-2507          | scaleway       | 128K    | $0.15      | $0.35       |           |
+| amazon-nova-2.0-omni            | amazon         | 62K     | $0.2       | $1.3        | ✅        |
+| xiaomi--mimo-v2.5               | hpc-ai         | 1024K   | $0.4       | $2          | ✅        |
+
+## 音频输出模型（文本转语音/语音生成）
+
+可以生成音频输出的模型 — 文本转语音、语音合成：
+
+| Model                  | Provider | Input $/1M | Output $/1M |
+| ---------------------- | -------- | ---------- | ----------- |
+| gpt-4o-audio           | openai   | $2.5       | $10         |
+| gpt-4o-realtime        | openai   | $5         | $20         |
+| step-audio-2           | stepfun  | $10        | $70         |
+| stepaudio-2.5-realtime | stepfun  | $10        | $70         |
+| o1-realtime            | openai   | $15        | $60         |
+| step-1o-audio          | stepfun  | $25        | $60         |
+
+## 免费音频模型
+
+| Model                             | Provider | Audio In | Audio Out | Context |
+| --------------------------------- | -------- | -------- | --------- | ------- |
+| qwen--qwen3-omni-30b-a3b-instruct | novitaai | ✅       | ✅        | 64K     |
+| qwen--qwen3-omni-30b-a3b-thinking | novitaai | ✅       |           | 64K     |
+| gemma-3n-E2B-it                   | google   | ✅       |           | 128K    |
+| gemma-3n-E4B-it                   | google   | ✅       |           | 128K    |
+| step-audio-r1.1                   | stepfun  | ✅       | ✅        | 0       |
+
+## 选择音频模型
+
+| Use Case            | Recommended               | Key Feature               |
+| ------------------- | ------------------------- | ------------------------- |
+| Voice assistants    | GPT-4o-audio              | Audio in/out + tool call  |
+| Transcription       | Whisper, Gemini 2.5 Flash | Fast, cheap audio input   |
+| Voice agents        | GPT-4o-realtime           | Real-time audio streaming |
+| Text-to-speech      | OpenAI TTS, ElevenLabs    | Natural voice output      |
+| Multilingual speech | Gemini 2.5 Pro            | 100+ languages            |
+
+## 相关文档
+
+- [Multimodal Models](multimodal-models.md) — 1,519 models with image/audio/video
+- [Vision Models](vision-models.md) — 1,487 models with image understanding
+- [Chat Models](chat-models.md) — 2,350 models with tool calling
+- [Tool Calling Models](tool-calling.md) — function calling capabilities
+- [Free AI Models](free-models.md) — 81 models at zero cost
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/benchmarks.md b/docs/zh/benchmarks.md
new file mode 100644
index 00000000..4c11dd1c
--- /dev/null
+++ b/docs/zh/benchmarks.md
@@ -0,0 +1,109 @@
+# AI 模型基准测试与排行榜
+
+[English](../benchmarks.md)
+
+AI 模型如何被评估 — 关键基准测试、排行榜格局，以及这些数字对模型选择的意义。
+
+数据来源：[AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么基准测试很重要
+
+基准测试提供了跨任务比较 AI 模型的标准化方式。然而，没有任何单一基准测试能说明全部问题。本指南涵盖主要基准测试、如何解读它们，以及如何将它们与我们的目录数据（定价、上下文窗口、能力）结合使用，以做出明智的模型选择。
+
+## 主要基准测试
+
+### 通用语言理解
+
+| 基准测试  | 测试内容               | 顶级模型                               | 备注                             |
+| --------- | ---------------------- | -------------------------------------- | -------------------------------- |
+| MMLU      | 多任务知识（57个学科） | GPT-4.1, Claude Opus 4, Gemini 2.5 Pro | 标准学术基准；可能不反映实际使用 |
+| MMLU-Pro  | 更难的 MMLU，需要推理  | o3, Claude Sonnet 4, Gemini 2.5 Pro    | 更具挑战性的版本                 |
+| GPQA      | 研究生水平科学问答     | o3, Gemini 2.5 Pro                     | 专家级推理                       |
+| HellaSwag | 常识推理               | 大多数前沿模型接近满分                 | 接近饱和                         |
+
+### 推理与数学
+
+| 基准测试      | 测试内容 | 顶级模型                    | 备注               |
+| ------------- | -------- | --------------------------- | ------------------ |
+| MATH-500      | 竞赛数学 | o3, DeepSeek R1, Qwen3-235B | 量化任务的关键指标 |
+| AIME 2024     | 数学竞赛 | o3, DeepSeek R1             | 非常有挑战性       |
+| GSM8K         | 小学数学 | 大多数模型 >90%             | 接近饱和           |
+| ARC-Challenge | 科学推理 | 大多数前沿模型              | 小学科学           |
+
+### 编程
+
+| 基准测试      | 测试内容             | 顶级模型                              | 备注                |
+| ------------- | -------------------- | ------------------------------------- | ------------------- |
+| HumanEval     | Python 代码生成      | Claude Sonnet 4, GPT-4.1, DeepSeek V3 | 164 个 Python 问题  |
+| SWE-bench     | 真实 GitHub 问题修复 | Claude Sonnet 4, o3                   | 比 HumanEval 更真实 |
+| LiveCodeBench | 持续更新的编程测试   | 各种                                  | 避免数据污染        |
+| MBPP          | 基础 Python 编程     | 大多数模型 >80%                       | 接近饱和            |
+
+### 多模态
+
+| 基准测试  | 测试内容     | 顶级模型                        | 备注         |
+| --------- | ------------ | ------------------------------- | ------------ |
+| MMMU      | 多模态理解   | Gemini 2.5 Pro, Claude Sonnet 4 | 图像 + 文本  |
+| MathVista | 视觉数学推理 | Gemini 2.5 Pro                  | 图表 + 数学  |
+| AI2D      | 科学图表     | Gemini 2.5 Pro                  | 科学图表理解 |
+| DocVQA    | 文档理解     | Gemini 2.5 Pro                  | 图像中的文本 |
+
+### 工具使用与智能体
+
+| 基准测试 | 测试内容       | 顶级模型                 | 备注                    |
+| -------- | -------------- | ------------------------ | ----------------------- |
+| BFCL v3  | 函数调用准确率 | GPT-4.1, Claude Sonnet 4 | Berkeley 函数调用排行榜 |
+| τ-bench  | 智能体任务完成 | 各种                     | 基于终端的智能体任务    |
+| WebArena | 网页交互       | 各种                     | 真实网页任务            |
+
+## 关键排行榜
+
+| 排行榜               | 侧重         | URL                                                                     |
+| -------------------- | ------------ | ----------------------------------------------------------------------- |
+| LMSYS Chatbot Arena  | 人类偏好排名 | https://chat.lmsys.org/                                                 |
+| Open LLM Leaderboard | 开源模型排名 | https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard |
+| AlpacaEval           | 指令遵循     | https://tatsu-lab.github.io/alpaca_eval/                                |
+| MT-Bench             | 多轮对话     | Chatbot Arena 的一部分                                                  |
+| BigBench             | 超越基础任务 | https://github.com/google/BIG-bench                                     |
+| MTEB                 | 嵌入模型     | https://huggingface.co/spaces/mteb/leaderboard                          |
+
+## 如何将基准测试与我们的目录结合使用
+
+仅靠基准测试不足以进行模型选择。将它们与我们的目录数据结合使用：
+
+1. **从你的用例开始** → 参见[模型选择指南](model-selection.md)
+2. **按能力筛选** → 工具调用、推理、视觉等
+3. **查看基准测试分数** → 针对你的特定任务领域
+4. **比较定价** → 使用我们的[定价比较](pricing-comparison.md)
+5. **考虑上下文窗口** → 参见[上下文窗口](context-windows.md)
+6. **用你的数据测试** → 基准测试是代理；实际性能可能不同
+
+## 基准测试的局限性
+
+- **数据污染**：模型可能在训练期间见过基准测试数据
+- **任务狭窄**：基准测试测试特定技能，而非通用实用性
+- **排行榜博弈**：为基准测试优化可能损害实际性能
+- **时效性**：随着模型改进，基准测试老化；饱和的基准测试变得无信息量
+- **文化偏见**：大多数基准测试以英语和西方为中心
+- **成本盲区**：基准测试忽略定价、延迟和可用性
+
+## 实用建议
+
+- **编程**：使用 SWE-bench 而非 HumanEval（更真实）
+- **智能体**：用你实际的工具套件测试；BFCL 是起点
+- **推理**：MATH-500 和 GPQA 比 MMLU 更有区分度
+- **聊天**：Chatbot Arena 与人类偏好最相关
+- **成本敏感**：先使用我们的[免费模型](free-models.md)指南
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [定价比较](pricing-comparison.md) — 跨提供商成本分析
+- [免费模型](free-models.md) — 81 个免费模型及其能力
+- [工具调用模型](tool-calling.md) — 2,350 个支持函数调用的模型
+- [推理模型](reasoning-models.md) — 1,306 个支持扩展思考的模型
+- [视觉模型](vision-models.md) — 1,487 个支持图像理解的模型
+- [编程模型](code-models.md) — 针对编程优化的模型
+- [开放权重](open-weights.md) — 527 个开放权重模型
+- [上下文窗口](context-windows.md) — 上下文窗口比较
+- [交互式目录](https://i-need-token.github.io/ai-models/) — 浏览和比较所有模型
diff --git a/docs/zh/cached-pricing.md b/docs/zh/cached-pricing.md
new file mode 100644
index 00000000..0b87ce23
--- /dev/null
+++ b/docs/zh/cached-pricing.md
@@ -0,0 +1,245 @@
+# 缓存定价
+
+[English](../cached-pricing.md)
+
+支持提示缓存的 AI 模型，展示标准定价与缓存定价对比。缓存输入可比标准输入 token **便宜 50-90%**。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么缓存定价很重要
+
+提示缓存允许你存储重复的提示前缀（系统提示、少样本示例、工具定义），并在多个请求中复用。这显著降低了：
+
+- **成本**：输入 token 节省 50-90%
+- **延迟**：缓存内容的首 token 时间更快
+- **吞吐量**：更高效地利用速率限制
+
+## 统计
+
+| 指标               | 数量 |
+| ------------------ | ---- |
+| 支持缓存定价的模型 | 1374 |
+| 提供商             | 39   |
+
+## 提供商
+
+`aihubmix`, `aion`, `amazon-bedrock`, `auriko`, `baidu`, `baseten`, `chutes`, `clarifai`, `cloudflare`, `cortecs`, `databricks`, `deepinfra`, `deepseek`, `digitalocean`, `fastrouter`, `friendli`, `google`, `google-vertex`, `groq`, `hpc-ai`, `inception`, `jiekou`, `llmgateway`, `martian`, `minimax`, `moonshotai`, `nanogpt`, `openai`, `openrouter`, `ppio`, `privatemode`, `requesty`, `siliconflow`, `stepfun`, `tencent-tokenhub`, `togetherai`, `upstage`, `venice`, `wafer`
+
+## 模型定价
+
+| 模型                                          | 提供商         | 上下文 | 输入 $/M            | 缓存读取 $/M         | 缓存写入 $/M | 节省  |
+| --------------------------------------------- | -------------- | ------ | ------------------- | -------------------- | ------------ | ----- |
+| aistudio_gemini-2.0-flash                     | aihubmix       | —      | $0.05               | $0.125               | —            | -150% |
+| aistudio_gpt-4.1-mini                         | aihubmix       | —      | $0.2                | $0.05                | —            | 75%   |
+| anthropic-opus-4-6                            | aihubmix       | —      | $2.5                | $0.25                | $3.125       | 90%   |
+| claude-haiku-4-5                              | aihubmix       | —      | $0.55               | $0.055               | $0.6875      | 90%   |
+| claude-sonnet-4-0                             | aihubmix       | —      | $1.65               | $0.165               | $2.0625      | 90%   |
+| claude-sonnet-4-5                             | aihubmix       | —      | $1.65               | $0.165               | $2.0625      | 90%   |
+| claude-sonnet-4-5-think                       | aihubmix       | —      | $1.65               | $0.165               | $2.0625      | 90%   |
+| codex-mini-latest                             | aihubmix       | —      | $0.75               | $0.1875              | —            | 75%   |
+| deepseek-v3.2                                 | aihubmix       | —      | $0.151              | $0.0151              | —            | 90%   |
+| deepseek-v3.2-exp                             | aihubmix       | —      | $0.137              | $0.0137              | —            | 90%   |
+| deepseek-v3.2-exp-think                       | aihubmix       | —      | $0.137              | $0.0137              | —            | 90%   |
+| deepseek-v3.2-think                           | aihubmix       | —      | $0.151              | $0.0151              | —            | 90%   |
+| doubao-1.5-lite-32k                           | aihubmix       | —      | $0.025              | $0.005               | —            | 80%   |
+| doubao-1.5-pro-32k                            | aihubmix       | —      | $0.067              | $0.0134              | —            | 80%   |
+| doubao-lite-32k                               | aihubmix       | —      | $0.03               | $0.006               | —            | 80%   |
+| doubao-pro-32k                                | aihubmix       | —      | $0.07               | $0.014               | —            | 80%   |
+| doubao-seed-1-6                               | aihubmix       | —      | $0.09               | $0.018               | —            | 80%   |
+| doubao-seed-1-6-250615                        | aihubmix       | —      | $0.09               | $0.018               | —            | 80%   |
+| doubao-seed-1-6-flash                         | aihubmix       | —      | $0.022              | $0.0044              | —            | 80%   |
+| doubao-seed-1-6-flash-250615                  | aihubmix       | —      | $0.022              | $0.0044              | —            | 80%   |
+| doubao-seed-1-6-lite                          | aihubmix       | —      | $0.041              | $0.0082              | —            | 80%   |
+| doubao-seed-1-6-thinking                      | aihubmix       | —      | $0.09               | $0.018               | —            | 80%   |
+| doubao-seed-1-6-thinking-250615               | aihubmix       | —      | $0.09               | $0.018               | —            | 80%   |
+| doubao-seed-1-6-vision-250815                 | aihubmix       | —      | $0.054795           | $0.010959            | —            | 80%   |
+| doubao-seed-1-8                               | aihubmix       | —      | $0.054795           | $0.010959            | —            | 80%   |
+| gemini-2.0-flash                              | aihubmix       | —      | $0.05               | $0.0125              | —            | 75%   |
+| gemini-2.0-flash-001                          | aihubmix       | —      | $0.05               | $0.125               | —            | -150% |
+| gemini-2.0-flash-search                       | aihubmix       | —      | $0.05               | $0.0125              | —            | 75%   |
+| gemini-2.5-flash                              | aihubmix       | —      | $0.15               | $0.015               | —            | 90%   |
+| gemini-2.5-flash-lite                         | aihubmix       | —      | $0.05               | $0.005               | —            | 90%   |
+| gemini-2.5-flash-lite-nothink                 | aihubmix       | —      | $0.05               | $0.005               | —            | 90%   |
+| gemini-2.5-flash-lite-preview-09-2025         | aihubmix       | —      | $0.05               | $0.005               | —            | 90%   |
+| gemini-2.5-flash-lite-preview-09-2025-nothink | aihubmix       | —      | $0.05               | $0.005               | —            | 90%   |
+| gemini-2.5-flash-nothink                      | aihubmix       | —      | $0.15               | $0.015               | —            | 90%   |
+| gemini-2.5-flash-preview-05-20-nothink        | aihubmix       | —      | $0.15               | $0.015               | —            | 90%   |
+| gemini-2.5-flash-preview-05-20-search         | aihubmix       | —      | $0.15               | $0.015               | —            | 90%   |
+| gemini-2.5-flash-preview-09-2025              | aihubmix       | —      | $0.15               | $0.015               | —            | 90%   |
+| gemini-2.5-flash-search                       | aihubmix       | —      | $0.15               | $0.015               | —            | 90%   |
+| gemini-2.5-pro                                | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-exp-03-25                      | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-preview-03-25                  | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-preview-03-25-search           | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-preview-05-06                  | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-preview-05-06-search           | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-preview-06-05                  | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-preview-06-05-search           | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gemini-2.5-pro-search                         | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| glm-4.5-airx                                  | aihubmix       | —      | $0.55               | $0.11                | —            | 80%   |
+| glm-4.5-x                                     | aihubmix       | —      | $1.1                | $0.22                | —            | 80%   |
+| glm-4.6                                       | aihubmix       | —      | $0.136987           | $0.027397            | —            | 80%   |
+| glm-4.6v                                      | aihubmix       | —      | $0.0685             | $0.0137              | —            | 80%   |
+| glm-4.7                                       | aihubmix       | —      | $0.136987           | $0.027397            | —            | 80%   |
+| gpt-4.1                                       | aihubmix       | —      | $1                  | $0.25                | —            | 75%   |
+| gpt-4.1-mini                                  | aihubmix       | —      | $0.2                | $0.05                | —            | 75%   |
+| gpt-4.1-nano                                  | aihubmix       | —      | $0.05               | $0.0125              | —            | 75%   |
+| gpt-4o                                        | aihubmix       | —      | $1.25               | $0.625               | —            | 50%   |
+| gpt-4o-2024-08-06                             | aihubmix       | —      | $1.25               | $0.625               | —            | 50%   |
+| gpt-4o-2024-08-06-global                      | aihubmix       | —      | $1.25               | $0.625               | —            | 50%   |
+| gpt-4o-2024-11-20                             | aihubmix       | —      | $1.25               | $0.625               | —            | 50%   |
+| gpt-4o-mini                                   | aihubmix       | —      | $0.075              | $0.0375              | —            | 50%   |
+| gpt-4o-mini-2024-07-18                        | aihubmix       | —      | $0.075              | $0.0375              | —            | 50%   |
+| gpt-4o-mini-global                            | aihubmix       | —      | $0.075              | $0.0375              | —            | 50%   |
+| gpt-4o-mini-search-preview                    | aihubmix       | —      | $0.075              | $0.0375              | —            | 50%   |
+| gpt-4o-search-preview                         | aihubmix       | —      | $1.25               | $0.625               | —            | 50%   |
+| gpt-5                                         | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gpt-5-chat-latest                             | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gpt-5-codex                                   | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gpt-5-mini                                    | aihubmix       | —      | $0.125              | $0.0125              | —            | 90%   |
+| gpt-5-nano                                    | aihubmix       | —      | $0.025              | $0.0025              | —            | 90%   |
+| gpt-5.1                                       | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gpt-5.1-chat-latest                           | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gpt-5.1-codex                                 | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gpt-5.1-codex-max                             | aihubmix       | —      | $0.625              | $0.0625              | —            | 90%   |
+| gpt-5.1-codex-mini                            | aihubmix       | —      | $0.125              | $0.0125              | —            | 90%   |
+| gpt-5.2                                       | aihubmix       | —      | $0.875              | $0.0875              | —            | 90%   |
+| gpt-5.2-chat-latest                           | aihubmix       | —      | $0.875              | $0.0875              | —            | 90%   |
+| gpt-5.2-codex                                 | aihubmix       | —      | $0.875              | $0.0875              | —            | 90%   |
+| gpt-5.2-high                                  | aihubmix       | —      | $0.875              | $0.0875              | —            | 90%   |
+| gpt-5.2-low                                   | aihubmix       | —      | $0.875              | $0.0875              | —            | 90%   |
+| gpt-5.2-pro                                   | aihubmix       | —      | $10.5               | $1.05                | —            | 90%   |
+| grok-4                                        | aihubmix       | —      | $1.65               | $0.4125              | —            | 75%   |
+| grok-4-1-fast-non-reasoning                   | aihubmix       | —      | $0.1                | $0.025               | —            | 75%   |
+| grok-4-1-fast-reasoning                       | aihubmix       | —      | $0.1                | $0.025               | —            | 75%   |
+| grok-4-fast-non-reasoning                     | aihubmix       | —      | $0.1                | $0.025               | —            | 75%   |
+| grok-4-fast-reasoning                         | aihubmix       | —      | $0.1                | $0.025               | —            | 75%   |
+| grok-4.20-beta-0309-non-reasoning             | aihubmix       | —      | $1                  | $0.1                 | —            | 90%   |
+| grok-4.20-beta-0309-reasoning                 | aihubmix       | —      | $1                  | $0.1                 | —            | 90%   |
+| grok-4.20-multi-agent-0309                    | aihubmix       | —      | $1                  | $0.1                 | —            | 90%   |
+| grok-4.20-multi-agent-beta-0309               | aihubmix       | —      | $1                  | $0.1                 | —            | 90%   |
+| grok-code-fast-1                              | aihubmix       | —      | $0.1                | $0.025               | —            | 75%   |
+| kimi-k2-thinking                              | aihubmix       | —      | $0.274              | $0.0685              | —            | 75%   |
+| kimi-k2-turbo-preview                         | aihubmix       | —      | $0.6                | $0.15                | —            | 75%   |
+| kimi-k2.5                                     | aihubmix       | —      | $0.3                | $0.0525              | —            | 82%   |
+| mimo-v2-flash                                 | aihubmix       | —      | $0.0959             | $0.01918             | —            | 80%   |
+| mimo-v2-omni                                  | aihubmix       | —      | $0.22               | $0.044               | —            | 80%   |
+| mimo-v2-pro                                   | aihubmix       | —      | $0.55               | $0.11                | —            | 80%   |
+| nvidia-nemotron-3-super-120b-a12b             | aihubmix       | —      | $0.055              | $0.01375             | —            | 75%   |
+| o1                                            | aihubmix       | —      | $7.5                | $3.75                | —            | 50%   |
+| o1-2024-12-17                                 | aihubmix       | —      | $7.5                | $3.75                | —            | 50%   |
+| o1-global                                     | aihubmix       | —      | $7.5                | $3.75                | —            | 50%   |
+| o1-mini                                       | aihubmix       | —      | $1.5                | $0.75                | —            | 50%   |
+| o1-mini-2024-09-12                            | aihubmix       | —      | $1.5                | $0.75                | —            | 50%   |
+| o1-preview                                    | aihubmix       | —      | $7.5                | $3.75                | —            | 50%   |
+| o1-preview-2024-09-12                         | aihubmix       | —      | $7.5                | $3.75                | —            | 50%   |
+| o3                                            | aihubmix       | —      | $1                  | $0.25                | —            | 75%   |
+| o3-deep-research                              | aihubmix       | —      | $5                  | $1.25                | —            | 75%   |
+| o3-global                                     | aihubmix       | —      | $1                  | $0.25                | —            | 75%   |
+| o3-mini                                       | aihubmix       | —      | $0.55               | $0.275               | —            | 50%   |
+| o3-mini-global                                | aihubmix       | —      | $0.55               | $0.275               | —            | 50%   |
+| o4-mini                                       | aihubmix       | —      | $0.55               | $0.1375              | —            | 75%   |
+| qwen-plus                                     | aihubmix       | —      | $0.0563             | $0.01126             | $0.070375    | 80%   |
+| qwen-plus-2025-04-28                          | aihubmix       | —      | $0.0563             | $0.01126             | $0.070375    | 80%   |
+| qwen-plus-2025-07-28                          | aihubmix       | —      | $0.0563             | $0.01126             | $0.070375    | 80%   |
+| qwen-plus-latest                              | aihubmix       | —      | $0.0563             | $0.01126             | $0.070375    | 80%   |
+| qwen-turbo                                    | aihubmix       | —      | $0.023              | $0.0046              | —            | 80%   |
+| qwen-turbo-latest                             | aihubmix       | —      | $0.023              | $0.0046              | —            | 80%   |
+| qwen3-coder-plus                              | aihubmix       | —      | $0.27               | $0.054               | —            | 80%   |
+| qwen3-max                                     | aihubmix       | —      | $0.2254             | $0.04508             | $0.28175     | 80%   |
+| qwen3-max-2026-01-23                          | aihubmix       | —      | $0.2254             | $0.04508             | $0.28175     | 80%   |
+| qwen3-max-preview                             | aihubmix       | —      | $0.423              | $0.0846              | —            | 80%   |
+| qwen3-vl-flash                                | aihubmix       | —      | $0.0103             | $0.00206             | —            | 80%   |
+| qwen3-vl-plus                                 | aihubmix       | —      | $0.0685             | $0.0137              | —            | 80%   |
+| zai-glm-5-turbo                               | aihubmix       | —      | $0.6                | $0.12                | —            | 80%   |
+| aion-2.0                                      | aion           | —      | $0.7999999999999999 | $0.19999999999999998 | —            | 75%   |
+| aion-2.5                                      | aion           | —      | $1                  | $0.35                | —            | 65%   |
+| amazon-nova-2-lite                            | amazon-bedrock | —      | $0.33               | $0.0825              | —            | 75%   |
+| amazon-nova-lite                              | amazon-bedrock | —      | $0.06               | $0.015               | —            | 75%   |
+| amazon-nova-micro                             | amazon-bedrock | —      | $0.035              | $0.00875             | —            | 75%   |
+| amazon-nova-premier                           | amazon-bedrock | —      | $2.5                | $0.625               | —            | 75%   |
+| amazon-nova-pro                               | amazon-bedrock | —      | $0.8                | $0.2                 | —            | 75%   |
+| claude-haiku-4-5-20251001                     | auriko         | —      | $1                  | $0.1                 | $1.25        | 90%   |
+| claude-opus-4-1-20250805                      | auriko         | —      | $15                 | $1.5                 | $18.75       | 90%   |
+| claude-opus-4-20250514                        | auriko         | —      | $15                 | $1.5                 | $18.75       | 90%   |
+| claude-opus-4-5-20251101                      | auriko         | —      | $5                  | $0.5                 | $6.25        | 90%   |
+| claude-opus-4-6                               | auriko         | —      | $5                  | $0.5                 | $6.25        | 90%   |
+| claude-opus-4-7                               | auriko         | —      | $5                  | $0.5                 | $6.25        | 90%   |
+| claude-sonnet-4-20250514                      | auriko         | —      | $3                  | $0.3                 | $3.75        | 90%   |
+| claude-sonnet-4-5-20250929                    | auriko         | —      | $3                  | $0.3                 | $3.75        | 90%   |
+| claude-sonnet-4-6                             | auriko         | —      | $3                  | $0.3                 | $3.75        | 90%   |
+| deepseek-r1-0528                              | auriko         | —      | $0.5                | $0.35                | —            | 30%   |
+| deepseek-v3-0324                              | auriko         | —      | $0.2                | $0.135               | —            | 32%   |
+| deepseek-v3.1                                 | auriko         | —      | $0.21               | $0.13                | —            | 38%   |
+| deepseek-v3.1-terminus                        | auriko         | —      | $0.27               | $0.13                | —            | 52%   |
+| deepseek-v3.2                                 | auriko         | —      | $0.26               | $0.13                | —            | 50%   |
+| deepseek-v4-flash                             | auriko         | —      | $0.14               | $0.0028              | —            | 98%   |
+| deepseek-v4-pro                               | auriko         | —      | $0.435              | $0.003625            | —            | 99%   |
+| gemini-2.5-flash                              | auriko         | —      | $0.3                | $0.03                | —            | 90%   |
+| gemini-2.5-flash-lite                         | auriko         | —      | $0.1                | $0.01                | —            | 90%   |
+| gemini-2.5-pro                                | auriko         | —      | $1.25               | $0.125               | —            | 90%   |
+| gemini-3-flash-preview                        | auriko         | —      | $0.5                | $0.05                | —            | 90%   |
+| gemini-3.1-flash-lite                         | auriko         | —      | $0.25               | $0.025               | —            | 90%   |
+| gemini-3.1-flash-lite-preview                 | auriko         | —      | $0.25               | $0.025               | —            | 90%   |
+| gemini-3.1-pro-preview                        | auriko         | —      | $2                  | $0.2                 | —            | 90%   |
+| gemini-3.1-pro-preview-customtools            | auriko         | —      | $2                  | $0.2                 | —            | 90%   |
+| gemini-flash-latest                           | auriko         | —      | $0.5                | $0.05                | —            | 90%   |
+| gemini-flash-lite-latest                      | auriko         | —      | $0.1                | $0.01                | —            | 90%   |
+| gemini-pro-latest                             | auriko         | —      | $2                  | $0.2                 | —            | 90%   |
+| glm-4.5                                       | auriko         | —      | $0.6                | $0.11                | —            | 82%   |
+| glm-4.5-air                                   | auriko         | —      | $0.2                | $0.03                | —            | 85%   |
+| glm-4.5-airx                                  | auriko         | —      | $1.1                | $0.22                | —            | 80%   |
+| glm-4.5-x                                     | auriko         | —      | $2.2                | $0.45                | —            | 80%   |
+| glm-4.5v                                      | auriko         | —      | $0.6                | $0.11                | —            | 82%   |
+| glm-4.6                                       | auriko         | —      | $0.6                | $0.11                | —            | 82%   |
+| glm-4.6v                                      | auriko         | —      | $0.3                | $0.05                | —            | 83%   |
+| glm-4.6v-flashx                               | auriko         | —      | $0.04               | $0.004               | —            | 90%   |
+| glm-4.7                                       | auriko         | —      | $0.6                | $0.11                | —            | 82%   |
+| glm-4.7-flashx                                | auriko         | —      | $0.07               | $0.01                | —            | 86%   |
+| glm-5                                         | auriko         | —      | $1                  | $0.2                 | —            | 80%   |
+| glm-5-turbo                                   | auriko         | —      | $1.2                | $0.24                | —            | 80%   |
+| glm-5.1                                       | auriko         | —      | $1.4                | $0.26                | —            | 81%   |
+| glm-5v-turbo                                  | auriko         | —      | $1.2                | $0.24                | —            | 80%   |
+| gpt-4.1-2025-04-14                            | auriko         | —      | $2                  | $0.5                 | —            | 75%   |
+| gpt-4.1-mini-2025-04-14                       | auriko         | —      | $0.4                | $0.1                 | —            | 75%   |
+| gpt-4.1-nano-2025-04-14                       | auriko         | —      | $0.1                | $0.025               | —            | 75%   |
+| gpt-4o-2024-08-06                             | auriko         | —      | $2.5                | $1.25                | —            | 50%   |
+| gpt-4o-2024-11-20                             | auriko         | —      | $2.5                | $1.25                | —            | 50%   |
+| gpt-4o-mini-2024-07-18                        | auriko         | —      | $0.15               | $0.075               | —            | 50%   |
+| gpt-5-2025-08-07                              | auriko         | —      | $1.25               | $0.125               | —            | 90%   |
+| gpt-5-chat-latest                             | auriko         | —      | $1.25               | $0.125               | —            | 90%   |
+| gpt-5-mini-2025-08-07                         | auriko         | —      | $0.25               | $0.025               | —            | 90%   |
+| gpt-5-nano-2025-08-07                         | auriko         | —      | $0.05               | $0.005               | —            | 90%   |
+| gpt-5.1-2025-11-13                            | auriko         | —      | $1.25               | $0.125               | —            | 90%   |
+| gpt-5.1-chat-latest                           | auriko         | —      | $1.25               | $0.125               | —            | 90%   |
+| gpt-5.2-2025-12-11                            | auriko         | —      | $1.75               | $0.175               | —            | 90%   |
+| gpt-5.2-chat-latest                           | auriko         | —      | $1.75               | $0.175               | —            | 90%   |
+| gpt-5.3-chat-latest                           | auriko         | —      | $1.75               | $0.175               | —            | 90%   |
+| gpt-5.4-2026-03-05                            | auriko         | —      | $2.5                | $0.25                | —            | 90%   |
+| gpt-5.4-mini-2026-03-17                       | auriko         | —      | $0.75               | $0.075               | —            | 90%   |
+| gpt-5.4-nano-2026-03-17                       | auriko         | —      | $0.2                | $0.02                | —            | 90%   |
+| gpt-5.5-2026-04-23                            | auriko         | —      | $5                  | $0.5                 | —            | 90%   |
+| gpt-oss-120b                                  | auriko         | —      | $0.15               | $0.01                | —            | 93%   |
+| gpt-oss-20b                                   | auriko         | —      | $0.07               | $0.04                | —            | 43%   |
+| grok-4.20-0309-non-reasoning                  | auriko         | —      | $1.25               | $0.2                 | —            | 84%   |
+| grok-4.20-0309-reasoning                      | auriko         | —      | $1.25               | $0.2                 | —            | 84%   |
+| grok-4.3                                      | auriko         | —      | $1.25               | $0.2                 | —            | 84%   |
+| hy3-preview                                   | auriko         | —      | $0.066              | $0.029               | —            | 56%   |
+| kimi-k2-0711-preview                          | auriko         | —      | $0.6                | $0.15                | —            | 75%   |
+| kimi-k2-0905-preview                          | auriko         | —      | $0.6                | $0.15                | —            | 75%   |
+| kimi-k2-thinking                              | auriko         | —      | $0.6                | $0.15                | —            | 75%   |
+| kimi-k2-thinking-turbo                        | auriko         | —      | $1.15               | $0.15                | —            | 87%   |
+
+> 📄 显示前 200 个，共 1374 个模型。使用[交互式目录](https://i-need-token.github.io/ai-models/)浏览全部。
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 成本优化技巧
+- [定价对比](pricing-comparison.md) — 各提供商定价并排对比
+- [免费 AI 模型](free-models.md) — 81 个免费模型
+- [上下文窗口对比](context-windows.md) — 最大上下文窗口
+- [开源权重模型](open-weights.md) — 527 个可自行运行的模型
diff --git a/docs/zh/chat-models.md b/docs/zh/chat-models.md
new file mode 100644
index 00000000..584b0ec6
--- /dev/null
+++ b/docs/zh/chat-models.md
@@ -0,0 +1,99 @@
+# 聊天模型
+
+[English](../chat-models.md)
+
+支持**工具调用**的 AI 模型 — 构建聊天应用、AI 助手和对话智能体的核心能力。这些模型可以理解自然语言、生成回复并调用外部工具。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么聊天模型很重要
+
+聊天模型是现代 AI 应用的基石：
+
+- **对话式 AI** — 带上下文的自然语言对话
+- **AI 助手** — 面向任务的聊天与工具使用
+- **客户支持** — 带知识库访问的自动化支持
+- **内容生成** — 写作、摘要、翻译
+- **数据分析** — 自然语言查询结构化数据
+
+工具调用是关键差异化能力 — 它允许模型超越文本生成，在现实世界中采取行动。
+
+## 统计
+
+| 指标                     | 数量 |
+| ------------------------ | ---- |
+| 聊天模型（支持工具调用） | 2350 |
+| 提供商                   | 71   |
+| 免费聊天模型             | 54   |
+| 开源权重聊天模型         | 278  |
+| 带推理能力               | 1080 |
+| 带结构化输出             | 758  |
+
+## 提供商
+
+`01ai`, `302ai`, `aihubmix`, `aimlapi`, `alibaba`, `amazon`, `amazon-bedrock`, `anthropic`, `arcee`, `auriko`, `baidu`, `baseten`, `berget`, `bytedance`, `cerebras`, `chutes`, `clarifai`, `cloudferro-sherlock`, `cloudflare`, `cortecs`, `databricks`, `deepseek`, `digitalocean`, `dinference`, `evroc` 等 46 个
+
+## 免费聊天模型
+
+支持工具调用的免费模型 — 零成本聊天应用。
+
+| 模型                                                 | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 能力  |
+| ---------------------------------------------------- | ---------- | ------ | -------- | -------- | ----- |
+| openrouter--owl-alpha                                | openrouter | 1M     | Free     | Free     | 📋    |
+| deepseek--deepseek-v4-flash--free                    | openrouter | 1M     | Free     | Free     | 🧠    |
+| qwen--qwen3-coder--free                              | openrouter | 1M     | Free     | Free     |       |
+| nvidia--nemotron-3-super-120b-a12b--free             | openrouter | 1M     | Free     | Free     | 🧠 📋 |
+| google--gemma-4-26b-a4b-it--free                     | openrouter | 262K   | Free     | Free     | 🧠 📋 |
+| arcee-ai--trinity-large-thinking--free               | openrouter | 262K   | Free     | Free     | 🧠    |
+| google--gemma-4-31b-it--free                         | openrouter | 262K   | Free     | Free     | 🧠 📋 |
+| gemma-4-26b-a4b-it                                   | auriko     | 262K   | Free     | Free     | 🧠 📋 |
+| gemma-4-31b-it                                       | auriko     | 262K   | Free     | Free     | 🧠 📋 |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter | 256K   | Free     | Free     | 🧠    |
+
+## 最便宜聊天模型
+
+生产环境聊天的最佳性价比模型。
+
+| 模型                                        | 提供商       | 上下文 | 输入 $/M | 输出 $/M | 能力 |
+| ------------------------------------------- | ------------ | ------ | -------- | -------- | ---- |
+| ernie-4.5-0.3b                              | aihubmix     | 0      | $0.0068  | $0.0272  | 📋   |
+| bdc-coder                                   | inferencenet | 131K   | $0.01    | $0.01    | 🔓   |
+| inclusionai--ling-2.6-flash                 | openrouter   | 262K   | $0.01    | $0.03    | 📋   |
+| ling-2.6-flash                              | inclusionai  | 262K   | $0.01    | $0.03    |      |
+| qwen-3.5-0.8b                               | auriko       | 262K   | $0.01    | $0.05    | 🧠   |
+| qwen3-vl-flash-2026-01-22                   | aihubmix     | 0      | $0.0103  | $0.103   | 📋   |
+| qwen3-vl-flash                              | aihubmix     | 0      | $0.0103  | $0.103   | 📋   |
+| klusterai--Meta-Llama-3.1-8B-Instruct-Turbo | klusterai    | 131K   | $0.015   | $0.02    |      |
+| granite-4.0-h-micro                         | cloudflare   | 131K   | $0.017   | $0.112   | 🔓   |
+| llama-3.1-8b-instruct                       | cortecs      | 0      | $0.018   | $0.054   | 🧠   |
+
+## 大上下文聊天模型
+
+上下文窗口最大的聊天模型 — 适用于长对话和文档分析。
+
+| 模型                         | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 能力 |
+| ---------------------------- | ---------- | ------ | -------- | -------- | ---- |
+| meta-llama--llama-4-scout    | openrouter | 10M    | $0.08    | $0.3     | 📋   |
+| meta-llama-4-scout           | meta       | 10M    | $0.17    | $0.66    |      |
+| gemini-1.5-pro               | google     | 2M     | $1.25    | $5       | 📋   |
+| grok-code-fast-1             | jiekou     | 2M     | $0.19    | $0.475   |      |
+| gpt-4o                       | jiekou     | 2M     | $1.9     | $5.7     |      |
+| grok-4.20-0309-non-reasoning | jiekou     | 2M     | $0.19    | $0.475   |      |
+| grok-4.20-0309-reasoning     | jiekou     | 2M     | $1.9     | $5.7     |      |
+| grok-4-1-fast-reasoning      | jiekou     | 2M     | $0.19    | $0.475   |      |
+| grok-4-fast-reasoning        | jiekou     | 2M     | $0.19    | $0.475   |      |
+| x-ai--grok-4-fast            | fastrouter | 2M     | $0.2     | $0.5     |      |
+
+## 相关文档
+
+- [智能体模型](agentic-models.md) — 1,080 个具备工具调用 + 推理能力的模型
+- [推理模型](reasoning-models.md) — 1,306 个支持推理的模型
+- [代码模型](code-models.md) — 189 个代码模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [结构化输出](structured-output.md) — 829 个 JSON 模式模型
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/code-examples.md b/docs/zh/code-examples.md
new file mode 100644
index 00000000..759b45c9
--- /dev/null
+++ b/docs/zh/code-examples.md
@@ -0,0 +1,367 @@
+# 代码示例
+
+[English](../code-examples.md) | **中文**
+
+多种语言使用 AI Models Catalog 数据的实用代码示例。
+
+## 下载数据
+
+```bash
+# JSON — 完整元数据 (2.3 MB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — 适用于 Excel/Google Sheets 的平面表格 (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+```
+
+或使用 [jsDelivr CDN](https://www.jsdelivr.com/package/npm/ai-models)（无需下载，支持 CORS）：
+
+```bash
+# 始终最新，可在浏览器中使用
+curl -s https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+```
+
+## TypeScript / JavaScript
+
+### 安装 npm 包
+
+```bash
+npm install ai-models
+```
+
+### 基本用法
+
+```typescript
+import catalog from "ai-models";
+import type { Model } from "ai-models";
+
+// 模型总数
+console.log(`Total models: ${catalog.models.length}`);
+
+// 按提供商查找模型
+const openaiModels = catalog.models.filter((m) => m.provider === "openai");
+console.log(`OpenAI models: ${openaiModels.length}`);
+```
+
+### 查找最便宜的工具调用模型
+
+```typescript
+import catalog from "ai-models";
+
+const affordable = catalog.models
+  .filter((m) => m.tool_call && m.pricing?.input && m.pricing.input < 1)
+  .sort((a, b) => a.pricing.input - b.pricing.input)
+  .slice(0, 10);
+
+for (const m of affordable) {
+  console.log(`${m.name}: $${m.pricing.input}/1M input, $${m.pricing.output}/1M output`);
+}
+```
+
+### 查找最大上下文窗口的模型
+
+```typescript
+import catalog from "ai-models";
+
+const largest = catalog.models
+  .filter((m) => m.limit?.context)
+  .sort((a, b) => b.limit.context - a.limit.context)
+  .slice(0, 10);
+
+for (const m of largest) {
+  console.log(`${m.name}: ${(m.limit.context / 1_000_000).toFixed(1)}M context`);
+}
+```
+
+### 查找支持视觉的免费模型
+
+```typescript
+import catalog from "ai-models";
+
+const freeVision = catalog.models.filter(
+  (m) => m.pricing?.unit === "free" && m.modalities?.input?.includes("image"),
+);
+
+console.log(`Free vision models: ${freeVision.length}`);
+for (const m of freeVision) {
+  console.log(`- ${m.name} (${m.provider})`);
+}
+```
+
+## Python
+
+### 使用 JSON 数据
+
+```python
+import json
+import urllib.request
+
+# 下载最新数据
+url = "https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+urllib.request.urlretrieve(url, "models.json")
+
+with open("models.json") as f:
+    catalog = json.load(f)
+
+print(f"Total models: {len(catalog['models'])}")
+```
+
+### 查找输出价格低于 $5/1M 的推理模型
+
+```python
+reasoning_cheap = [
+    m for m in catalog["models"]
+    if m.get("reasoning")
+    and m.get("pricing", {}).get("output")
+    and m["pricing"]["output"] < 5
+]
+
+for m in sorted(reasoning_cheap, key=lambda x: x["pricing"]["output"]):
+    print(f"{m['name']}: ${m['pricing']['output']}/1M output")
+```
+
+### 使用 pandas 处理 CSV
+
+```python
+import pandas as pd
+
+df = pd.read_csv("https://github.com/i-need-token/ai-models/releases/latest/download/models.csv")
+
+# 筛选和排序
+tool_calling = df[df["tool_call"] == True].sort_values("pricing_input")
+print(tool_calling[["name", "provider", "pricing_input", "pricing_output"]].head(10))
+```
+
+### 查找支持工具调用的开源模型
+
+```python
+open_tool = [
+    m for m in catalog["models"]
+    if m.get("open_weights") and m.get("tool_call")
+]
+
+print(f"Open-weight models with tool calling: {len(open_tool)}")
+for m in open_tool[:10]:
+    print(f"  - {m['name']} ({m['provider']})")
+```
+
+## Go
+
+```go
+package main
+
+import (
+    "encoding/json"
+    "fmt"
+    "net/http"
+)
+
+type Catalog struct {
+    Models []Model `json:"models"`
+}
+
+type Model struct {
+    ID       string  `json:"id"`
+    Name     string  `json:"name"`
+    Provider string  `json:"provider"`
+    ToolCall bool    `json:"tool_call"`
+    Pricing  Pricing `json:"pricing"`
+}
+
+type Pricing struct {
+    Input  float64 `json:"input"`
+    Output float64 `json:"output"`
+}
+
+func main() {
+    resp, err := http.Get("https://github.com/i-need-token/ai-models/releases/latest/download/models.json")
+    if err != nil {
+        panic(err)
+    }
+    defer resp.Body.Close()
+
+    var catalog Catalog
+    json.NewDecoder(resp.Body).Decode(&catalog)
+
+    fmt.Printf("Total models: %d\n", len(catalog.Models))
+
+    // 查找输入价格低于 $1/1M 的工具调用模型
+    for _, m := range catalog.Models {
+        if m.ToolCall && m.Pricing.Input > 0 && m.Pricing.Input < 1 {
+            fmt.Printf("%s: $%.2f/1M input\n", m.Name, m.Pricing.Input)
+        }
+    }
+}
+```
+
+## Rust
+
+```rust
+use serde::Deserialize;
+
+#[derive(Deserialize)]
+struct Catalog {
+    models: Vec<Model>,
+}
+
+#[derive(Deserialize)]
+struct Model {
+    id: String,
+    name: String,
+    provider: String,
+    #[serde(default)]
+    tool_call: bool,
+    pricing: Option<Pricing>,
+}
+
+#[derive(Deserialize)]
+struct Pricing {
+    input: f64,
+    output: f64,
+}
+
+fn main() -> Result<(), Box<dyn std::error::Error>> {
+    let data = reqwest::blocking::get(
+        "https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+    )?.text()?;
+
+    let catalog: Catalog = serde_json::from_str(&data)?;
+    println!("Total models: {}", catalog.models.len());
+
+    // 查找推理模型
+    let reasoning: Vec<_> = catalog.models.iter()
+        .filter(|m| m.tool_call)
+        .collect();
+
+    println!("Tool-calling models: {}", reasoning.len());
+    Ok(())
+}
+```
+
+## Shell / jq
+
+```bash
+# 下载数据
+curl -sLO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# 统计模型总数
+jq '.models | length' models.json
+
+# 查找所有 OpenAI 模型
+jq '.models[] | select(.provider == "openai") | .name' models.json
+
+# 查找最便宜的工具调用模型
+jq '[.models[] | select(.tool_call == true and .pricing.input != null)] | sort_by(.pricing.input) | .[:5] | .[] | {name, provider, input: .pricing.input}' models.json
+
+# 查找免费模型
+jq '[.models[] | select(.pricing.unit == "free")] | length' models.json
+
+# 列出所有提供商
+jq '.providers | keys' models.json
+```
+
+## Excel / Google Sheets
+
+1. 下载 CSV：`https://github.com/i-need-token/ai-models/releases/latest/download/models.csv`
+2. 在 Excel 中打开或导入 Google Sheets
+3. 使用筛选器按提供商、能力或价格范围查找模型
+
+## 常见查询
+
+### 查找最适合编程的模型
+
+```typescript
+import catalog from "ai-models";
+
+const codingModels = catalog.models.filter(
+  (m) =>
+    m.tool_call &&
+    m.structured_output &&
+    m.limit?.context >= 128000 &&
+    m.pricing?.input &&
+    m.pricing.input <= 5,
+);
+
+// 按上下文窗口（降序）排序，然后按价格（升序）排序
+codingModels.sort((a, b) => {
+  const ctxDiff = (b.limit?.context ?? 0) - (a.limit?.context ?? 0);
+  if (ctxDiff !== 0) return ctxDiff;
+  return (a.pricing?.input ?? 0) - (b.pricing?.input ?? 0);
+});
+```
+
+### 比较同一模型系列在不同提供商的价格
+
+```typescript
+import catalog from "ai-models";
+
+// 按系列分组
+const families = new Map<string, Model[]>();
+for (const m of catalog.models) {
+  if (!m.family) continue;
+  const list = families.get(m.family) ?? [];
+  list.push(m);
+  families.set(m.family, list);
+}
+
+// 查找在多个提供商上可用的系列
+for (const [family, models] of families) {
+  const providers = new Set(models.map((m) => m.provider));
+  if (providers.size > 1) {
+    console.log(`\n${family}:`);
+    for (const m of models) {
+      console.log(`  ${m.provider}: $${m.pricing?.input}/1M in, $${m.pricing?.output}/1M out`);
+    }
+  }
+}
+```
+
+### 为你的应用构建模型选择器
+
+```typescript
+import catalog from "ai-models";
+import type { Model } from "ai-models";
+
+interface ModelRequirements {
+  toolCall?: boolean;
+  vision?: boolean;
+  reasoning?: boolean;
+  structuredOutput?: boolean;
+  minContext?: number;
+  maxInputPrice?: number;
+  maxOutputPrice?: number;
+  openWeights?: boolean;
+  provider?: string;
+}
+
+function findModels(req: ModelRequirements): Model[] {
+  return catalog.models.filter((m) => {
+    if (req.toolCall && !m.tool_call) return false;
+    if (req.vision && !m.modalities?.input?.includes("image")) return false;
+    if (req.reasoning && !m.reasoning) return false;
+    if (req.structuredOutput && !m.structured_output) return false;
+    if (req.minContext && (m.limit?.context ?? 0) < req.minContext) return false;
+    if (req.maxInputPrice && (m.pricing?.input ?? Infinity) > req.maxInputPrice) return false;
+    if (req.maxOutputPrice && (m.pricing?.output ?? Infinity) > req.maxOutputPrice) return false;
+    if (req.openWeights && !m.open_weights) return false;
+    if (req.provider && m.provider !== req.provider) return false;
+    return true;
+  });
+}
+
+// 示例：查找支持视觉和工具调用的便宜模型
+const results = findModels({
+  vision: true,
+  toolCall: true,
+  maxInputPrice: 1,
+  maxOutputPrice: 5,
+});
+```
+
+## 相关文档
+
+- [API 与编程访问](api.md) — npm、CDN、CSV、GitHub Action
+- [快速入门](quick-start.md) — 30 秒内找到适合的模型
+- [数据模式](data-schema.md) — 完整 YAML 模式参考
+- [常见问题](faq.md) — 常见问题
+- [术语表](glossary.md) — 关键术语和定义
diff --git a/docs/zh/code-models.md b/docs/zh/code-models.md
new file mode 100644
index 00000000..70c9b62c
--- /dev/null
+++ b/docs/zh/code-models.md
@@ -0,0 +1,61 @@
+[English](../code-models.md) | **中文**
+
+# 代码 AI 模型 — 189 个用于代码生成和理解的模型
+
+专为 **代码生成、代码审查、调试和软件工程** 任务优化的模型。所有数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) 一手 API。
+
+## 统计
+
+| Metric              | Count |
+| ------------------- | ----- |
+| Code-focused models | 0     |
+| Providers           | 0     |
+| With tool calling   | 0     |
+| With reasoning      | 0     |
+| With vision         | 0     |
+| Free                | 0     |
+| Open weights        | 0     |
+
+## 最便宜的代码模型（直连提供商）
+
+| Model | Provider | Context | Input $/1M | Output $/1M | Reasoning |
+| ----- | -------- | ------- | ---------- | ----------- | --------- |
+
+## 带推理的代码模型（适合复杂任务）
+
+| Model | Provider | Context | Input $/1M | Output $/1M | Tool Call |
+| ----- | -------- | ------- | ---------- | ----------- | --------- |
+
+## 免费代码模型
+
+| Model | Provider | Context | Reasoning | Tool Call |
+| ----- | -------- | ------- | --------- | --------- |
+
+## 最大上下文代码模型
+
+| Model | Provider | Context | Input $/1M | Output $/1M |
+| ----- | -------- | ------- | ---------- | ----------- |
+
+## 选择代码模型
+
+| Use Case     | Recommended                | Why                   |
+| ------------ | -------------------------- | --------------------- |
+| Autocomplete | Qwen2.5-Coder, DeepSeek V3 | Fast, cheap           |
+| Code review  | Claude Sonnet 4, GPT-4.1   | Reasoning + tool call |
+| Bug fixing   | DeepSeek R1, Claude Opus 4 | Deep reasoning        |
+| Refactoring  | Gemini 2.5 Pro             | Large context         |
+| Code agents  | Claude Sonnet 4, GPT-4.1   | Tool call + reasoning |
+| Self-hosted  | Qwen2.5-Coder, Llama 4     | Open weights          |
+
+## 相关文档
+
+- [Reasoning Models](reasoning-models.md) — 1,306 models with chain-of-thought
+- [Tool Calling Models](tool-calling.md) — 2,350 models with function calling
+- [Agentic Models](agentic-models.md) — 1,080 models for AI agents
+- [OpenAI Alternatives](openai-alternatives.md) — GPT-4 alternatives
+- [Free AI Models](free-models.md) — 81 models at zero cost
+- [Open-Weight Models](open-weights.md) — 527 models with open weights
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/context-windows.md b/docs/zh/context-windows.md
new file mode 100644
index 00000000..7b0877a2
--- /dev/null
+++ b/docs/zh/context-windows.md
@@ -0,0 +1,77 @@
+[English](../context-windows.md) | **中文**
+
+# 上下文窗口对比
+
+哪些模型拥有最大的上下文窗口？本页按上下文窗口大小和定价列出模型。
+
+> 完整列表请下载 [models.json](https://github.com/i-need-token/ai-models/releases/latest) 或浏览 `providers/`。
+
+## 上下文窗口分布
+
+| 层级             | 模型数 | 描述                             |
+| ---------------- | -----: | -------------------------------- |
+| 1M+ tokens       |    391 | 可处理整本书、整个代码库或长对话 |
+| 256K–1M tokens   |    459 | 大型文档、多轮对话               |
+| 128K–256K tokens |  1,310 | 标准长上下文，大多数现代模型     |
+| 32K–128K tokens  |    194 | 中等长度文档                     |
+| 8K–32K tokens    |     97 | 短文档、单轮查询                 |
+| <8K tokens       |     19 | 旧模型，极短输入                 |
+
+## 最大上下文窗口（1M+ tokens）
+
+| 模型                          | 提供商     | 上下文 | 输入 $/1M | 输出 $/1M | 工具调用 | 推理 |
+| ----------------------------- | ---------- | ------ | --------: | --------: | -------- | ---- |
+| Llama 4 Scout                 | Meta       | 10M    |         — |         — | ✅       | ❌   |
+| Llama 4 Scout                 | OpenRouter | 10M    |     $0.08 |     $0.30 | ✅       | ❌   |
+| Gemini 3 Pro Preview          | Google     | 2M     |     $2.00 |    $12.00 | ✅       | ❌   |
+| Gemini 3.1 Flash Lite Preview | Google     | 2M     |     $0.25 |     $1.50 | ✅       | ❌   |
+| Gemini 3.1 Pro Preview        | Google     | 2M     |     $2.00 |    $12.00 | ✅       | ❌   |
+| Grok 4 Fast Reasoning         | xAI        | 2M     |     $0.20 |     $0.50 | ✅       | ✅   |
+| GPT-4.1                       | OpenAI     | ~1M    |     $2.00 |     $8.00 | ✅       | ❌   |
+| Gemini 2.5 Pro                | Google     | 1M     |     $1.25 |    $10.00 | ✅       | ✅   |
+| Gemini 2.5 Flash              | Google     | 1M     |     $0.15 |     $0.60 | ✅       | ✅   |
+| Llama 4 Maverick              | Meta       | 1M     |         — |         — | ✅       | ❌   |
+| Qwen3-235B-A22B               | 阿里云     | 128K\* |     ¥1.00 |     ¥4.00 | ✅       | ✅   |
+| DeepSeek-V3                   | DeepSeek   | 128K   |     $0.27 |     $1.10 | ✅       | ❌   |
+
+\*注：部分模型在不同平台上的上下文限制不同。请查看特定提供商的 YAML 文件获取准确值。
+
+## 各上下文层级的最佳性价比
+
+### 1M+ tokens（最便宜）
+
+| 模型             | 提供商      |        输入 $/1M | 输出 $/1M |
+| ---------------- | ----------- | ---------------: | --------: |
+| Llama 4 Scout    | OpenRouter  |            $0.08 |     $0.30 |
+| Gemini 2.5 Flash | Google      |            $0.15 |     $0.60 |
+| Llama 4 Scout    | Together AI |            $0.15 |     $0.60 |
+| Llama 4 Scout    | Meta        | 免费（开源权重） |         — |
+
+### 128K–256K tokens（最便宜）
+
+| 模型          | 提供商    | 输入 $/1M | 输出 $/1M |
+| ------------- | --------- | --------: | --------: |
+| DeepSeek-V3   | DeepSeek  |     $0.27 |     $1.10 |
+| Qwen3-30B-A3B | 阿里云    |     ¥0.10 |     ¥0.30 |
+| Phi-4         | Microsoft |     $0.10 |     $0.40 |
+| Gemma 3 27B   | Google    |     $0.20 |     $0.80 |
+
+## 要点总结
+
+- **Llama 4 Scout** 拥有最大的上下文窗口，达 **10M tokens** — 是其他模型的 10 倍
+- **1M+ 上下文**现已在 6+ 个提供商中可用，包括免费开源权重模型
+- **128K 上下文**是最常见的层级（1,310 个模型）— 足以满足大多数用例
+- **成本随上下文增长**：1M+ 上下文模型的每 token 成本是 128K 模型的 2–10 倍
+- **缓存读取定价**可显著降低重复查询的成本（最高 90% 折扣）
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 大上下文模型推荐
+- [定价对比](pricing-comparison.md) — 各提供商定价并排对比
+- [免费 AI 模型](free-models.md) — 81 个免费模型按上下文窗口分类
+- [视觉模型](vision-models.md) — 1,487 个视觉模型含上下文信息
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/data-acquisition.md b/docs/zh/data-acquisition.md
index 83578930..936a65f3 100644
--- a/docs/zh/data-acquisition.md
+++ b/docs/zh/data-acquisition.md
@@ -256,3 +256,15 @@ parseModality | toLowerCase | toUpperCase | trim | removeCommas | identity
 2. 直接更新 YAML 文件
 3. 将 `last_updated` 设为当前日期
 4. 用 `npm run validate` 验证
+
+## 相关文档
+
+- [数据模式](data-schema.md) — 完整 YAML 模式参考
+- [设计原则](lessons-learned.md) — 经验教训
+- [提供商概览](providers.md) — 95 个提供商
+- [常见问题](faq.md) — 常见问题
+- [贡献指南](https://github.com/i-need-token/ai-models/blob/main/CONTRIBUTING.md) — 如何贡献
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/data-schema.md b/docs/zh/data-schema.md
new file mode 100644
index 00000000..ded0ab32
--- /dev/null
+++ b/docs/zh/data-schema.md
@@ -0,0 +1,221 @@
+[English](../data-schema.md) | **中文**
+
+# 数据 Schema 参考
+
+本目录使用的 YAML 数据 Schema 完整参考。所有模型数据文件遵循 [`types/`](../../types/) 中的 TypeScript 类型定义，并在运行时由 [`types/schemas.ts`](../../types/schemas.ts) 中的 Zod schema 校验。
+
+## 模型 Schema
+
+每个模型是 `providers/<provider>/models/<model-id>.yaml` 下的单个 YAML 文件。
+
+### 必填字段
+
+| 字段           | 类型    | 描述                                     | 示例                                       |
+| -------------- | ------- | ---------------------------------------- | ------------------------------------------ |
+| `id`           | string  | 稳定的模型 ID（无日期后缀）              | `gpt-4o`, `claude-sonnet-4-5`              |
+| `name`         | string  | 显示名称                                 | `GPT-4o`, `Claude Sonnet 4.5`              |
+| `family`       | string  | 模型家族（广泛谱系）                     | `gpt-4o`, `claude-sonnet`                  |
+| `pricing`      | Pricing | 模型定价（见下文）                       | —                                          |
+| `modalities`   | object  | 输入/输出模态                            | `{ input: [text, image], output: [text] }` |
+| `last_updated` | string  | 最后数据更新日期 (YYYY-MM-DD 或 YYYY-MM) | `2024-08-06`                               |
+
+### 可选字段
+
+| 字段                | 类型    | 默认值  | 描述                     | 示例                                 |
+| ------------------- | ------- | ------- | ------------------------ | ------------------------------------ |
+| `reasoning`         | boolean | `false` | 支持推理/思考模式        | `true`                               |
+| `temperature`       | boolean | `true`  | 支持 temperature 参数    | `false`                              |
+| `tool_call`         | boolean | `false` | 支持工具/函数调用        | `true`                               |
+| `attachment`        | boolean | `false` | 支持文件附件             | `true`                               |
+| `structured_output` | boolean | `false` | 支持结构化/JSON 输出     | `true`                               |
+| `open_weights`      | boolean | `false` | 开源权重模型             | `true`                               |
+| `deprecated`        | boolean | `false` | 已弃用但仍可访问         | `true`                               |
+| `limit`             | object  | —       | Token 限制               | `{ context: 128000, output: 16384 }` |
+| `limit.context`     | number  | —       | 上下文窗口大小（tokens） | `128000`                             |
+| `limit.output`      | number  | —       | 最大输出 tokens          | `16384`                              |
+| `knowledge`         | string  | —       | 训练数据截止日期         | `2023-10`                            |
+| `release_date`      | string  | —       | 模型发布日期             | `2024-05-13`                         |
+| `snapshots`         | array   | —       | 带日期的模型版本         | 见下文                               |
+
+### 模态类型
+
+| 模态    | 描述           |
+| ------- | -------------- |
+| `text`  | 文本输入或输出 |
+| `image` | 图像输入或输出 |
+| `video` | 视频输入       |
+| `audio` | 音频输入或输出 |
+| `pdf`   | PDF 文档输入   |
+
+## 定价 Schema
+
+定价是四种类型的联合体。每个模型只使用一种。
+
+### TokenPricing（最常见）
+
+按百万 token 计费。货币默认 USD，单位默认 `per_mtok`。
+
+```yaml
+pricing:
+  currency: USD # 可选，默认 USD
+  unit: per_mtok # 可选，默认 per_mtok
+  input: 2.5 # $/百万 输入 token
+  output: 10 # $/百万 输出 token
+  cache_write: 1.25 # 可选，$/百万 缓存写入
+  cache_read: 0.625 # 可选，$/百万 缓存读取
+```
+
+**进阶：按上下文长度分层定价**
+
+```yaml
+pricing:
+  input:
+    - up_to: 128000 # ≤ 128K 上下文
+      price: 2.5
+    - price: 5.0 # > 128K 上下文（无 up_to = 最终层级）
+  output: 10
+```
+
+**进阶：按模态定价**
+
+```yaml
+pricing:
+  input:
+    text: 1.25
+    image: 2.5
+    audio: 5.0
+  output:
+    text: 5.0
+    audio: 10.0
+```
+
+### VideoPricing
+
+按秒计费，可选按分辨率分层。
+
+```yaml
+pricing:
+  currency: USD
+  unit: per_second
+  price: 0.03 # 固定每秒价格
+```
+
+```yaml
+pricing:
+  unit: per_second
+  price: # 按分辨率定价
+    720p: 0.02
+    1080p: 0.03
+    4k: 0.05
+```
+
+### UnitPricing
+
+按图像或按请求计费。
+
+```yaml
+pricing:
+  unit: per_image
+  price: 0.04
+```
+
+```yaml
+pricing:
+  unit: per_request
+  price: 0.005
+```
+
+### FreePricing
+
+免费。
+
+```yaml
+pricing:
+  unit: free
+```
+
+## 快照 Schema
+
+快照代表模型的带日期版本。它们继承父级的所有字段，只覆盖不同的部分。
+
+```yaml
+id: gpt-4o
+name: GPT-4o
+# ... 父级字段 ...
+snapshots:
+  - id: gpt-4o-2024-08-06 # 最新的在前
+    last_updated: "2024-08-06"
+  - id: gpt-4o-2024-05-13
+    deprecated: true # 此快照已弃用
+    last_updated: "2024-05-13"
+```
+
+快照可以覆盖父级的任何可选字段：
+
+```yaml
+snapshots:
+  - id: gemini-2.0-flash-exp
+    limit:
+      context: 1048576 # 不同的上下文窗口
+      output: 8192
+    pricing:
+      unit: free # 实验版 = 免费
+```
+
+## 提供商 Schema
+
+每个提供商在 `providers/<id>/provider.yaml` 有一个 `provider.yaml` 文件。
+
+| 字段             | 类型   | 必填 | 描述                      | 示例                               |
+| ---------------- | ------ | ---- | ------------------------- | ---------------------------------- |
+| `id`             | string | ✅   | 提供商 ID（与目录名匹配） | `openai`                           |
+| `name`           | string | ✅   | 显示名称                  | `OpenAI`                           |
+| `url`            | string | ✅   | 官方网站 URL              | `https://openai.com`               |
+| `api_docs`       | string | ❌   | API 文档 URL              | `https://platform.openai.com/docs` |
+| `apis`           | object | ✅   | 按格式分类的 API 端点     | 见下文                             |
+| `apis.openai`    | string | ❌   | OpenAI 兼容 API 端点      | `https://api.openai.com/v1`        |
+| `apis.anthropic` | string | ❌   | Anthropic API 端点        | —                                  |
+| `apis.google`    | string | ❌   | Google AI API 端点        | —                                  |
+| `currency`       | string | ❌   | 默认货币 (USD/CNY/EUR)    | `USD`                              |
+
+### API 格式
+
+| 格式        | 描述                               | 使用者            |
+| ----------- | ---------------------------------- | ----------------- |
+| `openai`    | OpenAI 兼容的 Chat Completions API | 大多数提供商      |
+| `anthropic` | Anthropic Messages API             | Anthropic         |
+| `google`    | Google Generative AI API           | Google, Vertex AI |
+
+## 货币参考
+
+| 货币   | 代码  | 使用者                                    |
+| ------ | ----- | ----------------------------------------- |
+| 美元   | `USD` | 大多数提供商（默认）                      |
+| 人民币 | `CNY` | 阿里云、302.AI、AIHubMix、PPIO 等         |
+| 欧元   | `EUR` | Berget、CloudFerro、OVHcloud、Scaleway 等 |
+
+## 校验
+
+所有 YAML 文件在运行时由 Zod schema 校验：
+
+```bash
+# 校验所有模型数据
+npx tsx scripts/validate.ts
+
+# 校验特定提供商
+npx tsx scripts/validate.ts openai
+```
+
+校验使用 [`types/schemas.ts`](../../types/schemas.ts) 中的 `ModelSchema`，与 TypeScript 类型完全对应。任何不符合 schema 的 YAML 文件将产生校验错误，包含具体的字段路径和问题。
+
+## 相关文档
+
+- [数据获取](data-acquisition.md) — 如何获取和更新数据
+- [API 与编程访问](api.md) — npm、CDN、CSV 访问
+- [代码示例](code-examples.md) — 实用代码示例
+- [设计原则](lessons-learned.md) — 经验教训
+- [常见问题](faq.md) — 常见问题
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/embedding-models.md b/docs/zh/embedding-models.md
new file mode 100644
index 00000000..6fbf69c3
--- /dev/null
+++ b/docs/zh/embedding-models.md
@@ -0,0 +1,71 @@
+# 嵌入模型
+
+[English](../embedding-models.md)
+
+生成**向量嵌入**的 AI 模型 — 文本、图像和其他数据的数值表示。语义搜索、RAG（检索增强生成）、聚类和相似度任务的基础。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么嵌入模型很重要
+
+嵌入模型是许多 AI 系统的基础：
+
+- **语义搜索** — 按含义而非关键词查找相关文档
+- **RAG** — 为 LLM 检索上下文以生成有依据的答案
+- **聚类** — 将相似项目分组
+- **相似度** — 查找重复项、推荐和相关内容
+- **分类** — 通过嵌入进行零样本和少样本分类
+
+## 统计
+
+| 指标             | 数量 |
+| ---------------- | ---- |
+| 嵌入模型         | 5    |
+| 提供商           | 3    |
+| 免费嵌入模型     | 0    |
+| 开源权重嵌入模型 | 1    |
+
+## 提供商
+
+`openai`、`tencent`、`upstage`
+
+## 免费嵌入模型
+
+免费嵌入模型 — 零成本语义搜索和 RAG。
+
+| 模型 | 提供商 | 上下文 | 输入 $/M |
+| ---- | ------ | ------ | -------- |
+
+## 最便宜嵌入模型
+
+生产环境嵌入的最佳性价比模型。
+
+| 模型                    | 提供商  | 上下文 | 输入 $/M |
+| ----------------------- | ------- | ------ | -------- | --- |
+| text-embedding-3-small  | openai  | 8K     | $0.02    |     |
+| solar-embedding-1-large | upstage | 0      | $0.1     | 🔓  |
+| text-embedding-ada-002  | openai  | 8K     | $0.1     |     |
+| text-embedding-3-large  | openai  | 8K     | $0.13    |     |
+| hunyuan-embedding       | tencent | 0      | $0.7     |     |
+
+## 大上下文嵌入模型
+
+上下文窗口最大的嵌入模型 — 适用于嵌入长文档。
+
+| 模型                   | 提供商 | 上下文 | 输入 $/M |
+| ---------------------- | ------ | ------ | -------- | --- |
+| text-embedding-ada-002 | openai | 8K     | $0.1     |     |
+| text-embedding-3-small | openai | 8K     | $0.02    |     |
+| text-embedding-3-large | openai | 8K     | $0.13    |     |
+
+## 相关文档
+
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [开源权重](open-weights.md) — 527 个开源权重模型
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [API 参考](api.md) — 编程访问
+- [快速入门](quick-start.md) — 5 分钟上手
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/faq.md b/docs/zh/faq.md
new file mode 100644
index 00000000..34a39187
--- /dev/null
+++ b/docs/zh/faq.md
@@ -0,0 +1,114 @@
+# 常见问题
+
+[English](../faq.md)
+
+## 通用
+
+### 什么是 AI Models Catalog？
+
+AI Models Catalog 是一个结构化的 YAML 目录，收录了 95+ 个 AI 提供商的模型元数据。包括定价、上下文窗口、模态、能力等信息——所有数据均来自一手 API 和官方文档。
+
+### 与其他模型目录有何不同？
+
+- **仅使用一手数据** — 所有数据直接来自提供商 API 和官方文档，而非第三方聚合器
+- **结构化 YAML** — 机器可读，支持 TypeScript 类型和 Zod 校验
+- **全面的元数据** — 定价、上下文窗口、模态、能力、快照
+- **编程访问** — npm 包、CDN、GitHub Action、CSV 导出
+- **开源** — 社区驱动，自动化抓取
+
+### 数据多久更新一次？
+
+数据通过自动化 CI 工作流每周同步。提供商 API 在周一定时抓取，npm 包在新版本发布时自动发布。
+
+## 访问与使用
+
+### 如何获取数据？
+
+有多种方式：
+
+| 方式                                                                                  | 适用场景                   |
+| ------------------------------------------------------------------------------------- | -------------------------- |
+| `npm install ai-models`                                                               | TypeScript/JavaScript 项目 |
+| `curl https://github.com/i-need-token/ai-models/releases/latest/download/models.json` | 任何语言的快速访问         |
+| GitHub Action                                                                         | CI/CD 流水线               |
+| CSV 下载                                                                              | Excel、数据分析            |
+| Hugging Face 数据集                                                                   | ML 工作流                  |
+
+详见[快速入门](quick-start.md)。
+
+### 数据免费使用吗？
+
+是的！目录数据采用 MIT 许可证发布，可在商业和非商业项目中无限制使用。
+
+### 定价数据准确吗？
+
+定价数据直接来自每个提供商的官方 API 和文档。但提供商可能在不通知的情况下更改定价。在做出关键定价决策时，请务必对照提供商自己的网站进行核实。
+
+## 技术
+
+### 为什么用 YAML 而不是 JSON？
+
+YAML 支持注释，更适合手动编辑，并允许模型文件内的快照继承。数据会编译为 JSON 以供编程使用。
+
+### 什么是快照继承？
+
+在单个模型文件内，快照从父模型继承字段，只覆盖不同的部分。这使模型文件保持 DRY，无需跨模型继承。
+
+### 如何校验 YAML 文件？
+
+```bash
+# 使用内置校验器
+npx tsx scripts/validate.ts
+
+# 使用 JSON Schema
+npx ajv validate -s schema.json -d providers/openai/models/gpt-4o.yaml
+```
+
+### 可以在 CI/CD 流水线中使用吗？
+
+可以！使用可复用的 GitHub Action：
+
+```yaml
+- uses: i-need-token/ai-models@v1
+  with:
+    format: json
+    filter: "[?tool_call && open_weights]"
+```
+
+详见 [API 文档](api.md#github-action)。
+
+## 贡献
+
+### 如何添加新的提供商？
+
+参见[贡献指南](https://github.com/i-need-token/ai-models/blob/main/CONTRIBUTING.md)的分步说明。简要步骤：
+
+1. 创建 `providers/<id>/provider.yaml`
+2. 创建 `providers/<id>/scrape.ts`，包含 `scrape()` 函数
+3. 运行 `npx tsx scripts/validate.ts` 校验
+
+### 如何报告数据错误？
+
+提交[数据更新 issue](https://github.com/i-need-token/ai-models/issues/new?template=data_update.md)，注明提供商名称、模型 ID 和需要更正的内容。
+
+### 不写代码也能贡献吗？
+
+当然可以！你可以：
+
+- ⭐ 给仓库加星，帮助更多人发现
+- 📢 分享给你的网络
+- 🐛 报告数据问题或 bug
+- 📖 改进文档
+- 🏷️ 建议添加新的提供商
+
+---
+
+更多问题？[提交 issue](https://github.com/i-need-token/ai-models/issues/new) 或发起[讨论](https://github.com/i-need-token/ai-models/discussions)。
+
+## 相关文档
+
+- [快速入门](quick-start.md) — 30 秒内找到适合的模型
+- [API 与编程访问](api.md) — npm、CDN、CSV 访问
+- [术语表](glossary.md) — 关键术语和定义
+- [数据模式](data-schema.md) — 完整 YAML 模式
+- [模型选择指南](model-selection.md) — 决策框架
diff --git a/docs/zh/free-models.md b/docs/zh/free-models.md
new file mode 100644
index 00000000..c85e0fc4
--- /dev/null
+++ b/docs/zh/free-models.md
@@ -0,0 +1,124 @@
+[English](../free-models.md) | **中文**
+
+# 免费 AI 模型
+
+本目录中有 81 个模型可免费使用。本页按能力分类列出，帮助你找到适合项目的免费模型。
+
+> 所有数据来自一手 API 和文档。免费层可能有速率限制 — 请查看提供商网站了解详情。
+
+## 快速统计
+
+| 能力                 | 免费模型数 |
+| -------------------- | ---------: |
+| 总免费模型           |         81 |
+| 支持工具调用         |         45 |
+| 支持推理             |         11 |
+| 支持视觉（图像输入） |         17 |
+
+## 支持工具调用的免费模型
+
+这些模型支持函数/工具调用且零成本 — 适合构建 AI 代理和自动化：
+
+| 模型                           | 提供商 | 上下文 | 视觉 |
+| ------------------------------ | ------ | ------ | ---- |
+| gemini-2.0-flash               | Google | 1M     | ✅   |
+| gemini-2.5-flash-preview-05-20 | Google | 1M     | ✅   |
+| gemma-3-27b-it                 | Chutes | 128K   | ✅   |
+| qwen3-235b-a22b                | Chutes | 128K   | ✅   |
+| qwen3-30b-a3b                  | Chutes | 128K   | ✅   |
+| qwen3-4b                       | Chutes | 128K   | ✅   |
+| deepseek-r1                    | Chutes | 128K   | ❌   |
+| deepseek-v3-0324               | Chutes | 128K   | ❌   |
+| llama-4-maverick               | Chutes | 1M     | ✅   |
+| llama-4-scout                  | Chutes | 10M    | ✅   |
+| llama-3.3-70b-instruct         | Chutes | 128K   | ❌   |
+| qwen2.5-72b-instruct           | Chutes | 128K   | ❌   |
+| mistral-small-3.1-24b-instruct | Chutes | 128K   | ✅   |
+| phi-4                          | Chutes | 16K    | ❌   |
+| command-r                      | Chutes | 128K   | ❌   |
+
+## 支持推理的免费模型
+
+这些模型支持链式思维推理且零成本：
+
+| 模型                           | 提供商 | 上下文 |
+| ------------------------------ | ------ | ------ |
+| gemini-2.5-flash-preview-05-20 | Google | 1M     |
+| deepseek-r1                    | Chutes | 128K   |
+| deepseek-r1-0528               | Chutes | 128K   |
+| qwen3-235b-a22b                | Chutes | 128K   |
+| qwen3-30b-a3b                  | Chutes | 128K   |
+| qwen3-4b                       | Chutes | 128K   |
+| gemma-3-27b-it                 | Chutes | 128K   |
+| phi-4-reasoning                | Chutes | 32K    |
+
+## 支持视觉的免费模型
+
+这些模型接受图像输入且零成本：
+
+| 模型                           | 提供商 | 上下文 |
+| ------------------------------ | ------ | ------ |
+| gemini-2.0-flash               | Google | 1M     |
+| gemini-2.5-flash-preview-05-20 | Google | 1M     |
+| gemma-3-27b-it                 | Chutes | 128K   |
+| qwen3-235b-a22b                | Chutes | 128K   |
+| llama-4-maverick               | Chutes | 1M     |
+| llama-4-scout                  | Chutes | 10M    |
+| mistral-small-3.1-24b-instruct | Chutes | 128K   |
+
+## 按提供商分类
+
+### Google（通过 AI Studio）
+
+Google 通过 AI Studio 提供免费 Gemini 模型访问（有速率限制）：
+
+- gemini-2.0-flash — 1M 上下文，工具调用，视觉，推理
+- gemini-2.5-flash-preview-05-20 — 1M 上下文，工具调用，视觉，推理
+
+### Chutes
+
+Chutes 提供免费社区托管推理，支持开源权重模型：
+
+- 70+ 个免费模型，包括 Llama 4、Qwen3、DeepSeek-R1、Gemma 3、Mistral、Phi-4
+- 最大免费模型：Llama 4 Scout（10M 上下文）
+- 最佳免费推理：DeepSeek-R1、Qwen3-235B-A22B
+
+### Cloudflare Workers AI
+
+Cloudflare 提供免费边缘推理：
+
+- 各种小型和中型模型（有速率限制）
+- 边缘部署，低延迟
+
+### Cerebras
+
+Cerebras 为部分模型提供免费层：
+
+- 使用 CS-3 晶圆级引擎的快速推理
+
+### Groq
+
+Groq 为部分模型提供免费层：
+
+- 使用 LPU 加速的超快推理
+
+## 要点总结
+
+- **Google AI Studio** 提供整体最佳的免费模型 — 1M 上下文、工具调用、视觉和推理
+- **Chutes** 拥有最多的免费模型选择 — 70+ 个，包括所有主要开源权重模型
+- **Llama 4 Scout** 在 Chutes 上提供最大的免费上下文窗口（10M tokens）
+- 免费层通常有速率限制（每分钟请求数）— 请查看提供商文档了解具体限制
+- 生产环境建议升级到付费层以获得可靠性和更高的速率限制
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [开源权重模型](open-weights.md) — 527 个可自行运行的模型
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+- [工具调用模型](tool-calling.md) — 2,350 个支持工具调用的模型
+- [推理模型](reasoning-models.md) — 1,306 个支持推理的模型
+- [OpenAI 替代方案](openai-alternatives.md) — 免费 GPT-4 替代
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/glossary.md b/docs/zh/glossary.md
new file mode 100644
index 00000000..c040f22d
--- /dev/null
+++ b/docs/zh/glossary.md
@@ -0,0 +1,79 @@
+# 术语表
+
+[English](../glossary.md)
+
+AI Models Catalog 中使用的术语快速参考。
+
+## 模型属性
+
+| 术语                     | 定义                                                                                                |
+| ------------------------ | --------------------------------------------------------------------------------------------------- |
+| **模型 ID**              | 模型的稳定唯一标识符（如 `gpt-4.1`、`claude-sonnet-4`）。无日期后缀，无别名。                       |
+| **系列（Family）**       | 共享相同架构或品牌的相关模型组（如 `gpt-4.1` 系列包括 `gpt-4.1`、`gpt-4.1-mini`、`gpt-4.1-nano`）。 |
+| **快照（Snapshot）**     | 模型的日期版本，嵌套在父模型文件中。继承所有父字段，只覆盖不同的部分。                              |
+| **已弃用（Deprecated）** | 提供商 API 中仍列出但不推荐用于新项目的模型。标记为 `deprecated: true`。                            |
+| **已退役（Retired）**    | 完全从提供商 API 中移除的模型。不在目录中收录。                                                     |
+
+## 能力
+
+| 术语                                | 定义                                                                                               |
+| ----------------------------------- | -------------------------------------------------------------------------------------------------- |
+| **工具调用（Tool calling）**        | 模型在生成过程中可以调用外部工具/函数（如网页搜索、计算器、API 调用）。也称"函数调用"。            |
+| **结构化输出（Structured output）** | 模型可以按指定格式（通常为 JSON）生成响应，符合提供的 schema。也称"JSON 模式"。                    |
+| **推理（Reasoning）**               | 模型使用链式思维或扩展思考逐步解决复杂问题，然后生成最终答案。                                     |
+| **开源权重（Open weights）**        | 模型权重公开可用，允许在自己的基础设施上运行。并非所有开源权重模型都是真正的"开源"——请检查许可证。 |
+
+## 模态
+
+| 术语                 | 定义                                                               |
+| -------------------- | ------------------------------------------------------------------ |
+| **文本输入**         | 模型接受文本提示作为输入。                                         |
+| **文本输出**         | 模型生成文本作为输出。                                             |
+| **图像输入（视觉）** | 模型可以将图像作为输入的一部分进行处理。也称"视觉"或"多模态输入"。 |
+| **图像输出**         | 模型可以生成图像（如 DALL·E、Imagen）。也称"图像生成"。            |
+| **音频输入**         | 模型可以将音频文件或语音作为输入进行处理。                         |
+| **音频输出**         | 模型可以生成音频或语音作为输出（如 TTS 模型）。                    |
+| **视频输入**         | 模型可以将视频文件作为输入进行处理。                               |
+| **视频输出**         | 模型可以生成视频作为输出。                                         |
+| **嵌入输出**         | 模型生成向量嵌入而非文本，用于相似性搜索和检索。                   |
+
+## 定价
+
+| 术语             | 定义                                                            |
+| ---------------- | --------------------------------------------------------------- |
+| **输入价格**     | 每百万输入 token 的成本，以 USD 计（部分提供商以 CNY/EUR 计）。 |
+| **输出价格**     | 每百万输出 token 的成本，以 USD 计（部分提供商以 CNY/EUR 计）。 |
+| **缓存读取价格** | 从先前缓存的提示读取的折扣价格。通常比常规输入便宜 50-90%。     |
+| **缓存写入价格** | 将提示写入提供商缓存的价格。部分提供商单独收取此费用。          |
+| **免费**         | 模型的输入和输出 token 成本为零。可能有速率限制。               |
+| **Token**        | 文本处理的单位。在英语中约等于 4 个字符或 0.75 个词。           |
+
+## 上下文与限制
+
+| 术语           | 定义                                                                               |
+| -------------- | ---------------------------------------------------------------------------------- |
+| **上下文窗口** | 模型在单个请求中可处理的最大 token 数（部分提供商为输入+输出合计，部分仅输入）。   |
+| **输出限制**   | 模型在单个响应中可生成的最大 token 数。                                            |
+| **速率限制**   | 提供商设置的每分钟/小时最大请求数或 token 数。不在目录中收录（请查看提供商文档）。 |
+
+## 数据与架构
+
+| 术语            | 定义                                                                                    |
+| --------------- | --------------------------------------------------------------------------------------- |
+| **YAML**        | 所有模型数据的源格式。人类可读，支持注释，允许快照继承。                                |
+| **快照继承**    | 在模型文件内，快照继承父模型的所有字段，只覆盖不同的部分。无跨模型继承。                |
+| **一手数据**    | 直接来自提供商自身 API 或官方文档的数据，而非第三方聚合器。                             |
+| **Zod schema**  | 运行时校验 schema，确保所有 YAML 模型文件符合预期结构。                                 |
+| **models.json** | 从 YAML 源文件编译的 JSON 输出，包含所有模型。可通过 npm、CDN 和 GitHub Releases 获取。 |
+
+---
+
+详见[数据 Schema 参考](data-schema.md)获取完整的 YAML 字段规范。
+
+## 相关文档
+
+- [常见问题](faq.md) — 常见问题
+- [数据模式](data-schema.md) — 完整 YAML 模式参考
+- [快速入门](quick-start.md) — 30 秒内找到适合的模型
+- [模型对比](model-comparison.md) — 模型对比
+- [模态矩阵](modality-matrix.md) — 所有模态一览
diff --git a/docs/zh/image-generation.md b/docs/zh/image-generation.md
new file mode 100644
index 00000000..23d9374d
--- /dev/null
+++ b/docs/zh/image-generation.md
@@ -0,0 +1,70 @@
+[English](../image-generation.md) | **中文**
+
+# AI 图像生成模型
+
+本目录中有 28 个模型可以生成图像（图像输出模态）。本页涵盖文本生成图像、图像编辑和多模态生成模型。
+
+> 所有数据来自一手 API 和文档。"图像输出"表示模型在回复中生成图像。
+
+## 快速统计
+
+| 能力           | 图像生成模型数 |
+| -------------- | -------------: |
+| 总图像生成模型 |             28 |
+| 唯一模型 ID    |             19 |
+| 支持推理       |              5 |
+| 支持工具调用   |              1 |
+| 免费使用       |              9 |
+
+## 所有图像生成模型
+
+| 模型                           | 输入                      | 输出 $/1M | 上下文 | 推理 | 免费 |
+| ------------------------------ | ------------------------- | --------: | ------ | ---- | ---- |
+| DALL·E 3                       | text                      |         — | —      | ❌   | ✅   |
+| Imagen 4.0 Fast                | text, image               |         — | —      | ❌   | ✅   |
+| Imagen 4.0                     | text, image               |         — | —      | ❌   | ✅   |
+| Image 01                       | text, image               |         — | —      | ❌   | ✅   |
+| Image 01 Live                  | text, image               |         — | —      | ❌   | ✅   |
+| Step 1X Edit                   | text, image               |         — | —      | ❌   | ✅   |
+| Step 1X Medium                 | text, image               |         — | —      | ❌   | ✅   |
+| Step 2X Large                  | text, image               |         — | —      | ❌   | ✅   |
+| Step Image Edit 2              | text, image               |         — | —      | ❌   | ✅   |
+| Gemini 2.5 Flash Image         | text, image               |    $0.039 | 33K    | ❌   | ❌   |
+| Gemini 3.1 Flash Image Preview | text, image               |     $1.50 | 66K    | ✅   | ❌   |
+| Gemini 3 Pro Image Preview     | text, image               |    $12.00 | 131K   | ✅   | ❌   |
+| GPT-5 Image Mini               | text, image, PDF          |     $2.00 | 400K   | ✅   | ❌   |
+| GPT-5 Image                    | text, image, PDF          |    $10.00 | 400K   | ✅   | ❌   |
+| GPT-5.4 Image 2                | text, image, PDF          |    $15.00 | 272K   | ✅   | ❌   |
+| Amazon Nova 2.0 Omni           | text, image, audio, video |     $1.30 | 64K    | ✅   | ❌   |
+
+## 最佳性价比图像生成
+
+| 用途                         | 最佳模型                            | 原因                             |
+| ---------------------------- | ----------------------------------- | -------------------------------- |
+| **免费文本生成图像**         | DALL·E 3, Imagen 4.0                | 零成本，高质量                   |
+| **免费图像编辑**             | Step 1X Edit, Step Image Edit 2     | 免费编辑现有图像                 |
+| **最便宜 API**               | Gemini 2.5 Flash Image              | $0.039/1M 输出 tokens            |
+| **最佳质量**                 | GPT-5.4 Image 2, Gemini 3 Pro Image | 最先进的生成能力                 |
+| **多模态（音频+视频+图像）** | Amazon Nova 2.0 Omni                | 唯一支持所有模态的模型           |
+| **大上下文**                 | GPT-5 Image Mini                    | 400K 上下文适合复杂提示          |
+| **推理 + 生成**              | GPT-5 Image Mini                    | $2.50/1M 输入，400K 上下文，推理 |
+
+## 要点总结
+
+- **9 个免费图像生成模型** — DALL·E 3、Imagen 4.0、Step 系列等
+- **Gemini 2.5 Flash Image** 是最便宜的 API 选项，仅 $0.039/1M 输出 tokens
+- **GPT-5 Image Mini** 提供推理 + 生成 + 大上下文的最佳组合
+- **Amazon Nova 2.0 Omni** 是唯一可以从音频和视频输入生成图像的模型
+- 大多数图像生成模型同时接受文本和图像输入（用于编辑/参考）
+
+## 相关文档
+
+- [视觉模型](vision-models.md) — 1,487 个视觉模型
+- [视频模型](video-models.md) — 167 个视频输入/输出模型
+- [模态矩阵](modality-matrix.md) — 所有模态一览
+- [模型选择指南](model-selection.md) — 决策框架
+- [免费 AI 模型](free-models.md) — 81 个免费模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/large-context-models.md b/docs/zh/large-context-models.md
new file mode 100644
index 00000000..5267e125
--- /dev/null
+++ b/docs/zh/large-context-models.md
@@ -0,0 +1,112 @@
+# 大上下文模型
+
+[English](../large-context-models.md)
+
+具有 **128K+ token 上下文窗口**的 AI 模型 — 在单个请求中处理整个代码库、长文档和多小时对话。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么大上下文很重要
+
+大上下文窗口解锁了小模型无法实现的能力：
+
+- **完整代码库分析** — 在一个提示中理解整个仓库
+- **文档处理** — 无需分块即可分析 100+ 页 PDF
+- **多轮对话** — 在长聊天会话中保持上下文
+- **数据分析** — 在单个请求中处理大型数据集
+- **法律/医疗审查** — 审查冗长的合同和医疗记录
+- **内容创作** — 在长篇写作中保持一致性
+
+## 统计
+
+| 指标                 | 数量 |
+| -------------------- | ---- |
+| 大上下文模型 (128K+) | 2195 |
+| 256K+ 上下文         | 861  |
+| 1M+ 上下文           | 397  |
+| 提供商               | 78   |
+| 免费大上下文模型     | 51   |
+| 带工具调用           | 1637 |
+
+## 提供商
+
+`302ai`、`ai21`、`aimlapi`、`aion`、`alibaba`、`amazon`、`amazon-bedrock`、`anthropic`、`arcee`、`auriko`、`baichuan`、`baidu`、`baseten`、`bytedance`、`cerebras`、`chutes`、`clarifai`、`cloudferro-sherlock`、`cloudflare`、`databricks`、`deepinfra`、`deepseek`、`digitalocean`、`dinference`、`evroc` 等 53 个
+
+## 最大上下文窗口
+
+可用上下文窗口最大的模型。
+
+| 模型                           | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| ------------------------------ | ---------- | ------ | -------- | -------- | -------- |
+| meta-llama--llama-4-scout      | openrouter | 10M    | $0.08    | $0.3     | 🔧 📋    |
+| meta-llama-4-scout             | meta       | 10M    | $0.17    | $0.66    | 🔧       |
+| gemini-1.5-pro                 | google     | 2M     | $1.25    | $5       | 🔧 📋    |
+| grok-code-fast-1               | jiekou     | 2M     | $0.19    | $0.475   | 🔧       |
+| gpt-4o                         | jiekou     | 2M     | $1.9     | $5.7     | 🔧       |
+| grok-4.20-0309-non-reasoning   | jiekou     | 2M     | $0.19    | $0.475   | 🔧       |
+| grok-4.20-0309-reasoning       | jiekou     | 2M     | $1.9     | $5.7     | 🔧       |
+| grok-4-1-fast-reasoning        | jiekou     | 2M     | $0.19    | $0.475   | 🔧       |
+| grok-4-fast-reasoning          | jiekou     | 2M     | $0.19    | $0.475   | 🔧       |
+| x-ai--grok-4-fast              | fastrouter | 2M     | $0.2     | $0.5     | 🔧       |
+| x-ai--grok-4.1-fast            | fastrouter | 2M     | $0.2     | $0.5     | 🔧       |
+| xai--grok-4-fast-reasoning     | aimlapi    | 2M     | $0.52    | $1.3     | 🔧       |
+| xai--grok-4-fast-non-reasoning | aimlapi    | 2M     | $0.52    | $1.3     | 🔧       |
+| grok-4-20-multi-agent          | venice     | 2M     | $1.42    | $2.83    | 🧠 📋    |
+| grok-4-20                      | venice     | 2M     | $1.42    | $2.83    | 🔧 🧠 📋 |
+
+## 最便宜的 1M+ 上下文模型
+
+1M+ token 上下文的最佳性价比模型 — 处理超长输入。
+
+| 模型                              | 提供商        | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| --------------------------------- | ------------- | ------ | -------- | -------- | -------- |
+| gemini-1.5-flash-8b               | deepinfra     | 1M     | $0.0375  | $0.15    |          |
+| gpt-5-nano                        | meganova      | 1M     | $0.04    | $0.32    | 🔧       |
+| qwen--qwen3.5-flash-02-23         | openrouter    | 1M     | $0.065   | $0.26    | 🔧 🧠 📋 |
+| google--gemini-2.0-flash-lite-001 | openrouter    | 1M     | $0.075   | $0.3     | 🔧 📋    |
+| google--gemini-2.0-flash-lite-001 | fastrouter    | 1M     | $0.075   | $0.3     | 🔧       |
+| gemini-1.5-flash                  | deepinfra     | 1M     | $0.075   | $0.3     |          |
+| gemini-2.0-flash-lite             | google        | 1M     | $0.075   | $0.3     | 🔧 📋    |
+| gemini-1.5-flash                  | google        | 1M     | $0.075   | $0.3     | 🔧 📋    |
+| gemini-1.5-flash-8b               | google        | 1M     | $0.075   | $0.3     | 🔧 📋    |
+| gemini-2-0-flash-lite             | google-vertex | 1M     | $0.075   | $0.3     | 🔧       |
+
+## 免费大上下文模型
+
+128K+ 上下文的免费模型 — 零成本长文档处理。
+
+| 模型                                     | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| ---------------------------------------- | ---------- | ------ | -------- | -------- | -------- |
+| openrouter--owl-alpha                    | openrouter | 1M     | Free     | Free     | 🔧 📋    |
+| deepseek--deepseek-v4-flash--free        | openrouter | 1M     | Free     | Free     | 🔧 🧠    |
+| google--lyria-3-clip-preview             | openrouter | 1M     | Free     | Free     | 📋       |
+| google--lyria-3-pro-preview              | openrouter | 1M     | Free     | Free     | 📋       |
+| qwen--qwen3-coder--free                  | openrouter | 1M     | Free     | Free     | 🔧       |
+| nvidia--nemotron-3-super-120b-a12b--free | openrouter | 1M     | Free     | Free     | 🔧 🧠 📋 |
+| google--gemma-4-26b-a4b-it--free         | openrouter | 262K   | Free     | Free     | 🔧 🧠 📋 |
+| arcee-ai--trinity-large-thinking--free   | openrouter | 262K   | Free     | Free     | 🔧 🧠    |
+| google--gemma-4-31b-it--free             | openrouter | 262K   | Free     | Free     | 🔧 🧠 📋 |
+| gemma-4-26b-a4b-it                       | auriko     | 262K   | Free     | Free     | 🔧 🧠 📋 |
+
+## 上下文窗口层级
+
+| 层级 | 上下文 | 用例               | 示例模型                  |
+| ---- | ------ | ------------------ | ------------------------- |
+| 标准 | 128K   | 长文档、代码文件   | gpt-4.1, claude-sonnet-4  |
+| 扩展 | 256K   | 代码库、多文件分析 | claude-opus-4, o3         |
+| 超大 | 1M     | 完整仓库、书籍     | gemini-2.5-flash, gpt-4.1 |
+| 巨型 | 10M    | 整个数据集、视频   | llama-4-scout             |
+
+## 相关文档
+
+- [上下文窗口](context-windows.md) — 详细的上下文窗口对比
+- [聊天模型](chat-models.md) — 2,350 个支持工具调用的聊天模型
+- [代码模型](code-models.md) — 189 个代码模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [迁移指南](migration-guide.md) — 切换提供商
+- [提供商对比](provider-comparison.md) — 前 30 个提供商
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/lessons-learned.md b/docs/zh/lessons-learned.md
index 16c05433..6d8ede7e 100644
--- a/docs/zh/lessons-learned.md
+++ b/docs/zh/lessons-learned.md
@@ -290,3 +290,15 @@
 - **nano-gpt**：公开 API 获取模型列表 + JS 包获取按 token USD 定价（555 个模型）。
 
 这些平台被视为推理平台，而非被拒绝为“只是路由器”，因为它们提供可验证的第一方按 token 定价数据。
+
+## 相关文档
+
+- [数据获取](data-acquisition.md) — 如何获取和更新数据
+- [数据模式](data-schema.md) — 完整 YAML 模式参考
+- [提供商概览](providers.md) — 95 个提供商
+- [常见问题](faq.md) — 常见问题
+- [贡献指南](https://github.com/i-need-token/ai-models/blob/main/CONTRIBUTING.md) — 如何贡献
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/migration-guide.md b/docs/zh/migration-guide.md
new file mode 100644
index 00000000..84d45516
--- /dev/null
+++ b/docs/zh/migration-guide.md
@@ -0,0 +1,100 @@
+# 迁移指南：切换 AI 模型提供商
+
+[English](../migration-guide.md)
+
+切换 AI 模型提供商的实用指南 — 比较定价、能力和上下文窗口，找到最适合您用例的替代方案。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么要切换提供商？
+
+- **节省成本** — 某些提供商以低 2-10 倍的价格提供相同模型
+- **更好的能力** — 新模型可能提供工具调用、推理或视觉能力
+- **更大的上下文** — 在单个请求中处理更多数据
+- **可靠性** — 减少对单一提供商的依赖
+- **合规性** — 数据驻留要求可能需要特定提供商
+
+## 主要提供商对比
+
+| 提供商    | 模型数 | 最低输入 $/M | 最大上下文 | 工具调用 | 推理 |
+| --------- | ------ | -----------: | ---------- | -------- | ---- |
+| openai    | 28     |        $0.02 | 1047576    | 18       | 8    |
+| anthropic | 11     |           $1 | 1000000    | 11       | 11   |
+| google    | 21     |       $0.075 | 2097152    | 8        | 2    |
+| deepseek  | 4      |        $0.14 | 1000000    | 4        | 3    |
+| meta      | 12     |         $0.1 | 10000000   | 9        | 0    |
+| mistral   | 16     |        $0.04 | 256000     | 12       | 1    |
+| xai       | 6      |         $0.2 | 131072     | 6        | 5    |
+| alibaba   | 62     |        $0.15 | 1000000    | 62       | 52   |
+
+## 常见迁移路径
+
+### OpenAI → 更便宜的替代方案
+
+| OpenAI 模型          | 最便宜的替代方案 | 提供商    | 输入 $/M | 节省 |
+| -------------------- | ---------------- | --------- | -------- | ---- |
+| gpt-4.1 ($2)         | gpt-4.1-mini     | openai    | $0.40    | 80%  |
+| gpt-4.1-mini ($0.40) | gpt-4.1-nano     | openai    | $0.10    | 75%  |
+| o4-mini ($1.10)      | deepseek-r1      | deepseek  | $0.55    | 50%  |
+| gpt-4.1 ($2)         | claude-haiku-4   | anthropic | $1       | 50%  |
+| gpt-4.1 ($2)         | gemini-2.5-flash | google    | $0.15    | 93%  |
+
+### Anthropic → 更便宜的替代方案
+
+| Anthropic 模型       | 最便宜的替代方案 | 提供商   | 输入 $/M | 节省 |
+| -------------------- | ---------------- | -------- | -------- | ---- |
+| claude-opus-4 ($15)  | o4-mini          | openai   | $1.10    | 93%  |
+| claude-sonnet-4 ($3) | gemini-2.5-flash | google   | $0.15    | 95%  |
+| claude-sonnet-4 ($3) | deepseek-chat    | deepseek | $0.14    | 95%  |
+| claude-haiku-4 ($1)  | gemini-2.5-flash | google   | $0.15    | 85%  |
+
+### Google → 更便宜的替代方案
+
+| Google 模型            | 最便宜的替代方案 | 提供商   | 输入 $/M | 节省 |
+| ---------------------- | ---------------- | -------- | -------- | ---- |
+| gemini-2.5-pro ($1.25) | gemini-2.5-flash | google   | $0.15    | 88%  |
+| gemini-2.5-pro ($1.25) | deepseek-chat    | deepseek | $0.14    | 89%  |
+
+## 迁移检查清单
+
+切换提供商时，请验证以下兼容性要点：
+
+- [ ] **API 格式** — OpenAI 兼容 vs 专有 API
+- [ ] **模型名称** — 不同提供商使用不同的模型 ID
+- [ ] **工具调用格式** — 函数调用语法不同
+- [ ] **流式传输** — SSE vs WebSocket vs HTTP 流式传输
+- [ ] **速率限制** — 每分钟请求数、每分钟 token 数
+- [ ] **上下文窗口** — 可能与原提供商不同
+- [ ] **模态** — 视觉、音频、视频支持不同
+- [ ] **结构化输出** — JSON 模式可用性
+- [ ] **提示缓存** — 可降低 50-90% 成本
+- [ ] **数据驻留** — 数据在哪里处理和存储
+
+## OpenAI 兼容提供商
+
+这些提供商提供 OpenAI 兼容 API — 只需最少的代码更改：
+
+| 提供商      | Base URL                        | 备注              |
+| ----------- | ------------------------------- | ----------------- |
+| openrouter  | `openrouter.ai/api/v1`          | 聚合器，356+ 模型 |
+| deepinfra   | `api.deepinfra.com/v1`          | 专注开源模型      |
+| togetherai  | `api.together.xyz/v1`           | 开源模型托管      |
+| groq        | `api.groq.com/openai/v1`        | 超快推理          |
+| cerebras    | `api.cerebras.ai/v1`            | 最快推理速度      |
+| fireworks   | `api.fireworks.ai/inference/v1` | 无服务器模型托管  |
+| siliconflow | `api.siliconflow.cn/v1`         | 中国市场提供商    |
+
+## 相关文档
+
+- [定价对比](pricing-comparison.md) — 跨提供商定价对比
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+- [聊天模型](chat-models.md) — 2,350 个支持工具调用的聊天模型
+- [智能体模型](agentic-models.md) — 1,080 个具备工具调用 + 推理能力的模型
+- [API 参考](api.md) — 编程访问模型数据
+- [OpenAI 替代方案](openai-alternatives.md) — GPT-4/GPT-3.5 定价替代
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/modality-matrix.md b/docs/zh/modality-matrix.md
new file mode 100644
index 00000000..5cfc4d31
--- /dev/null
+++ b/docs/zh/modality-matrix.md
@@ -0,0 +1,106 @@
+[English](../modality-matrix.md) | **中文**
+
+# 模态矩阵
+
+哪些模型支持视觉、音频、图像生成和视频？本页列出各模态的顶级模型。
+
+> 完整列表请浏览 `providers/` 目录或下载 [models.json](https://github.com/i-need-token/ai-models/releases/latest)。
+
+## 视觉（图像输入）
+
+1,487 个模型接受图像输入。以下是最强大的旗舰模型：
+
+| 模型             | 提供商    | 上下文 | 输入 $/1M | 输出 $/1M |
+| ---------------- | --------- | ------ | --------: | --------: |
+| GPT-4.1          | OpenAI    | 1M     |     $2.00 |     $8.00 |
+| Claude Opus 4    | Anthropic | 200K   |    $15.00 |    $75.00 |
+| Gemini 2.5 Pro   | Google    | 1M     |     $1.25 |    $10.00 |
+| Qwen3-235B-A22B  | 阿里云    | 128K   |     ¥1.00 |     ¥4.00 |
+| DeepSeek-V3      | DeepSeek  | 128K   |     $0.27 |     $1.10 |
+| Llama 4 Maverick | Meta      | 1M     |         — |         — |
+| Mistral Large    | Mistral   | 128K   |     $2.00 |     $6.00 |
+| Grok 3           | xAI       | 131K   |     $3.00 |    $15.00 |
+
+**最便宜的视觉模型（USD）：**
+
+| 模型          | 提供商      | 输入 $/1M | 输出 $/1M |
+| ------------- | ----------- | --------: | --------: |
+| DeepSeek-V3   | DeepSeek    |     $0.27 |     $1.10 |
+| Qwen3-30B-A3B | 阿里云      |     ¥0.10 |     ¥0.30 |
+| Llama 4 Scout | Together AI |     $0.15 |     $0.60 |
+| Gemma 3 27B   | Google      |     $0.20 |     $0.80 |
+| Phi-4         | Microsoft   |     $0.10 |     $0.40 |
+
+## 图像输出（图像生成）
+
+28 个模型可以生成图像：
+
+| 模型                 | 提供商            | 类型         |
+| -------------------- | ----------------- | ------------ |
+| GPT-Image-1          | OpenAI            | 原生图像生成 |
+| DALL-E 3             | OpenAI            | 原生图像生成 |
+| Gemini 2.0 Flash     | Google            | 多模态输出   |
+| Flux Pro             | Black Forest Labs | 图像生成     |
+| Flux Dev             | Black Forest Labs | 图像生成     |
+| Ideogram 3           | Ideogram          | 图像生成     |
+| Stable Diffusion 3.5 | Stability AI      | 图像生成     |
+| Midjourney v7        | Midjourney        | 图像生成     |
+
+## 音频输入（语音识别）
+
+118 个模型接受音频输入：
+
+| 模型            | 提供商    | 能力            |
+| --------------- | --------- | --------------- |
+| GPT-4o-audio    | OpenAI    | 音频理解 + 生成 |
+| Gemini 2.5 Pro  | Google    | 音频理解        |
+| Claude Sonnet 4 | Anthropic | 音频理解        |
+| Qwen2-Audio     | 阿里云    | 音频理解        |
+| Whisper         | OpenAI    | 语音识别        |
+
+## 音频输出（语音生成）
+
+34 个模型可以生成音频：
+
+| 模型           | 提供商 | 类型       |
+| -------------- | ------ | ---------- |
+| GPT-4o-audio   | OpenAI | 音频输出   |
+| Gemini 2.5 Pro | Google | 音频输出   |
+| Qwen2-Audio    | 阿里云 | 音频输出   |
+| TTS-1          | OpenAI | 文本转语音 |
+| TTS-1-HD       | OpenAI | 文本转语音 |
+
+## 视频输入
+
+167 个模型接受视频输入：
+
+| 模型             | 提供商    | 上下文      |
+| ---------------- | --------- | ----------- |
+| Gemini 2.5 Pro   | Google    | 1M tokens   |
+| GPT-4.1          | OpenAI    | 1M tokens   |
+| Claude Opus 4    | Anthropic | 200K tokens |
+| Qwen3-235B-A22B  | 阿里云    | 128K tokens |
+| Llama 4 Maverick | Meta      | 1M tokens   |
+
+## 多模态模型（3+ 输入模态）
+
+接受文本 + 至少 2 种额外输入模态的模型：
+
+| 模型           | 提供商    | 输入模态               |
+| -------------- | --------- | ---------------------- |
+| GPT-4o-audio   | OpenAI    | 文本、图像、音频       |
+| Gemini 2.5 Pro | Google    | 文本、图像、音频、视频 |
+| Claude Opus 4  | Anthropic | 文本、图像、音频       |
+| Qwen2-Audio    | 阿里云    | 文本、图像、音频       |
+
+## 相关文档
+
+- [视觉模型](vision-models.md) — 1,487 个视觉模型
+- [音频模型](audio-models.md) — 118 个音频输入 + 34 个音频输出模型
+- [视频模型](video-models.md) — 167 个视频输入/输出模型
+- [图像生成](image-generation.md) — 28 个图像生成模型
+- [模型选择指南](model-selection.md) — 决策框架
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/model-comparison.md b/docs/zh/model-comparison.md
new file mode 100644
index 00000000..418aa9cf
--- /dev/null
+++ b/docs/zh/model-comparison.md
@@ -0,0 +1,109 @@
+[English](../model-comparison.md) | **中文**
+
+# 模型对比
+
+热门 AI 模型类别的快速参考对比。所有数据来自第一方提供商 API 和文档。
+
+## 顶级旗舰模型
+
+各主要提供商最强大的模型。定价为直接提供商 API 价格。
+
+| 模型             | 提供商    | 上下文 | 输入 $/百万token | 输出 $/百万token | 推理 | 工具调用 | 视觉 |
+| ---------------- | --------- | -----: | ---------------: | ---------------: | :--: | :------: | :--: |
+| o3               | OpenAI    |   200K |            10.00 |            40.00 |  ✅  |    ✅    |  ✅  |
+| Claude Opus 4.7  | Anthropic |     1M |             5.00 |            25.00 |  ✅  |    ✅    |  ✅  |
+| Gemini 2.5 Pro   | Google    |     1M |             1.25 |            10.00 |  ✅  |    ✅    |  ✅  |
+| DeepSeek-V4-Pro  | DeepSeek  |     1M |            0.435 |             0.87 |  ✅  |    ✅    |  ❌  |
+| Grok 4           | xAI       |   131K |             3.00 |            15.00 |  ✅  |    ✅    |  ✅  |
+| Llama 4 Maverick | Meta      |     1M |             0.24 |             0.97 |  ❌  |    ✅    |  ✅  |
+| Qwen3-235B       | 阿里云    |      — |             2.00 |             8.00 |  ✅  |    ✅    |  ❌  |
+| Mistral Large    | Mistral   |   128K |             2.00 |             6.00 |  ❌  |    ✅    |  ✅  |
+
+## 高性价比模型
+
+适合高吞吐量工作负载的最佳性价比模型。
+
+| 模型              | 提供商    | 上下文 | 输入 $/百万token | 输出 $/百万token | 推理 | 工具调用 |
+| ----------------- | --------- | -----: | ---------------: | ---------------: | :--: | :------: |
+| GPT-4.1 Nano      | OpenAI    |     1M |             0.10 |             0.40 |  ❌  |    ✅    |
+| o4-mini           | OpenAI    |   200K |             1.10 |             4.40 |  ✅  |    ✅    |
+| Claude Haiku 4.5  | Anthropic |   200K |             1.00 |             5.00 |  ✅  |    ✅    |
+| Gemini 2.5 Flash  | Google    |     1M |             0.15 |             3.50 |  ✅  |    ✅    |
+| DeepSeek-V4-Flash | DeepSeek  |     1M |             0.14 |             0.28 |  ✅  |    ✅    |
+| Llama 4 Scout     | Meta      |    10M |             0.17 |             0.66 |  ❌  |    ✅    |
+| Qwen3-30B         | 阿里云    |      — |             0.75 |             3.00 |  ✅  |    ✅    |
+| Mistral Small     | Mistral   |   128K |             0.20 |             0.60 |  ❌  |    ✅    |
+| Grok 3 Mini       | xAI       |   131K |             0.25 |             1.27 |  ✅  |    ✅    |
+
+## 最大上下文窗口
+
+适合长文档处理的最大上下文窗口模型。
+
+| 模型              | 提供商    | 上下文 (tokens) | 输入 $/百万token | 输出 $/百万token |
+| ----------------- | --------- | --------------: | ---------------: | ---------------: |
+| Llama 4 Scout     | Meta      |      10,000,000 |             0.17 |             0.66 |
+| Claude Opus 4.7   | Anthropic |       1,000,000 |             5.00 |            25.00 |
+| Claude Sonnet 4.6 | Anthropic |       1,000,000 |             3.00 |            15.00 |
+| GPT-4.1           | OpenAI    |       1,048,576 |             2.00 |             8.00 |
+| Gemini 2.5 Pro    | Google    |       1,048,576 |             1.25 |            10.00 |
+| Gemini 2.5 Flash  | Google    |       1,048,576 |             0.15 |             3.50 |
+| Llama 4 Maverick  | Meta      |       1,000,000 |             0.24 |             0.97 |
+| DeepSeek-V4-Pro   | DeepSeek  |       1,000,000 |            0.435 |             0.87 |
+
+## 免费模型
+
+数据采集时免费可用的模型。
+
+| 模型                       | 提供商   | 上下文 | 推理 | 工具调用 |
+| -------------------------- | -------- | -----: | :--: | :------: |
+| DeepSeek-V4-Flash (免费层) | DeepSeek |     1M |  ✅  |    ✅    |
+| Gemini 2.5 Flash (免费层)  | Google   |     1M |  ✅  |    ✅    |
+| Llama 4 Scout (自托管)     | Meta     |    10M |  ❌  |    ✅    |
+| Qwen3-30B (自托管)         | 阿里云   |      — |  ✅  |    ✅    |
+| Mistral Small (自托管)     | Mistral  |   128K |  ❌  |    ✅    |
+
+> 免费层通常有速率限制。自托管模型需要自己的基础设施。
+
+## 视觉模型
+
+支持图像输入的模型。
+
+| 模型             | 提供商    | 图像输入 | 图像输出 | 视频输入 |
+| ---------------- | --------- | :------: | :------: | :------: |
+| o3               | OpenAI    |    ✅    |    ❌    |    ❌    |
+| Claude Opus 4.7  | Anthropic |    ✅    |    ❌    |    ❌    |
+| Gemini 2.5 Pro   | Google    |    ✅    |    ❌    |    ❌    |
+| GPT-4.1          | OpenAI    |    ✅    |    ❌    |    ❌    |
+| Llama 4 Maverick | Meta      |    ✅    |    ❌    |    ❌    |
+| Grok 3           | xAI       |    ✅    |    ❌    |    ❌    |
+
+## 开源权重模型
+
+权重公开可用的自托管模型。
+
+| 模型              | 提供商    | 上下文 | 输入 $/百万token | 输出 $/百万token | 推理 |
+| ----------------- | --------- | -----: | ---------------: | ---------------: | :--: |
+| Llama 4 Maverick  | Meta      |     1M |             0.24 |             0.97 |  ❌  |
+| Llama 4 Scout     | Meta      |    10M |             0.17 |             0.66 |  ❌  |
+| Qwen3-235B        | 阿里云    |      — |             2.00 |             8.00 |  ✅  |
+| Qwen3-30B         | 阿里云    |      — |             0.75 |             3.00 |  ✅  |
+| Mistral Small 3.2 | Mistral   |   128K |             0.20 |             0.60 |  ❌  |
+| Phi-4             | Microsoft |    16K |            0.125 |             0.50 |  ❌  |
+
+> 定价为托管推理价格。自托管模型无按 token 计费，但需要基础设施。
+
+---
+
+**注意**：所有定价和能力数据来自第一方来源。推理平台价格可能不同。查看 `providers/<id>/models/` 获取最新数据。
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [定价对比](pricing-comparison.md) — 各提供商定价并排对比
+- [免费 AI 模型](free-models.md) — 81 个免费模型
+- [开源权重模型](open-weights.md) — 527 个可自行运行的模型
+- [上下文窗口对比](context-windows.md) — 最大上下文窗口
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/model-selection-cheatsheet.md b/docs/zh/model-selection-cheatsheet.md
new file mode 100644
index 00000000..407cf496
--- /dev/null
+++ b/docs/zh/model-selection-cheatsheet.md
@@ -0,0 +1,105 @@
+# AI 模型选择速查表
+
+> 按使用场景快速选择 AI 模型的参考指南。数据来自 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 95 个提供商、4,587+ 模型。
+
+## 🎯 决策树
+
+```
+你需要什么？
+├── 最便宜的工具调用模型 → ling-2.6-flash ($0.01/$0.03/M)
+├── 最佳免费推理模型 → DeepSeek R1 (92% MATH-500)
+├── 最大上下文窗口 → Gemini 2.5 Pro (1M tokens)
+├── 最佳编程助手 → Claude Sonnet 4 / GPT-4.1
+├── 开源工具调用模型 → Qwen3 4B ($0.03/$0.15/M)
+├── 免费视觉模型 → Gemma 4 27B IT
+└── 最低生产成本 → bdc-coder ($0.01/$0.01/M)
+```
+
+## 💰 按预算选择
+
+| 预算          | 最佳选择        | 输入/输出 $/M | 理由                   |
+| ------------- | --------------- | ------------- | ---------------------- |
+| **免费**      | DeepSeek R1     | $0/$0         | 免费模型中推理能力最强 |
+| **免费**      | Gemma 4 27B IT  | $0/$0         | 免费视觉 + 工具调用    |
+| **< $0.05/M** | ling-2.6-flash  | $0.01/$0.03   | 最便宜的工具调用模型   |
+| **< $0.10/M** | Qwen3 4B        | $0.03/$0.15   | 开源推理 + 工具调用    |
+| **< $0.50/M** | GPT-4.1-mini    | $0.40/$1.60   | 最佳性价比前沿模型     |
+| **< $2/M**    | Claude Sonnet 4 | $3/$15        | 顶级编程 + 推理        |
+| **< $5/M**    | GPT-4.1         | $2/$8         | 1M 上下文 + 视觉       |
+| **高端**      | o3              | $10/$40       | 最佳推理基准分数       |
+
+## 🛠️ 按使用场景选择
+
+### AI Agent
+
+需求：工具调用 + 推理 + 低延迟
+
+- **最佳性价比**：ling-2.6-flash ($0.01/$0.03/M) — 最便宜的 TC 模型
+- **均衡之选**：GPT-4.1-mini ($0.40/$1.60/M) — 可靠 + 1M 上下文
+- **高端选择**：Claude Sonnet 4 ($3/$15/M) — 最佳 Agent 性能
+
+### 代码生成
+
+需求：工具调用 + 结构化输出 + 大上下文
+
+- **最佳性价比**：bdc-coder ($0.01/$0.01/M) — 最便宜的编程模型
+- **均衡之选**：GPT-4.1-mini ($0.40/$1.60/M) — 代码质量优秀
+- **高端选择**：Claude Sonnet 4 ($3/$15/M) — SWE-bench SOTA
+
+### 对话 / RAG
+
+需求：大上下文 + 低成本 + 快速响应
+
+- **最佳性价比**：Qwen3 4B ($0.03/$0.15/M) — 便宜 + 262K 上下文
+- **均衡之选**：GPT-4.1-nano ($0.10/$0.40/M) — 快速 + 便宜
+- **高端选择**：Gemini 2.5 Pro ($1.25/$10/M) — 1M 上下文 + 推理
+
+### 视觉 / 多模态
+
+需求：图像输入 + 文本输出 + 工具调用
+
+- **免费**：Gemma 4 27B IT — 免费视觉 + TC
+- **最佳性价比**：GPT-4.1-mini ($0.40/$1.60/M) — 视觉 + 1M 上下文
+- **高端选择**：Claude Sonnet 4 ($3/$15/M) — 最佳视觉理解
+
+### 推理 / 数学
+
+需求：推理能力 + 结构化输出
+
+- **免费**：DeepSeek R1 — 92% MATH-500
+- **最佳性价比**：Qwen3.5 4B ($0.03/$0.15/M) — 便宜推理
+- **高端选择**：o3 ($10/$40/M) — GPQA、MATH-500 SOTA
+
+### 大规模生产
+
+需求：最低 token 成本 + 可靠性
+
+- **最便宜 TC**：ling-2.6-flash ($0.01/$0.03/M)
+- **最便宜推理**：Qwen3.5 0.8B ($0.01/$0.05/M)
+- **最便宜编程**：bdc-coder ($0.01/$0.01/M)
+
+## 📊 快速统计
+
+| 指标         | 数量  |
+| ------------ | ----- |
+| 模型总数     | 4,587 |
+| 提供商       | 95    |
+| 免费模型     | 81    |
+| 工具调用模型 | 2,350 |
+| 推理模型     | 1,306 |
+| 视觉模型     | 1,487 |
+| 开源模型     | 527   |
+| 结构化输出   | 829   |
+
+## 🔗 更多资源
+
+- [交互式目录](https://i-need-token.github.io/ai-models/) — 搜索、筛选、对比所有模型
+- [免费模型指南](free-models.md) — 81 个免费模型
+- [工具调用指南](tool-calling.md) — 2,350 个工具调用模型
+- [定价对比](pricing-comparison.md) — 找到最便宜的模型
+- [上下文窗口](context-windows.md) — 最大上下文窗口
+- [模型对比](model-comparison.md) — 面对面对比
+
+---
+
+_数据来自 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 仅使用一手数据，自动更新。_
diff --git a/docs/zh/model-selection.md b/docs/zh/model-selection.md
new file mode 100644
index 00000000..7817d877
--- /dev/null
+++ b/docs/zh/model-selection.md
@@ -0,0 +1,128 @@
+# 模型选择指南
+
+> 📋 **快速参考？** 查看[模型选择速查表](model-selection-cheatsheet.md)，按预算选择最佳模型。
+> [English](../model-selection.md)
+
+如何根据使用场景选择合适的 AI 模型 — 基于成本、能力和上下文窗口的实用建议。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 决策框架
+
+```
+你需要什么？
+├── 尽可能便宜 → 免费模型（81 个可用）
+│   ├── 带工具调用 → 见下方"免费 + 工具调用"
+│   ├── 带推理 → 见下方"免费 + 推理"
+│   └── 最佳免费模型 → 见下方"最佳免费模型"
+├── 最佳性价比（便宜 + 能力强）→ 见下方"最佳性价比模型"
+├── 最大上下文 → 见下方"大上下文模型"
+├── 特定能力
+│   ├── 工具调用 → [工具调用模型](tool-calling.md)
+│   ├── 推理 → [推理模型](reasoning-models.md)
+│   ├── 视觉 → [视觉模型](vision-models.md)
+│   ├── 结构化输出 → [结构化输出](structured-output.md)
+│   └── 提示缓存 → [缓存定价](cached-pricing.md)
+└── 完整对比 → [模型对比](model-comparison.md) · [定价对比](pricing-comparison.md)
+```
+
+## 最佳免费模型
+
+输入和输出定价均为 $0 的模型 — 非常适合原型开发和开发阶段。
+
+| 模型 | 提供商 | 上下文 | 能力 |
+| ---- | ------ | ------ | ---- |
+
+> 查看[免费 AI 模型](free-models.md)获取 81 个免费模型的完整列表。
+
+## 免费 + 工具调用
+
+支持函数/工具调用的免费模型 — 零成本构建 Agent 的理想选择。
+
+| 模型 | 提供商 | 上下文 | 能力 |
+| ---- | ------ | ------ | ---- |
+
+## 免费 + 推理
+
+具有链式思维推理的免费模型 — 零成本解决复杂问题。
+
+| 模型 | 提供商 | 上下文 | 能力 |
+| ---- | ------ | ------ | ---- |
+
+## 最佳性价比模型
+
+最便宜的工具调用模型 — 生产 Agent 的最佳性价比。
+
+| 模型                        | 提供商       | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| --------------------------- | ------------ | ------ | -------- | -------- | -------- |
+| ernie-4.5-0.3b              | aihubmix     | 0      | $0.0068  | $0.0272  | 🔧 👁 📋 |
+| bdc-coder                   | inferencenet | 131K   | $0.01    | $0.01    | 🔧 🔓    |
+| inclusionai--ling-2.6-flash | openrouter   | 262K   | $0.01    | $0.03    | 🔧 📋    |
+| ling-2.6-flash              | inclusionai  | 262K   | $0.01    | $0.03    | 🔧       |
+| qwen-3.5-0.8b               | auriko       | 262K   | $0.01    | $0.05    | 🧠 🔧 👁 |
+
+最便宜的视觉模型：
+
+| 模型                 | 提供商    | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| -------------------- | --------- | ------ | -------- | -------- | -------- |
+| ernie-4.5-0.3b       | aihubmix  | 0      | $0.0068  | $0.0272  | 🔧 👁 📋 |
+| deepseek-ocr         | aihubmix  | 0      | $0.01    | $0.01    | 👁       |
+| gemini-2.0-flash-exp | aihubmix  | 0      | $0.01    | $0.04    | 👁       |
+| qwen-3.5-0.8b        | auriko    | 262K   | $0.01    | $0.05    | 🧠 🔧 👁 |
+| qwen3.5-0.8b         | deepinfra | 262K   | $0.01    | $0.05    | 🧠 👁    |
+
+最便宜的推理模型：
+
+| 模型                  | 提供商    | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| --------------------- | --------- | ------ | -------- | -------- | -------- |
+| qwen-3.5-0.8b         | auriko    | 262K   | $0.01    | $0.05    | 🧠 🔧 👁 |
+| qwen3.5-0.8b          | deepinfra | 262K   | $0.01    | $0.05    | 🧠 👁    |
+| gemma-2-2b-it         | cortecs   | 0      | $0.018   | $0.054   | 🧠       |
+| llama-3.1-8b-instruct | cortecs   | 0      | $0.018   | $0.054   | 🧠 🔧    |
+| qwen-3.5-2b           | auriko    | 262K   | $0.02    | $0.1     | 🧠 🔧 👁 |
+
+## 大上下文模型
+
+上下文窗口最大的模型 — 适用于长文档、多轮对话和代码库。
+
+| 模型                         | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| ---------------------------- | ---------- | ------ | -------- | -------- | -------- |
+| meta-llama--llama-4-scout    | openrouter | 10M    | $0.08    | $0.3     | 🔧 👁 📋 |
+| meta-llama-4-scout           | meta       | 10M    | $0.17    | $0.66    | 🔧 👁    |
+| gemini-1.5-pro               | google     | 2M     | $1.25    | $5       | 🔧 👁 📋 |
+| grok-code-fast-1             | jiekou     | 2M     | $0.19    | $0.475   | 🔧 👁    |
+| gpt-4o                       | jiekou     | 2M     | $1.9     | $5.7     | 🔧 👁    |
+| grok-4.20-0309-non-reasoning | jiekou     | 2M     | $0.19    | $0.475   | 🔧 👁    |
+| grok-4.20-0309-reasoning     | jiekou     | 2M     | $1.9     | $5.7     | 🔧 👁    |
+| grok-4-1-fast-reasoning      | jiekou     | 2M     | $0.19    | $0.475   | 🔧 👁    |
+| grok-4-fast-reasoning        | jiekou     | 2M     | $0.19    | $0.475   | 🔧 👁    |
+| x-ai--grok-4-fast            | fastrouter | 2M     | $0.2     | $0.5     | 🔧 👁    |
+
+> 查看[上下文窗口对比](context-windows.md)获取完整分析。
+
+## 成本优化技巧
+
+1. **开发时使用免费模型** — 用免费模型原型开发，生产环境切换到付费模型
+2. **启用提示缓存** — [1,374 个模型](cached-pricing.md)支持缓存，输入成本节省 50-90%
+3. **选择满足需求的最小模型** — 例如简单任务用 GPT-4.1 Mini 而非 GPT-4.1
+4. **使用开源权重模型** — [527 个模型](open-weights.md)可在自己的基础设施上运行
+5. **跨提供商对比** — 同一模型通过替代提供商（如 Groq、Together AI、DeepInfra）通常更便宜
+6. **批量请求** — 部分提供商对批量 API 调用提供 50% 折扣
+7. **监控用量** — 跟踪输入/输出 token 比率以优化模型选择
+
+## 相关文档
+
+- [模型对比](model-comparison.md) — 旗舰、高性价比、免费和开源模型
+- [定价对比](pricing-comparison.md) — 各提供商定价并排对比
+- [缓存定价](cached-pricing.md) — 支持提示缓存的模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [开源权重模型](open-weights.md) — 527 个可自行运行的模型
+- [上下文窗口对比](context-windows.md) — 最大上下文窗口
+- [工具调用模型](tool-calling.md) — 2,350 个支持工具调用的模型
+- [推理模型](reasoning-models.md) — 1,306 个支持推理的模型
+- [视觉模型](vision-models.md) — 1,487 个支持图像理解的模型
+- [快速入门](quick-start.md) — 30 秒上手
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/multimodal-models.md b/docs/zh/multimodal-models.md
new file mode 100644
index 00000000..a3c54160
--- /dev/null
+++ b/docs/zh/multimodal-models.md
@@ -0,0 +1,101 @@
+# 多模态模型
+
+[English](../multimodal-models.md)
+
+能够处理**多种输入模态**的 AI 模型 — 图像、音频和视频与文本并行。这些模型驱动视觉问答、文档分析、视频理解和音频转录。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么多模态模型很重要
+
+多模态模型打破了纯文本的限制：
+
+- **视觉问答** — 对图像和文档提问
+- **文档分析** — 从 PDF、截图和扫描件中提取信息
+- **视频理解** — 分析视频内容，总结片段
+- **音频处理** — 转录语音，分析音频内容
+- **无障碍** — 为视障用户描述图像
+- **内容审核** — 跨模态检测不当内容
+
+## 统计
+
+| 指标               | 数量 |
+| ------------------ | ---- |
+| 多模态模型         | 1519 |
+| 提供商             | 61   |
+| 图像输入           | 1487 |
+| 音频输入           | 118  |
+| 视频输入           | 167  |
+| 免费多模态模型     | 53   |
+| 开源权重多模态模型 | 119  |
+| 带工具调用         | 1179 |
+| 带推理能力         | 701  |
+
+## 提供商
+
+`01ai`, `302ai`, `aihubmix`, `aimlapi`, `amazon`, `amazon-bedrock`, `anthropic`, `arcee`, `auriko`, `baidu`, `berget`, `bytedance`, `chutes`, `clarifai`, `cloudferro-sherlock`, `cloudflare`, `cortecs`, `databricks`, `deepinfra`, `digitalocean`, `evroc`, `fastrouter`, `fireworks`, `google`, `google-vertex` 等 36 个
+
+## 免费多模态模型
+
+支持多模态输入的免费模型 — 零成本视觉/音频应用。
+
+| 模型                                                 | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 模态           |
+| ---------------------------------------------------- | ---------- | ------ | -------- | -------- | -------------- |
+| google--lyria-3-clip-preview                         | openrouter | 1M     | Free     | Free     | 🖼️             |
+| google--lyria-3-pro-preview                          | openrouter | 1M     | Free     | Free     | 🖼️             |
+| google--gemma-4-26b-a4b-it--free                     | openrouter | 262K   | Free     | Free     | 🖼️ 🎬 🔧 🧠    |
+| google--gemma-4-31b-it--free                         | openrouter | 262K   | Free     | Free     | 🖼️ 🎬 🔧 🧠    |
+| gemma-4-26b-a4b-it                                   | auriko     | 262K   | Free     | Free     | 🖼️ 🔧 🧠       |
+| gemma-4-31b-it                                       | auriko     | 262K   | Free     | Free     | 🖼️ 🔧 🧠       |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter | 256K   | Free     | Free     | 🖼️ 🎤 🎬 🔧 🧠 |
+| spotlight                                            | arcee      | 131K   | Free     | Free     | 🖼️             |
+| gemma-3-4b-it                                        | google     | 131K   | Free     | Free     | 🖼️             |
+| gemma-3-12b-it                                       | google     | 131K   | Free     | Free     | 🖼️             |
+
+## 最便宜多模态模型
+
+生产环境多模态应用的最佳性价比模型。
+
+| 模型                       | 提供商    | 上下文 | 输入 $/M | 输出 $/M | 模态     |
+| -------------------------- | --------- | ------ | -------- | -------- | -------- |
+| ernie-4.5-0.3b             | aihubmix  | 0      | $0.0068  | $0.0272  | 🖼️ 🔧    |
+| deepseek-ocr               | aihubmix  | 0      | $0.01    | $0.01    | 🖼️       |
+| gemini-2.0-flash-exp       | aihubmix  | 0      | $0.01    | $0.04    | 🖼️ 🎤 🎬 |
+| qwen-3.5-0.8b              | auriko    | 262K   | $0.01    | $0.05    | 🖼️ 🔧 🧠 |
+| qwen3.5-0.8b               | deepinfra | 262K   | $0.01    | $0.05    | 🖼️ 🧠    |
+| qwen3-vl-flash-2026-01-22  | aihubmix  | 0      | $0.0103  | $0.103   | 🖼️ 🎬 🔧 |
+| qwen3-vl-flash             | aihubmix  | 0      | $0.0103  | $0.103   | 🖼️ 🎬 🔧 |
+| glm-ocr                    | aihubmix  | 0      | $0.0141  | $0.0141  | 🖼️       |
+| paddlepaddle--paddleocr-vl | novitaai  | 16K    | $0.02    | $0.02    | 🖼️       |
+| qwen-3.5-2b                | auriko    | 262K   | $0.02    | $0.1     | 🖼️ 🔧 🧠 |
+
+## 大上下文多模态模型
+
+上下文窗口最大的多模态模型 — 适用于处理长文档和视频。
+
+| 模型                         | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 模态        |
+| ---------------------------- | ---------- | ------ | -------- | -------- | ----------- |
+| meta-llama--llama-4-scout    | openrouter | 10M    | $0.08    | $0.3     | 🖼️ 🔧       |
+| meta-llama-4-scout           | meta       | 10M    | $0.17    | $0.66    | 🖼️ 🔧       |
+| gemini-1.5-pro               | google     | 2M     | $1.25    | $5       | 🖼️ 🎤 🎬 🔧 |
+| grok-code-fast-1             | jiekou     | 2M     | $0.19    | $0.475   | 🖼️ 🔧       |
+| gpt-4o                       | jiekou     | 2M     | $1.9     | $5.7     | 🖼️ 🔧       |
+| grok-4.20-0309-non-reasoning | jiekou     | 2M     | $0.19    | $0.475   | 🖼️ 🔧       |
+| grok-4.20-0309-reasoning     | jiekou     | 2M     | $1.9     | $5.7     | 🖼️ 🔧       |
+| grok-4-1-fast-reasoning      | jiekou     | 2M     | $0.19    | $0.475   | 🖼️ 🔧       |
+| grok-4-fast-reasoning        | jiekou     | 2M     | $0.19    | $0.475   | 🖼️ 🔧       |
+| x-ai--grok-4-fast            | fastrouter | 2M     | $0.2     | $0.5     | 🖼️ 🔧       |
+
+## 相关文档
+
+- [视觉模型](vision-models.md) — 1,487 个支持图像输入的模型
+- [视频模型](video-models.md) — 支持视频理解的模型
+- [音频模型](audio-models.md) — 支持音频输入/输出的模型
+- [图像生成](image-generation.md) — 28 个图像生成模型
+- [智能体模型](agentic-models.md) — 1,080 个具备工具调用 + 推理能力的模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/open-weights.md b/docs/zh/open-weights.md
new file mode 100644
index 00000000..7e7a6d83
--- /dev/null
+++ b/docs/zh/open-weights.md
@@ -0,0 +1,118 @@
+[English](../open-weights.md) | **中文**
+
+# 开源权重 AI 模型
+
+本目录中有 513 个开源权重模型 — 你可以下载权重并在自己的基础设施上运行。本页重点介绍最有能力和最广泛可用的开源权重模型。
+
+> 所有数据来自一手 API 和文档。"开源权重"表示模型权重公开可用；各模型的许可证条款不同。
+
+## 快速统计
+
+| 能力                 | 开源权重模型数 |
+| -------------------- | -------------: |
+| 总开源权重模型       |            513 |
+| 唯一模型 ID          |            420 |
+| 支持工具调用         |            270 |
+| 支持推理             |            101 |
+| 支持视觉（图像输入） |            104 |
+
+## 最广泛可用
+
+这些开源权重模型在最多提供商上可用 — 容易找到，容易切换：
+
+| 模型                          | 提供商数 | 上下文 | 工具调用 | 推理 | 视觉 |
+| ----------------------------- | -------: | ------ | -------- | ---- | ---- |
+| GPT-OSS-120B                  |       14 | 131K   | ✅       | ✅   | ❌   |
+| GPT-OSS-20B                   |        8 | 131K   | ✅       | ✅   | ❌   |
+| Qwen3.5-397B-A17B             |        4 | 262K   | ✅       | ✅   | ❌   |
+| Kimi K2 Thinking              |        4 | 262K   | ✅       | ✅   | ✅   |
+| DeepSeek-R1-Distill-Llama-70B |        4 | 131K   | ✅       | ✅   | ❌   |
+| Llama 4 Scout 17B             |        4 | 328K   | ✅       | ❌   | ✅   |
+| DeepSeek-R1                   |        3 | 131K   | ✅       | ✅   | ❌   |
+| Llama 4 Maverick              |        3 | 1M     | ✅       | ❌   | ✅   |
+| Qwen3-32B                     |        3 | 131K   | ✅       | ✅   | ❌   |
+| Gemma 4 31B IT                |        3 | 262K   | ✅       | ✅   | ✅   |
+
+## 最大上下文窗口
+
+拥有最大上下文窗口的开源权重模型：
+
+| 模型              | 上下文 | 工具调用 | 推理 | 视觉 |
+| ----------------- | ------ | -------- | ---- | ---- |
+| Llama 4 Scout     | 10M    | ✅       | ❌   | ✅   |
+| Qwen3.5 Flash     | 1M     | ✅       | ❌   | ✅   |
+| Qwen3.6 Flash     | 1M     | ✅       | ❌   | ✅   |
+| Llama 4 Maverick  | 1M     | ✅       | ❌   | ✅   |
+| DeepSeek-V4 Flash | 1M     | ✅       | ✅   | ❌   |
+| DeepSeek-V4 Pro   | 1M     | ✅       | ✅   | ❌   |
+| MiMo V2.5         | 1M     | ✅       | ✅   | ✅   |
+| Minimax M2.5      | 1M     | ✅       | ❌   | ❌   |
+| Gemma 4 31B IT    | 1M     | ✅       | ❌   | ✅   |
+
+## 最佳开源权重推理模型
+
+这些开源权重模型支持链式思维推理：
+
+| 模型                 | 上下文 | 工具调用 | 视觉 | 提供商数 |
+| -------------------- | ------ | -------- | ---- | -------: |
+| DeepSeek-V4 Flash    | 1M     | ✅       | ❌   |        2 |
+| DeepSeek-V4 Pro      | 1M     | ✅       | ❌   |        2 |
+| MiMo V2.5 Pro        | 1M     | ✅       | ❌   |        1 |
+| MiMo V2.5            | 1M     | ✅       | ✅   |        1 |
+| Gemma 4 26B A4B IT   | 262K   | ✅       | ✅   |        3 |
+| Kimi K2.6            | 262K   | ✅       | ✅   |        2 |
+| Qwen3.5-397B-A17B    | 262K   | ✅       | ❌   |        2 |
+| Nemotron-3-120B-A12B | 262K   | ✅       | ❌   |        1 |
+| DeepSeek-R1          | 131K   | ✅       | ❌   |        3 |
+| Qwen3-32B            | 131K   | ✅       | ✅   |        3 |
+
+## 最佳开源权重视觉模型
+
+接受图像输入的开源权重模型：
+
+| 模型               | 上下文 | 工具调用 | 推理 | 提供商数 |
+| ------------------ | ------ | -------- | ---- | -------: |
+| MiMo V2.5          | 1M     | ✅       | ✅   |        1 |
+| Llama 4 Maverick   | 1M     | ✅       | ❌   |        3 |
+| Llama 4 Scout      | 10M    | ✅       | ❌   |        2 |
+| Gemma 4 31B IT     | 1M     | ✅       | ❌   |        3 |
+| Qwen3.5 Flash      | 1M     | ✅       | ❌   |        1 |
+| Kimi K2.6          | 262K   | ✅       | ✅   |        2 |
+| Gemma 4 26B A4B IT | 262K   | ✅       | ✅   |        3 |
+| Llama 4 Scout 17B  | 328K   | ✅       | ❌   |        4 |
+
+## 最便宜的开源权重模型
+
+开源权重推理的最低每 token 定价：
+
+| 模型                       | 提供商       | 输入 $/1M | 输出 $/1M | 上下文 |
+| -------------------------- | ------------ | --------: | --------: | ------ |
+| GLM-4-Flash                | 302AI        |   $0.0014 |   $0.0014 | 131K   |
+| Mistral-Nemo-Instruct-2407 | KlusterAI    |    $0.008 |    $0.001 | 131K   |
+| BDC-Coder                  | InferenceNet |     $0.01 |     $0.01 | 131K   |
+| Granite 4.0 H Micro        | Cloudflare   |    $0.017 |    $0.112 | 131K   |
+| Llama 3.1 8B Instruct      | InferenceNet |     $0.02 |     $0.03 | 131K   |
+| Mistral Nemo Instruct 2407 | MegaNova     |     $0.02 |     $0.04 | 131K   |
+| Meta-Llama-3.1-8B-Instruct | Nebius       |     $0.02 |     $0.06 | 131K   |
+| Llama 3.2 1B Instruct      | Cloudflare   |    $0.027 |    $0.201 | 131K   |
+
+## 要点总结
+
+- **513 个开源权重模型**，涵盖 420 个唯一模型 ID — 最大的开源权重模型目录
+- **GPT-OSS-120B** 是最广泛可用的，由 14 个提供商提供
+- **Llama 4 Scout** 拥有最大的上下文窗口（10M tokens）
+- **DeepSeek-R1** 是最受欢迎的开源权重推理模型，在 3 个提供商上可用
+- **MiMo V2.5** 是唯一结合 1M 上下文、推理和视觉的开源权重模型
+- 定价差异很大 — 最便宜的开源权重模型每 1M tokens 不到 $0.01
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [免费 AI 模型](free-models.md) — 81 个免费模型
+- [提供商概览](providers.md) — 95 个提供商按类型分类
+- [推理模型](reasoning-models.md) — 1,306 个支持推理的模型
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/openai-alternatives.md b/docs/zh/openai-alternatives.md
new file mode 100644
index 00000000..bb8be1af
--- /dev/null
+++ b/docs/zh/openai-alternatives.md
@@ -0,0 +1,156 @@
+[English](../openai-alternatives.md) | **中文**
+
+# OpenAI 替代方案 — GPT-4、GPT-3.5 及更多
+
+全面对比 OpenAI GPT-4、GPT-4o 和 GPT-3.5 Turbo 的替代模型 — 包含定价、能力和 API 兼容性。所有数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) 一手 API。
+
+## 快速对比：GPT-4 级别替代方案
+
+具备 **工具调用 + 推理 + 视觉** 的模型（完整 GPT-4 能力集）：
+
+| Model                         | Provider   | Context | Input $/1M | Output $/1M | Open Weights |
+| ----------------------------- | ---------- | ------- | ---------- | ----------- | ------------ |
+| openai--gpt-oss-120b          | novitaai   | 128K    | $0.05      | $0.25       |              |
+| Qwen--Qwen3.6-35B-A3B         | neuralwatt | 0       | $0.05      | $0.1        |              |
+| Nemotron-3-Nano-Omni          | nebius     | 125K    | $0.06      | $0.24       | ✅           |
+| seed-1.6-flash                | bytedance  | 256K    | $0.07      | $0.3        |              |
+| gemma-4-26b-a4b-it            | cloudflare | 256K    | $0.1       | $0.3        | ✅           |
+| Gemma-3-27b-it                | nebius     | 93K     | $0.1       | $0.3        | ✅           |
+| seed-2.0-mini                 | bytedance  | 256K    | $0.1       | $0.4        |              |
+| google--gemma-4-26b-a4b-it    | novitaai   | 256K    | $0.13      | $0.4        |              |
+| google--gemma-4-31B-turbo-TEE | chutes     | 128K    | $0.13      | $0.38       |              |
+| baidu--ernie-4.5-vl-28b-a3b   | novitaai   | 29K     | $0.14      | $0.56       |              |
+| google--gemma-4-31b-it        | novitaai   | 256K    | $0.14      | $0.4        |              |
+| amazon-nova-2.0-lite          | amazon     | 62K     | $0.15      | $1.25       |              |
+| gemini-2.5-flash              | google     | 1024K   | $0.15      | $3.5        |              |
+| amazon-nova-2.0-omni          | amazon     | 62K     | $0.2       | $1.3        |              |
+| xai-grok-4.1                  | xai        | 128K    | $0.2       | $0.5        |              |
+
+> 完整列表：50+ 提供商共 617 个具备工具调用+推理+视觉的模型。详见 [智能体模型](agentic-models.md)。
+
+## 最便宜的工具调用模型
+
+最具性价比的函数/工具调用模型（仅直连提供商）：
+
+| Model                                       | Provider       | Context | Input $/1M | Output $/1M |
+| ------------------------------------------- | -------------- | ------- | ---------- | ----------- |
+| ling-2.6-flash                              | inclusionai    | 256K    | $0.01      | $0.03       |
+| bdc-coder                                   | inferencenet   | 128K    | $0.01      | $0.01       |
+| klusterai--Meta-Llama-3.1-8B-Instruct-Turbo | klusterai      | 127K    | $0.015     | $0.02       |
+| granite-4.0-h-micro                         | cloudflare     | 128K    | $0.017     | $0.112      |
+| schematron-v3                               | inferencenet   | 128K    | $0.02      | $0.05       |
+| schematron-3b                               | inferencenet   | 128K    | $0.02      | $0.05       |
+| llama-3.1-8b-instruct--fp-16                | inferencenet   | 128K    | $0.02      | $0.03       |
+| liquid-ai--LFM2-24B-A2B                     | togetherai     | 128K    | $0.03      | $0.12       |
+| qwen--qwen3-4b-fp8                          | novitaai       | 125K    | $0.03      | $0.03       |
+| schematron-v2-turbo                         | inferencenet   | 128K    | $0.03      | $0.15       |
+| gpt-oss-20b                                 | inferencenet   | 128K    | $0.03      | $0.15       |
+| openai--gpt-oss-20b                         | neuralwatt     | 0       | $0.03      | $0.16       |
+| amazon-nova-micro                           | amazon         | 125K    | $0.035     | $0.14       |
+| amazon-nova-micro                           | amazon-bedrock | 125K    | $0.035     | $0.14       |
+| mistral-nemo-12b-instruct--fp-8             | inferencenet   | 128K    | $0.0375    | $0.1        |
+
+> 完整列表：67 个提供商共 2,350 个工具调用模型。详见 [工具调用模型](tool-calling.md)。
+
+## GPT-4 免费替代方案
+
+零成本的工具调用模型（仅直连提供商）：
+
+| Model                             | Provider | Context | Capabilities                 |
+| --------------------------------- | -------- | ------- | ---------------------------- |
+| glm-4.7-flash                     | zhipuai  | 195K    | Tool Call                    |
+| glm-4.1v-thinking-flash           | zhipuai  | 62K     | Reasoning, Vision, Tool Call |
+| glm-4-flash-250414                | zhipuai  | 125K    | Tool Call                    |
+| glm-4v-flash                      | zhipuai  | 15K     | Vision, Tool Call            |
+| autoglm-phone                     | zhipuai  | 19K     | Vision, Tool Call            |
+| glm-ocr                           | zhipuai  | 0       | Vision, Tool Call            |
+| glm-4.6v-flash                    | zhipuai  | 125K    | Vision, Tool Call            |
+| cobuddy                           | baidu    | 128K    | Tool Call                    |
+| qwen--qwen3-omni-30b-a3b-instruct | novitaai | 64K     | Vision, Tool Call            |
+| qwen--qwen3-omni-30b-a3b-thinking | novitaai | 64K     | Reasoning, Vision, Tool Call |
+| baidu--ernie-4.5-0.3b             | aimlapi  | 117K    | Tool Call                    |
+| qwen--qwen3.5-4b-free             | mixlayer | 128K    | Reasoning, Tool Call         |
+| llama-4-scout-17b-16e-instruct    | cerebras | 128K    | Tool Call                    |
+| qwen-2.5-32b                      | cerebras | 128K    | Tool Call                    |
+| llama-3.3-70b                     | cerebras | 128K    | Tool Call                    |
+
+> 完整列表：81 个免费模型。详见 [免费 AI 模型](free-models.md)。
+
+## 最大上下文窗口的工具调用模型
+
+| Model                                              | Provider    | Context | Input $/1M | Output $/1M |
+| -------------------------------------------------- | ----------- | ------- | ---------- | ----------- |
+| meta-llama-4-scout                                 | meta        | 9765K   | $0.17      | $0.66       |
+| xai--grok-4-fast-reasoning                         | aimlapi     | 1953K   | $0.52      | $1.3        |
+| xai--grok-4-fast-non-reasoning                     | aimlapi     | 1953K   | $0.52      | $1.3        |
+| meta-llama--Llama-4-Maverick-17B-128E-Instruct-FP8 | gmicloud    | 1024K   | $0.25      | $0.8        |
+| minimax-m2-5                                       | baseten     | 1024K   | $0.3       | $1.2        |
+| deepseek-v4-flash                                  | baidu       | 1024K   | $0.126     | $0.252      |
+| deepseek-v4-pro                                    | siliconflow | 1024K   | $1.74      | $3.48       |
+| deepseek-v4-flash                                  | siliconflow | 1024K   | $0.14      | $0.28       |
+| deepseek--deepseek-v4-pro                          | novitaai    | 1024K   | $1.67      | $3.38       |
+| xiaomimimo--mimo-v2.5-pro                          | novitaai    | 1024K   | $2         | $6          |
+| deepseek--deepseek-v4-flash                        | novitaai    | 1024K   | $0.14      | $0.28       |
+| gemini-2.0-flash-lite                              | google      | 1024K   | $0.075     | $0.3        |
+| gemini-2.5-flash                                   | google      | 1024K   | $0.15      | $3.5        |
+| gemini-2.5-pro                                     | google      | 1024K   | $1.25      | $10         |
+| gemini-2.0-flash                                   | google      | 1024K   | $0.1       | $0.4        |
+
+> 完整列表：2,195 个 128K+ 上下文模型。详见 [大上下文模型](large-context-models.md)。
+
+## OpenAI 兼容提供商
+
+70 个提供商提供 OpenAI 兼容 API 端点 — 最少代码修改即可切换：
+
+| Provider        | API Endpoint                                 | Model Count | Free Tier |
+| --------------- | -------------------------------------------- | ----------- | --------- |
+| Regolo          | `https://api.regolo.ai/v1`                   | 1           | —         |
+| MegaNova        | `https://api.meganova.ai/v1`                 | 1           | —         |
+| GMI Cloud       | `https://api.gmi-serving.com/v1`             | 1           | —         |
+| Cohere          | `https://api.cohere.com`                     | 1           | —         |
+| Requesty        | `https://router.requesty.ai/v1`              | 1           | —         |
+| 接口 AI         | `https://api.jiekou.ai/v1`                   | 1           | —         |
+| Zhipu AI (智谱) | `https://open.bigmodel.cn/api/paas/v4`       | 1           | —         |
+| SambaNova       | `https://api.sambanova.ai/v1`                | 1           | —         |
+| Baseten         | `https://model-api.baseten.co/v1`            | 1           | —         |
+| Wafer           | `https://pass.wafer.ai/v1`                   | 1           | —         |
+| Arcee AI        | `https://api.arcee.ai/v1`                    | 1           | —         |
+| Moonshot AI     | `https://api.moonshot.cn/v1`                 | 1           | —         |
+| Amazon Nova     | `https://bedrock.us-east-1.amazonaws.com/v1` | 1           | —         |
+| Baidu           | `https://qianfan.baidubce.com/v1`            | 1           | —         |
+| Together AI     | `https://api.together.xyz/v1`                | 1           | —         |
+| OpenRouter      | `https://openrouter.ai/api/v1`               | 1           | —         |
+| FastRouter      | `https://api.fastrouter.ai/v1`               | 1           | —         |
+| SubModel        | `https://api.submodel.ai/v1`                 | 1           | —         |
+| Inception Labs  | `https://api.inceptionlabs.ai/v1`            | 1           | —         |
+| SiliconFlow     | `https://api.siliconflow.cn/v1`              | 1           | —         |
+
+> 详见 [迁移指南](migration-guide.md) 了解从 OpenAI 切换的步骤。
+
+## 选择你的替代方案
+
+| 需求               | 最佳选择                           | 详见                                  |
+| ------------------ | ---------------------------------- | ------------------------------------- |
+| 最便宜的工具调用   | DeepSeek, Qwen3                    | [定价对比](pricing-comparison.md)     |
+| GPT-4 级别推理     | Claude Opus 4, Gemini 2.5 Pro      | [推理模型](reasoning-models.md)       |
+| 免费原型开发       | Google Gemini, Cloudflare          | [Free Models](free-models.md)         |
+| 最大上下文         | Gemini 2.5 Pro (1M), Llama 4 (10M) | [Context Windows](context-windows.md) |
+| 开源权重自部署     | Llama 4, Qwen3                     | [Open-Weight Models](open-weights.md) |
+| 轻松从 OpenAI 迁移 | Any OpenAI-compatible provider     | [迁移指南](migration-guide.md)        |
+| 运行 AI 智能体     | Models with tool_call + reasoning  | [智能体模型](agentic-models.md)       |
+
+## 相关文档
+
+- [工具调用模型](tool-calling.md) — 2,350 models with function calling
+- [推理模型](reasoning-models.md) — 1,306 models with chain-of-thought
+- [视觉模型](vision-models.md) — 1,487 models with image understanding
+- [免费 AI 模型](free-models.md) — 81 models at zero cost
+- [定价对比](pricing-comparison.md) — side-by-side pricing across providers
+- [迁移指南](migration-guide.md) — switch providers with minimal code changes
+- [提供商对比](provider-comparison.md) — top 30 providers by model count
+- [智能体模型](agentic-models.md) — 1,080 models for AI agents
+- [代码模型](code-models.md) — 189 个代码模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/pricing-comparison.md b/docs/zh/pricing-comparison.md
new file mode 100644
index 00000000..0441442c
--- /dev/null
+++ b/docs/zh/pricing-comparison.md
@@ -0,0 +1,134 @@
+[English](../pricing-comparison.md) | **中文**
+
+# 定价对比
+
+各提供商和平台的 AI 模型推理定价并排对比。所有价格以美元每百万 token 计，来自第一方 API。
+
+## 直接提供商定价
+
+模型生产商自有 API 的定价。
+
+### OpenAI
+
+| 模型         | 输入 $/百万token | 输出 $/百万token | 缓存读取 $/百万token | 上下文 |
+| ------------ | ---------------: | ---------------: | -------------------: | -----: |
+| GPT-4.1 Nano |             0.10 |             0.40 |                0.025 |     1M |
+| GPT-4o Mini  |             0.15 |             0.60 |                0.075 |   128K |
+| GPT-4.1 Mini |             0.40 |             1.60 |                 0.10 |     1M |
+| GPT-4.1      |             2.00 |             8.00 |                 0.50 |     1M |
+| GPT-4o       |             2.50 |            10.00 |                 1.25 |   128K |
+| o4-mini      |             1.10 |             4.40 |                0.275 |   200K |
+| o3           |            10.00 |            40.00 |                 2.50 |   200K |
+
+### Anthropic
+
+| 模型              | 输入 $/百万token | 输出 $/百万token | 上下文 |
+| ----------------- | ---------------: | ---------------: | -----: |
+| Claude Haiku 4.5  |             1.00 |             5.00 |   200K |
+| Claude Sonnet 4.0 |             3.00 |            15.00 |     1M |
+| Claude Sonnet 4.5 |             3.00 |            15.00 |     1M |
+| Claude Sonnet 4.6 |             3.00 |            15.00 |     1M |
+| Claude Opus 4.5   |             5.00 |            25.00 |   200K |
+| Claude Opus 4.7   |             5.00 |            25.00 |     1M |
+
+### Google
+
+| 模型                  | 输入 $/百万token | 输出 $/百万token | 缓存读取 $/百万token | 上下文 |
+| --------------------- | ---------------: | ---------------: | -------------------: | -----: |
+| Gemini 1.5 Flash 8B   |            0.075 |             0.30 |                    — |     1M |
+| Gemini 2.0 Flash Lite |            0.075 |             0.30 |                    — |     1M |
+| Gemini 2.0 Flash      |             0.10 |             0.40 |                    — |     1M |
+| Gemini 2.5 Flash Lite |             0.10 |             0.40 |                    — |     1M |
+| Gemini 2.5 Flash      |             0.15 |             3.50 |               0.0375 |     1M |
+| Gemini 2.5 Pro        |             1.25 |            10.00 |                0.315 |     1M |
+
+### DeepSeek
+
+| 模型              | 输入 $/百万token | 输出 $/百万token | 缓存读取 $/百万token | 上下文 |
+| ----------------- | ---------------: | ---------------: | -------------------: | -----: |
+| DeepSeek-V4-Flash |             0.14 |             0.28 |               0.0028 |     1M |
+| DeepSeek-V4-Pro   |            0.435 |             0.87 |             0.003625 |     1M |
+
+### xAI
+
+| 模型        | 输入 $/百万token | 输出 $/百万token | 上下文 |
+| ----------- | ---------------: | ---------------: | -----: |
+| Grok 4 Fast |             0.20 |             0.50 |   131K |
+| Grok 4.1    |             0.20 |             0.50 |   131K |
+| Grok 3 Mini |             0.25 |             1.27 |   131K |
+| Grok 4.2    |             2.00 |             6.00 |   131K |
+| Grok 3      |             3.00 |            15.00 |   131K |
+| Grok 4      |             3.00 |            15.00 |   131K |
+
+### Meta（托管推理）
+
+| 模型             | 输入 $/百万token | 输出 $/百万token | 上下文 |
+| ---------------- | ---------------: | ---------------: | -----: |
+| Llama 3.2 1B     |             0.10 |             0.10 |   128K |
+| Llama 4 Scout    |             0.17 |             0.66 |    10M |
+| Llama 4 Maverick |             0.24 |             0.97 |     1M |
+
+### Mistral
+
+| 模型          | 输入 $/百万token | 输出 $/百万token | 上下文 |
+| ------------- | ---------------: | ---------------: | -----: |
+| Ministral 3B  |             0.04 |             0.04 |   128K |
+| Ministral 8B  |             0.10 |             0.10 |   128K |
+| Mistral Small |             0.20 |             0.60 |   128K |
+| Mistral Large |             2.00 |             6.00 |   128K |
+
+## 跨平台价格对比
+
+同一模型在不同推理平台上的价格 — 差异可能很大。
+
+### Llama 4 Scout（10M 上下文）
+
+| 平台         | 输入 $/百万token | 输出 $/百万token |
+| ------------ | ---------------: | ---------------: |
+| AIHubMix     |            0.061 |            0.183 |
+| Auriko       |             0.08 |             0.30 |
+| DeepInfra    |             0.08 |             0.30 |
+| Kluster AI   |             0.08 |             0.45 |
+| Meta（直连） |             0.17 |             0.66 |
+
+### Llama 4 Maverick（1M 上下文）
+
+| 平台            | 输入 $/百万token | 输出 $/百万token |
+| --------------- | ---------------: | ---------------: |
+| AIHubMix        |             0.10 |             0.10 |
+| 接口 AI         |             0.10 |             0.50 |
+| AIHubMix (Groq) |             0.11 |             0.33 |
+| Cortecs         |            0.124 |            0.603 |
+| Auriko          |             0.15 |             0.60 |
+| Meta（直连）    |             0.24 |             0.97 |
+
+## 最便宜的模型
+
+所有提供商中按 token 计费最便宜的模型。
+
+| 模型                | 提供商   | 输入 $/百万token | 输出 $/百万token | 上下文 |
+| ------------------- | -------- | ---------------: | ---------------: | -----: |
+| Ministral 3B        | Mistral  |             0.04 |             0.04 |   128K |
+| Voxtral Mini        | Mistral  |             0.04 |             0.04 |   128K |
+| Ministral 8B        | Mistral  |             0.10 |             0.10 |   128K |
+| Llama 3.2 1B        | Meta     |             0.10 |             0.10 |   128K |
+| GPT-4.1 Nano        | OpenAI   |             0.10 |             0.40 |     1M |
+| Gemini 1.5 Flash 8B | Google   |            0.075 |             0.30 |     1M |
+| DeepSeek-V4-Flash   | DeepSeek |             0.14 |             0.28 |     1M |
+
+---
+
+**注意**：所有定价来自第一方来源，以数据采集日期为准。推理平台价格可能不同。查看 `providers/<id>/models/` 获取最新数据。人民币和欧元定价见提供商 YAML 文件。
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型
+- [上下文窗口对比](context-windows.md) — 最大上下文窗口
+- [提供商概览](providers.md) — 95 个提供商
+- [OpenAI 替代方案](openai-alternatives.md) — 最便宜的 GPT-4 替代
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/provider-comparison.md b/docs/zh/provider-comparison.md
new file mode 100644
index 00000000..f022cf11
--- /dev/null
+++ b/docs/zh/provider-comparison.md
@@ -0,0 +1,127 @@
+# 提供商对比
+
+[English](../provider-comparison.md)
+
+AI 模型提供商的并排对比 — 模型数量、能力、定价和上下文窗口一目了然。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 按模型数量排名的前 30 个提供商
+
+| 提供商         | 模型 | 免费 | 工具调用 | 推理 | 视觉 | 最低 $/M | 能力        |
+| -------------- | ---: | ---: | -------: | ---: | ---: | -------: | ----------- |
+| nanogpt        |  547 |    0 |        0 |    0 |    0 |    $0.02 |             |
+| aihubmix       |  476 |    0 |      132 |   74 |  145 |    $0.00 | 🔧 🧠 👁️ 🎤 |
+| openrouter     |  356 |   29 |      263 |  190 |  160 |    $0.01 | 🔧 🧠 👁️ 🎤 |
+| martian        |  304 |    0 |        0 |    3 |    2 |    $0.02 | 🧠 👁️       |
+| requesty       |  277 |    0 |      251 |  139 |  151 |    $0.02 | 🔧 🧠 👁️    |
+| 302ai          |  268 |    0 |      190 |   44 |  144 |    $0.00 | 🔧 🧠 👁️ 🔓 |
+| auriko         |  181 |    5 |      154 |  108 |   93 |    $0.01 | 🔧 🧠 👁️ 🖼️ |
+| llmgateway     |  163 |    3 |      158 |   85 |   89 |    $0.03 | 🔧 🧠 👁️ 🖼️ |
+| aimlapi        |  147 |    2 |       21 |    0 |   14 |    $0.01 | 🔧 👁️       |
+| fastrouter     |  120 |    2 |       94 |   66 |   65 |    $0.02 | 🔧 🧠 👁️ 🎤 |
+| orcarouter     |  120 |    0 |      102 |   64 |  111 |    $0.05 | 🔧 🧠 👁️ 🔓 |
+| cortecs        |  105 |    0 |       97 |   82 |   52 |    $0.02 | 🔧 🧠 👁️ 🎤 |
+| novitaai       |  104 |    2 |       72 |   53 |   33 |    $0.02 | 🔧 🧠 👁️ 🎤 |
+| vultr          |   98 |    0 |       11 |   22 |   23 |    $0.55 | 🔧 🧠 👁️ 🎤 |
+| deepinfra      |   88 |    0 |        0 |   51 |   38 |    $0.01 | 🧠 👁️       |
+| venice         |   75 |    0 |       64 |   55 |   39 |    $0.05 | 🔧 🧠 👁️    |
+| jiekou         |   73 |    0 |       73 |    0 |   49 |    $0.03 | 🔧 👁️ 🔓    |
+| meganova       |   63 |    4 |       60 |    7 |   37 |    $0.02 | 🔧 🧠 👁️ 🔓 |
+| alibaba        |   62 |    0 |       62 |   52 |    0 |    $0.15 | 🔧 🧠       |
+| ppio           |   60 |    1 |       46 |   12 |   11 |    $0.21 | 🔧 🧠 👁️ 🔓 |
+| amazon-bedrock |   57 |    0 |       37 |    0 |   16 |    $0.04 | 🔧 👁️ 🎤 🎬 |
+| google-vertex  |   38 |    0 |       32 |    0 |   19 |    $0.07 | 🔧 👁️ 🎤 🎬 |
+| siliconflow-cn |   37 |    0 |        2 |    7 |    9 |    $0.50 | 🔧 🧠 👁️    |
+| stepfun        |   31 |   14 |        0 |    0 |   11 |    $0.70 | 👁️ 🎤 🖼️    |
+| cloudflare     |   30 |    0 |       15 |   10 |    7 |    $0.02 | 🔧 🧠 👁️ 🔓 |
+| gmicloud       |   29 |    0 |       11 |   10 |    0 |    $0.07 | 🔧 🧠 🔓    |
+| databricks     |   29 |    0 |        4 |    0 |   10 |    $0.05 | 🔧 👁️ 🔓    |
+| openai         |   28 |    5 |       18 |    8 |   12 |    $0.02 | 🔧 🧠 👁️ 🎤 |
+| siliconflow    |   27 |    0 |       24 |    2 |    3 |    $0.04 | 🔧 🧠 👁️ 🔓 |
+| togetherai     |   24 |    0 |       22 |    2 |    0 |    $0.03 | 🔧 🧠 🔓    |
+
+## 提供商分类
+
+### 聚合器（多提供商访问）
+
+这些提供商通过单一 API 提供多家 AI 公司的模型：
+
+| 提供商     | 模型 | 备注                              |
+| ---------- | ---: | --------------------------------- |
+| openrouter |  356 | 最大的模型聚合器，OpenAI 兼容 API |
+| requesty   |  277 | 智能路由                          |
+| martian    |  304 | 多提供商负载均衡                  |
+| aihubmix   |  476 | 中国市场聚合器                    |
+| nanogpt    |  547 | 按量付费，无需订阅                |
+| llmgateway |  163 | 企业 API 网关                     |
+| fastrouter |  120 | 快速模型路由                      |
+| orcarouter |  120 | 多提供商路由                      |
+
+### 直供提供商（第一方 API）
+
+| 提供商    | 模型 | 专长                        |
+| --------- | ---: | --------------------------- |
+| openai    |   28 | GPT-4.1, o3/o4 推理模型     |
+| anthropic |   11 | Claude 4 系列，最适合 Agent |
+| google    |   21 | Gemini 2.5, 1M+ 上下文      |
+| deepseek  |    4 | DeepSeek R1，最佳开源推理   |
+| meta      |   12 | Llama 4，开源权重           |
+| mistral   |   16 | Mistral Large, Codestral    |
+| xai       |    6 | Grok 3，实时数据            |
+| alibaba   |   62 | Qwen 3，最大的开源家族      |
+
+### 基础设施提供商（托管开源模型）
+
+| 提供商     | 模型 | 专长                  |
+| ---------- | ---: | --------------------- |
+| groq       |   12 | 最快推理 (LPU)        |
+| cerebras   |   11 | 超快推理 (CS-3)       |
+| togetherai |   24 | 无服务器开源托管      |
+| deepinfra  |   88 | 高性价比推理          |
+| fireworks  |   10 | 无服务器模型托管      |
+| cloudflare |   30 | 边缘推理 (Workers AI) |
+
+### 区域提供商
+
+| 提供商              | 模型 | 区域         |
+| ------------------- | ---: | ------------ |
+| siliconflow         |   27 | 中国         |
+| siliconflow-cn      |   37 | 中国（国内） |
+| stepfun             |   31 | 中国         |
+| zhipuai             |   20 | 中国         |
+| baichuan            |   11 | 中国         |
+| baidu               |    8 | 中国         |
+| iflytek             |    6 | 中国         |
+| tencent             |   14 | 中国         |
+| ppio                |   60 | 中国         |
+| ovhcloud            |   12 | 欧洲（法国） |
+| scaleway            |   13 | 欧洲（法国） |
+| cloudferro-sherlock |   12 | 欧洲（欧盟） |
+
+## 选择提供商
+
+| 如果您需要...    | 最佳提供商                     | 原因                   |
+| ---------------- | ------------------------------ | ---------------------- |
+| **最低价格**     | deepseek, google               | 输入低至 $0.14/M token |
+| **最快推理**     | groq, cerebras                 | 亚 100ms 延迟          |
+| **最大上下文**   | google, meta                   | 1M-10M token 上下文    |
+| **最多模型**     | nanogpt, aihubmix              | 各 500+ 模型           |
+| **最适合 Agent** | anthropic, openai              | 工具调用 + 推理        |
+| **开源权重**     | meta, deepseek                 | 在自有硬件上运行       |
+| **欧盟数据驻留** | ovhcloud, scaleway, cloudferro | 欧盟托管推理           |
+| **中国访问**     | siliconflow, ppio, stepfun     | 中国节点               |
+
+## 相关文档
+
+- [迁移指南](migration-guide.md) — 切换提供商的定价对比
+- [定价对比](pricing-comparison.md) — 跨提供商定价对比
+- [提供商概览](providers.md) — 全部 95 个提供商列表
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [聊天模型](chat-models.md) — 2,350 个支持工具调用的聊天模型
+- [智能体模型](agentic-models.md) — 1,080 个具备工具调用 + 推理能力的模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/providers.md b/docs/zh/providers.md
new file mode 100644
index 00000000..5177170f
--- /dev/null
+++ b/docs/zh/providers.md
@@ -0,0 +1,172 @@
+[English](../providers.md) | **中文**
+
+# 提供商概览
+
+本目录中所有 95 个 AI 模型提供商的综合概览，按类型分类。
+
+## 模型生产商
+
+开发和生产自有 AI 模型的提供商。它们的 API 和文档是模型数据的权威来源。
+
+| 提供商                | ID            | 模型数 | 代表模型                           | API 格式  |
+| --------------------- | ------------- | -----: | ---------------------------------- | --------- |
+| 01.AI (零一万物)      | `01ai`        |      5 | Yi-Lightning, Yi-Vision            | OpenAI    |
+| AI21 Labs             | `ai21`        |      2 | Jamba 1.5                          | OpenAI    |
+| 阿里云百炼            | `alibaba`     |     62 | Qwen 3, Qwen 2.5                   | OpenAI    |
+| Amazon Nova           | `amazon`      |      7 | Nova Pro, Nova Lite                | OpenAI    |
+| Anthropic             | `anthropic`   |     11 | Claude Opus 4.7, Claude Sonnet 4.6 | Anthropic |
+| 字节跳动              | `bytedance`   |      5 | 豆包-Pro, 豆包-Lite                | OpenAI    |
+| Cloudflare Workers AI | `cloudflare`  |     30 | Llama 3.3, Mistral                 | OpenAI    |
+| Cohere                | `cohere`      |      — | Command R+, Embed 3                | OpenAI    |
+| DeepSeek              | `deepseek`    |      4 | DeepSeek-V4-Pro, DeepSeek-R1       | OpenAI    |
+| Google                | `google`      |     21 | Gemini 3.5 Flash, Gemini 3.1 Pro   | Google    |
+| IBM Granite           | `ibm`         |      — | Granite 3.3                        | OpenAI    |
+| 讯飞星火              | `iflytek`     |      6 | SparkDesk 4.0 Ultra                | OpenAI    |
+| Inception Labs        | `inception`   |      5 | Mercury Coder                      | OpenAI    |
+| InclusionAI           | `inclusionai` |      3 | Book3R                             | OpenAI    |
+| Meta Llama            | `meta`        |     12 | Llama 4 Maverick, Llama 4 Scout    | OpenAI    |
+| Microsoft Phi         | `microsoft`   |     12 | Phi-4, Phi-4-Mini                  | OpenAI    |
+| MiniMax               | `minimax`     |     21 | MiniMax-Text-01, MiniMax-M1        | OpenAI    |
+| Mistral AI            | `mistral`     |     16 | Mistral Large, Codestral           | OpenAI    |
+| Moonshot AI           | `moonshotai`  |     16 | Kimi K2.6, Kimi K2.5               | OpenAI    |
+| NVIDIA                | `nvidia`      |      — | Nemotron Ultra                     | OpenAI    |
+| OpenAI                | `openai`      |     28 | GPT-5.5, GPT-5.4, o3               | OpenAI    |
+| Perplexity            | `perplexity`  |      4 | Sonar, Sonar Pro                   | OpenAI    |
+| Reka AI               | `reka`        |      2 | Reka Core, Reka Flash              | OpenAI    |
+| Sarvam AI             | `sarvam`      |      — | Sarvam-M                           | OpenAI    |
+| 阶跃星辰              | `stepfun`     |     31 | Step-2, Step-1.5V                  | OpenAI    |
+| 腾讯混元              | `tencent`     |     14 | 混元-Turbos                        | OpenAI    |
+| Upstage               | `upstage`     |      8 | Solar Pro, Solar Mini              | OpenAI    |
+| Voyage AI             | `voyage`      |     21 | Voyage 3, Voyage Code 3            | OpenAI    |
+| Writer                | `writer`      |      6 | Palmyra X5                         | OpenAI    |
+| xAI Grok              | `xai`         |      6 | Grok 3, Grok 3 Mini                | OpenAI    |
+| 小米                  | `xiaomi`      |      5 | MiMo                               | OpenAI    |
+| 智谱 AI               | `zhipuai`     |     20 | GLM-4, GLM-Z1                      | OpenAI    |
+
+## 推理平台
+
+托管和提供他人生产的模型的提供商。它们提供自己的按 token 计费和 API 访问。
+
+| 提供商                | ID                    | 模型数 | 计费币种 | API 格式 |
+| --------------------- | --------------------- | -----: | -------- | -------- |
+| 302.AI                | `302ai`               |    268 | CNY      | OpenAI   |
+| AIHubMix              | `aihubmix`            |    476 | CNY      | OpenAI   |
+| AI/ML API             | `aimlapi`             |    147 | USD      | OpenAI   |
+| Aion Labs             | `aion`                |      5 | USD      | OpenAI   |
+| Arcee AI              | `arcee`               |      7 | USD      | OpenAI   |
+| Auriko                | `auriko`              |    181 | USD      | OpenAI   |
+| Baseten               | `baseten`             |      9 | USD      | OpenAI   |
+| Berget                | `berget`              |      7 | EUR      | OpenAI   |
+| Cerebras              | `cerebras`            |     11 | USD      | OpenAI   |
+| Chutes                | `chutes`              |     12 | USD      | OpenAI   |
+| Clarifai              | `clarifai`            |     12 | USD      | OpenAI   |
+| CloudFerro Sherlock   | `cloudferro-sherlock` |     12 | EUR      | OpenAI   |
+| Cortecs               | `cortecs`             |    105 | USD      | OpenAI   |
+| Databricks            | `databricks`          |     29 | USD      | OpenAI   |
+| DeepInfra             | `deepinfra`           |     88 | USD      | OpenAI   |
+| DigitalOcean          | `digitalocean`        |     20 | USD      | OpenAI   |
+| DInference            | `dinference`          |      6 | CNY      | OpenAI   |
+| evroc                 | `evroc`               |      8 | EUR      | OpenAI   |
+| FastRouter            | `fastrouter`          |    120 | USD      | OpenAI   |
+| Fireworks AI          | `fireworks`           |     10 | USD      | OpenAI   |
+| FriendliAI            | `friendli`            |      8 | USD      | OpenAI   |
+| GMI Cloud             | `gmicloud`            |     29 | USD      | OpenAI   |
+| Google Vertex AI      | `google-vertex`       |     38 | USD      | Google   |
+| Groq                  | `groq`                |     12 | USD      | OpenAI   |
+| HPC-AI Cloud          | `hpc-ai`              |     11 | CNY      | OpenAI   |
+| Hyperbolic            | `hyperbolic`          |     11 | USD      | OpenAI   |
+| Inference.net         | `inferencenet`        |     20 | USD      | OpenAI   |
+| 接口 AI               | `jiekou`              |     73 | CNY      | OpenAI   |
+| Kluster AI            | `klusterai`           |     12 | USD      | OpenAI   |
+| LLM Gateway           | `llmgateway`          |    163 | USD      | OpenAI   |
+| Martian               | `martian`             |    304 | USD      | OpenAI   |
+| MegaNova              | `meganova`            |     63 | USD      | OpenAI   |
+| Mixlayer              | `mixlayer`            |      5 | USD      | OpenAI   |
+| MoArk AI              | `moark`               |      — | USD      | OpenAI   |
+| Morph                 | `morph`               |      7 | USD      | OpenAI   |
+| NanoGPT               | `nanogpt`             |    547 | USD      | OpenAI   |
+| Nebius                | `nebius`              |     23 | USD      | OpenAI   |
+| NeuralWatt            | `neuralwatt`          |     14 | USD      | OpenAI   |
+| Nous Research         | `nousresearch`        |      7 | USD      | OpenAI   |
+| Novita AI             | `novitaai`            |    104 | USD      | OpenAI   |
+| OrcaRouter            | `orcarouter`          |    120 | USD      | OpenAI   |
+| OVHcloud AI Endpoints | `ovhcloud`            |     12 | EUR      | OpenAI   |
+| PPIO                  | `ppio`                |     60 | CNY      | OpenAI   |
+| Privatemode AI        | `privatemode`         |      5 | EUR      | OpenAI   |
+| 七牛 AI               | `qiniu-ai`            |      — | CNY      | OpenAI   |
+| Regolo                | `regolo`              |      — | EUR      | OpenAI   |
+| Requesty              | `requesty`            |    277 | USD      | OpenAI   |
+| SambaNova             | `sambanova`           |      7 | USD      | OpenAI   |
+| Scaleway              | `scaleway`            |     13 | EUR      | OpenAI   |
+| SiliconFlow           | `siliconflow`         |     27 | USD      | OpenAI   |
+| SiliconFlow CN        | `siliconflow-cn`      |     37 | CNY      | OpenAI   |
+| SubModel              | `submodel`            |      6 | USD      | OpenAI   |
+| 腾讯云 TokenHub       | `tencent-tokenhub`    |     19 | CNY      | OpenAI   |
+| TextSynth             | `textsynth`           |      6 | USD      | OpenAI   |
+| Together AI           | `togetherai`          |     24 | USD      | OpenAI   |
+| Venice AI             | `venice`              |     75 | USD      | OpenAI   |
+| Vultr Cloud Inference | `vultr`               |     98 | USD      | OpenAI   |
+| Wafer                 | `wafer`               |      2 | USD      | OpenAI   |
+
+## 云厂商托管服务
+
+提供 AI 模型托管服务的主要云厂商。
+
+| 提供商               | ID               | 模型数 | 云平台 |
+| -------------------- | ---------------- | -----: | ------ |
+| Amazon Bedrock       | `amazon-bedrock` |     57 | AWS    |
+| Azure OpenAI Service | `azure`          |      — | Azure  |
+| Google Vertex AI     | `google-vertex`  |     38 | GCP    |
+
+## 中国市场提供商
+
+主要服务中国市场、以人民币计费的提供商。
+
+| 提供商          | ID                 | 模型数 |
+| --------------- | ------------------ | -----: |
+| 302.AI          | `302ai`            |    268 |
+| AIHubMix        | `aihubmix`         |    476 |
+| 阿里云百炼      | `alibaba`          |     62 |
+| 百川智能        | `baichuan`         |     11 |
+| 百度            | `baidu`            |      8 |
+| 字节跳动        | `bytedance`        |      5 |
+| DInference      | `dinference`       |      6 |
+| HPC-AI Cloud    | `hpc-ai`           |     11 |
+| 讯飞星火        | `iflytek`          |      6 |
+| 接口 AI         | `jiekou`           |     73 |
+| MiniMax         | `minimax`          |     21 |
+| Moonshot AI     | `moonshotai`       |     16 |
+| PPIO            | `ppio`             |     60 |
+| 七牛 AI         | `qiniu-ai`         |      — |
+| SiliconFlow CN  | `siliconflow-cn`   |     37 |
+| 阶跃星辰        | `stepfun`          |     31 |
+| 腾讯云 TokenHub | `tencent-tokenhub` |     19 |
+| 腾讯混元        | `tencent`          |     14 |
+| 小米            | `xiaomi`           |      5 |
+| 智谱 AI         | `zhipuai`          |     20 |
+
+## 欧洲市场提供商
+
+以欧元计费、服务欧洲市场的提供商。
+
+| 提供商                | ID                    | 模型数 |
+| --------------------- | --------------------- | -----: |
+| Berget                | `berget`              |      7 |
+| CloudFerro Sherlock   | `cloudferro-sherlock` |     12 |
+| evroc                 | `evroc`               |      8 |
+| OVHcloud AI Endpoints | `ovhcloud`            |     12 |
+| Privatemode AI        | `privatemode`         |      5 |
+| Regolo                | `regolo`              |      — |
+| Scaleway              | `scaleway`            |     13 |
+
+## 相关文档
+
+- [模型对比](model-comparison.md) — 旗舰、高性价比、免费模型
+- [定价对比](pricing-comparison.md) — 定价并排对比
+- [开源权重模型](open-weights.md) — 527 个可自行运行的模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型
+- [数据模式](data-schema.md) — 完整 YAML 模式
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/quick-start.md b/docs/zh/quick-start.md
new file mode 100644
index 00000000..1ea62047
--- /dev/null
+++ b/docs/zh/quick-start.md
@@ -0,0 +1,142 @@
+[English](../quick-start.md) | **中文**
+
+# 快速入门指南
+
+30 秒内找到适合你需求的 AI 模型。
+
+## 我想找最便宜的模型
+
+→ 查看[定价对比](pricing-comparison.md)，了解各提供商最便宜的模型和跨平台价格对比。
+
+**支持工具调用的最便宜模型：**
+
+| 模型             | 提供商      | 输入（每百万 token） | 输出（每百万 token） |
+| ---------------- | ----------- | -------------------: | -------------------: |
+| DeepSeek-V3      | DeepSeek    |                $0.27 |                $1.10 |
+| Qwen3-235B-A22B  | 阿里云      |                $0.14 |                $0.42 |
+| Llama 4 Maverick | Together AI |                $0.20 |                $0.80 |
+
+## 我想找最强大的模型
+
+→ 查看[模型对比](model-comparison.md)，了解旗舰模型对比。
+
+**顶级旗舰模型：**
+
+| 模型           | 上下文 | 工具调用 | 视觉 | 输入 $/1M | 输出 $/1M |
+| -------------- | ------ | -------- | ---- | --------: | --------: |
+| GPT-4.1        | 1M     | ✅       | ✅   |     $2.00 |     $8.00 |
+| Claude Opus 4  | 200K   | ✅       | ✅   |    $15.00 |    $75.00 |
+| Gemini 2.5 Pro | 1M     | ✅       | ✅   |     $1.25 |    $10.00 |
+| DeepSeek-R1    | 128K   | ✅       | ❌   |     $0.55 |     $2.19 |
+
+## 我想找免费模型
+
+→ 查看[模型对比](model-comparison.md#免费模型)获取完整列表。
+
+**支持工具调用的免费模型：**
+
+- Google Gemini 2.0 Flash（通过 Google AI Studio）
+- Cloudflare Workers AI 模型（边缘推理）
+- Chutes、Cerebras、Groq 免费层上的各种模型
+
+## 我想找最大上下文窗口
+
+→ 查看[模型对比](model-comparison.md#最大上下文窗口)获取完整列表。
+
+| 模型            |  上下文窗口 |
+| --------------- | ----------: |
+| Llama 4 Scout   |  10M tokens |
+| Gemini 2.5 Pro  |   1M tokens |
+| GPT-4.1         |  ~1M tokens |
+| Claude Sonnet 4 | 200K tokens |
+
+## 我想浏览所有提供商
+
+→ 查看[提供商概览](providers.md)，95 个提供商按类型分类。
+
+## 我想编程使用数据
+
+### npm 包
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 个模型 JSON
+import type { Model } from "ai-models"; // TypeScript 类型
+```
+
+### 下载数据文件
+
+```bash
+# JSON — 完整元数据（2.3 MB）
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — 适合 Excel/Google Sheets 的表格（560 KB）
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+```
+
+### CDN 访问（无需安装）
+
+编译后的 JSON 可通过 [jsDelivr CDN](https://www.jsdelivr.com/package/npm/ai-models) 访问 — 无需下载或安装：
+
+```bash
+# 始终最新，支持 CORS，可在浏览器中使用
+curl -s https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+```
+
+```html
+<script type="module">
+  const catalog = await fetch(
+    "https://github.com/i-need-token/ai-models/releases/latest/download/models.json",
+  ).then((r) => r.json());
+  console.log(catalog.models.length);
+</script>
+```
+
+### 从源码
+
+```bash
+# 安装依赖
+npm install
+
+# 计算目录统计
+npx tsx scripts/stats.ts
+
+# 验证所有模型数据
+npx tsx scripts/validate.ts
+```
+
+```typescript
+import { ModelSchema } from "./types/schemas";
+import { parse } from "yaml";
+import { readFileSync } from "fs";
+
+// 加载并验证模型
+const raw = readFileSync("providers/openai/models/gpt-4.1.yaml", "utf-8");
+const model = ModelSchema.parse(parse(raw));
+
+console.log(model.pricing); // { input: 2, output: 8, cache_read: 0.5 }
+console.log(model.limit); // { context: 1047576, output: 32768 }
+```
+
+## 我想添加新的提供商
+
+→ 查看[贡献指南](../../CONTRIBUTING.md)和[数据采集指南](data-acquisition.md)。
+
+## 我想了解数据格式
+
+→ 查看[数据 Schema 参考](data-schema.md)，了解完整的 YAML Schema。
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [常见问题](faq.md) — 关于目录的常见问题
+- [API 与编程访问](api.md) — 下载和使用数据
+- [代码示例](code-examples.md) — TypeScript、Python、Go、Rust 实用示例
+- [术语表](glossary.md) — 关键术语和定义
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/reasoning-models.md b/docs/zh/reasoning-models.md
new file mode 100644
index 00000000..fd48dbcb
--- /dev/null
+++ b/docs/zh/reasoning-models.md
@@ -0,0 +1,104 @@
+[English](../reasoning-models.md) | **中文**
+
+# AI 推理模型
+
+本目录中有 1,306 个模型支持推理（链式思维 / 扩展思考）。本页重点介绍最有能力和最具性价比的推理模型。
+
+> 所有数据来自一手 API 和文档。"推理"表示模型可以在回答前生成扩展的链式思维。
+
+## 快速统计
+
+| 能力                 | 推理模型数 |
+| -------------------- | ---------: |
+| 总推理模型           |      1,306 |
+| 唯一模型 ID          |        868 |
+| 支持工具调用         |      1,076 |
+| 支持视觉（图像输入） |        697 |
+| 开源权重             |        119 |
+
+## 按上下文排序的顶级推理模型
+
+最大上下文的推理模型 — 适合复杂多步任务：
+
+| 模型                          | 上下文 | 工具调用 | 视觉 | 输入 $/1M | 提供商数 |
+| ----------------------------- | ------ | -------- | ---- | --------: | -------: |
+| Grok 4 Fast Reasoning         | 2M     | ✅       | ✅   |     $0.20 |        2 |
+| Grok 4.1 Fast Reasoning       | 2M     | ✅       | ✅   |     $0.20 |        2 |
+| Grok 4.20                     | 2M     | ✅       | ✅   |     $1.42 |        1 |
+| GPT-5.4                       | 1M     | ✅       | ✅   |     $2.50 |        4 |
+| GPT-5.5                       | 1M     | ✅       | ✅   |     $5.00 |        4 |
+| Gemini 2.5 Pro                | 1M     | ✅       | ✅   |     $1.25 |        4 |
+| Gemini 2.5 Flash              | 1M     | ✅       | ✅   |     $0.15 |        3 |
+| Gemini 2.5 Flash Lite         | 1M     | ✅       | ✅   |     $0.10 |        3 |
+| Gemini 3 Flash Preview        | 1M     | ✅       | ✅   |     $0.50 |        4 |
+| Gemini 3.1 Flash Lite Preview | 1M     | ✅       | ✅   |     $0.25 |        3 |
+| DeepSeek Reasoner             | 1M     | ✅       | ✅   |     $0.43 |        1 |
+
+## 最便宜的推理模型
+
+推理能力的最佳性价比：
+
+| 模型                  | 提供商    | 输入 $/1M | 输出 $/1M | 上下文 |
+| --------------------- | --------- | --------: | --------: | ------ |
+| Qwen 3.5 0.8B         | Auriko    |     $0.01 |     $0.05 | 262K   |
+| Qwen 3.5 0.8B         | DeepInfra |     $0.01 |     $0.05 | 262K   |
+| Qwen 3.5 2B           | Auriko    |     $0.02 |     $0.10 | 262K   |
+| Qwen 3.5 2B           | DeepInfra |     $0.02 |     $0.10 | 262K   |
+| GPT-5 Nano            | Requesty  |    $0.025 |     $0.20 | 400K   |
+| Qwen 3.5 4B           | Auriko    |     $0.03 |     $0.15 | 262K   |
+| Qwen 3.5 4B           | DeepInfra |     $0.03 |     $0.15 | 262K   |
+| Gemini 2.5 Flash Lite | Google    |     $0.10 |     $0.60 | 1M     |
+| Gemini 2.5 Flash      | Google    |     $0.15 |     $0.60 | 1M     |
+| Grok 4 Fast Reasoning | xAI       |     $0.20 |     $0.50 | 2M     |
+
+## 最佳推理 + 视觉模型
+
+能对图像进行推理的模型 — 适合视觉分析：
+
+| 模型                  | 上下文 | 输入 $/1M | 提供商数 |
+| --------------------- | ------ | --------: | -------: |
+| Grok 4 Fast Reasoning | 2M     |     $0.20 |        2 |
+| Gemini 2.5 Flash      | 1M     |     $0.15 |        3 |
+| Gemini 2.5 Pro        | 1M     |     $1.25 |        4 |
+| GPT-5.4               | 1M     |     $2.50 |        4 |
+| DeepSeek Reasoner     | 1M     |     $0.43 |        1 |
+| MiMo V2.5（开源权重） | 1M     |    varies |        2 |
+
+## 开源权重推理模型
+
+119 个开源权重模型支持推理 — 可在自己的硬件上运行：
+
+| 模型                    | 上下文 | 工具调用 | 视觉 | 提供商数 |
+| ----------------------- | ------ | -------- | ---- | -------: |
+| MiMo V2.5 Pro           | 1M     | ✅       | ❌   |        2 |
+| MiMo V2.5               | 1M     | ✅       | ✅   |        2 |
+| DeepSeek-V4 Pro         | 1M     | ✅       | ❌   |        1 |
+| Qwen3 Next 80B Thinking | 262K   | ✅       | ❌   |        4 |
+| Kimi K2.6               | 262K   | ✅       | ✅   |        4 |
+| Trinity Large Thinking  | 262K   | ✅       | ❌   |        1 |
+| Nemotron 3 120B         | 262K   | ✅       | ❌   |        1 |
+| Qwen3.5 397B A17B       | 262K   | ✅       | ❌   |        2 |
+
+## 要点总结
+
+- **1,306 个推理模型**，涵盖 868 个唯一模型 ID — 最大的推理模型目录
+- **Grok 4 Fast Reasoning** 以 2M 上下文和 $0.20/1M 输入价格提供最佳性价比
+- **Gemini 2.5 Flash Lite** 是最便宜的 1M 上下文推理模型（$0.10/1M）
+- **MiMo V2.5** 是唯一结合 1M 上下文、推理和视觉的开源权重模型
+- **697 个推理模型**同时支持视觉 — 最常见的组合能力
+- 小型推理模型（Qwen 3.5 0.8B–4B）每 1M tokens 仅需 $0.01–$0.03
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [工具调用模型](tool-calling.md) — 2,350 个支持工具调用的模型
+- [结构化输出](structured-output.md) — 829 个 JSON 模式模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型，部分支持推理
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+- [OpenAI 替代方案](openai-alternatives.md) — GPT-4 级别推理替代
+- [智能体模型](agentic-models.md) — 1,080 个工具调用+推理模型
+- [代码模型](code-models.md) — 189 个代码模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/small-language-models.md b/docs/zh/small-language-models.md
new file mode 100644
index 00000000..91563386
--- /dev/null
+++ b/docs/zh/small-language-models.md
@@ -0,0 +1,126 @@
+# 小语言模型 (SLM) 指南
+
+> 2,000+ 小语言模型完整指南，适用于边缘部署、移动应用和低成本生产环境。
+
+## 什么是小语言模型？
+
+小语言模型（SLM）是参数量少于约 100 亿的 AI 模型，专为高效、低延迟和资源受限硬件部署而设计。当成本、速度或隐私是关键因素时，它们是大型前沿模型的实用替代方案。
+
+### 核心优势
+
+| 因素             | 小模型 (SLM)     | 大模型 (LLM)   |
+| ---------------- | ---------------- | -------------- |
+| 每 1M token 成本 | $0.01 – $0.20    | $1 – $40       |
+| 延迟（首 token） | 50 – 200ms       | 200 – 2000ms   |
+| 部署方式         | 本地、边缘、云端 | 仅云端         |
+| 隐私保护         | 数据留在本地     | 数据发送到云端 |
+| 定制化           | 易于微调         | 微调成本高     |
+| 复杂推理         | 适合简单任务     | 复杂任务更优   |
+
+## 快速统计
+
+| 指标         | 数量  |
+| ------------ | ----- |
+| 小模型总数   | 2,002 |
+| 支持工具调用 | 928   |
+| 支持推理     | 557   |
+| 免费小模型   | 48    |
+| 一手提供商   | 689   |
+
+## 按使用场景选择
+
+### 低成本 AI Agent
+
+需要工具调用 + 推理 + 低延迟的大规模 Agent 工作流。
+
+- **最佳性价比**：ling-2.6-flash ($0.01/$0.03/M) — 最便宜的 TC 模型，262K 上下文
+- **均衡之选**：GPT-4.1-mini ($0.40/$1.60/M) — 可靠 + 1M 上下文
+- **免费**：Gemma 4 27B IT — 免费视觉 + 工具调用
+
+### 本地 / 边缘部署
+
+需要在手机、IoT 设备或边缘服务器上运行的模型。
+
+- **超紧凑**：Qwen3.5 0.8B — 小体积推理模型
+- **均衡**：Qwen3 4B ($0.03/$0.15/M) — 开源 + 推理
+- **视觉**：Gemma 4 27B IT — 免费 + 视觉 + 工具调用
+
+### 代码补全
+
+需要工具调用 + 结构化输出的编程辅助。
+
+- **最便宜**：bdc-coder ($0.01/$0.01/M) — 最便宜的编程模型
+- **均衡**：GPT-4.1-nano ($0.10/$0.40/M) — 快速 + 便宜
+- **开源**：Qwen3 4B ($0.03/$0.15/M) — 推理 + 工具调用
+
+### 数学 & 推理
+
+需要推理能力的逐步问题解决。
+
+- **免费**：DeepSeek R1 Distill Llama 8B — 免费推理模型
+- **最便宜**：Qwen3.5 0.8B ($0.01/$0.05/M) — 最便宜的推理模型
+- **均衡**：Qwen3.5 4B ($0.03/$0.15/M) — 开源推理
+
+### 对话 & RAG
+
+需要大上下文 + 低成本的检索增强生成。
+
+- **最便宜**：Qwen3 4B ($0.03/$0.15/M) — 便宜 + 262K 上下文
+- **快速**：GPT-4.1-nano ($0.10/$0.40/M) — 快速 + 便宜
+- **大上下文**：Gemini 2.5 Flash ($0.15/$0.60/M) — 1M 上下文 + 推理
+
+## 最便宜的工具调用小模型
+
+| 模型                                        | 提供商    | 输入 $/M | 输出 $/M | 上下文 | 推理 |
+| ------------------------------------------- | --------- | -------- | -------- | ------ | ---- |
+| ling-2.6-flash                              | ling      | $0.01    | $0.03    | 262K   | —    |
+| klusterai--Meta-Llama-3.1-8B-Instruct-Turbo | klusterai | $0.015   | $0.02    | 131K   | —    |
+| granite-4.0-h-micro                         | ibm       | $0.017   | $0.112   | 131K   | —    |
+| llama-3.1-8b-instruct--fp-16                | fireworks | $0.02    | $0.03    | 131K   | —    |
+| schematron-3b                               | fireworks | $0.02    | $0.05    | 131K   | —    |
+
+## 免费小语言模型
+
+48 个免费小模型，适合原型开发和测试：
+
+| 模型                           | 提供商   | 上下文 | 工具调用 | 推理 |
+| ------------------------------ | -------- | ------ | -------- | ---- |
+| deepseek-r1-distill-llama-8b   | cerebras | 131K   | —        | ✓    |
+| llama-4-scout-17b-16e-instruct | cerebras | 131K   | ✓        | —    |
+| qwen-2.5-32b                   | cerebras | 131K   | ✓        | —    |
+| gemma-4-26b-a4b-it             | auriko   | 262K   | ✓        | —    |
+| glm-4.5-flash                  | auriko   | 200K   | ✓        | —    |
+
+## 支持推理的小模型
+
+557 个支持推理能力的小模型：
+
+| 模型                         | 提供商    | 输入 $/M | 输出 $/M | 上下文 | 工具调用 |
+| ---------------------------- | --------- | -------- | -------- | ------ | -------- |
+| qwen3.5-0.8b                 | qwen      | $0.01    | $0.05    | 262K   | —        |
+| qwen3.5-2b                   | qwen      | $0.02    | $0.10    | 262K   | —        |
+| qwen--qwen3-4b-fp8           | fireworks | $0.03    | $0.03    | 128K   | —        |
+| qwen3.5-4b                   | qwen      | $0.03    | $0.15    | 262K   | —        |
+| deepseek-r1-distill-llama-8b | cerebras  | 免费     | 免费     | 131K   | —        |
+
+## 如何选择合适的小模型
+
+1. **明确约束条件**：预算、延迟要求、部署目标（云端 vs 边缘）
+2. **确定所需能力**：工具调用？推理？视觉？结构化输出？
+3. **检查上下文窗口**：需要处理多少文本？
+4. **对比定价**：使用[交互式目录](https://i-need-token.github.io/ai-models/)或[定价计算器](https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html)
+5. **用你的数据测试**：小模型在特定领域的质量差异很大
+
+## 相关文档
+
+- [免费模型指南](free-models.md) — 81 个免费模型
+- [工具调用指南](tool-calling.md) — 2,350 个工具调用模型
+- [推理模型指南](reasoning-models.md) — 1,306 个推理模型
+- [定价对比](pricing-comparison.md) — 找到最便宜的模型
+- [上下文窗口](context-windows.md) — 最大上下文窗口
+- [模型选择速查表](model-selection-cheatsheet.md) — 快速参考指南
+- [小语言模型对比](https://i-need-token.github.io/ai-models/small-language-models.html) — 交互式页面
+
+---
+
+_数据来自 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 仅使用一手数据，自动更新。_
diff --git a/docs/zh/small-models.md b/docs/zh/small-models.md
new file mode 100644
index 00000000..a2373da3
--- /dev/null
+++ b/docs/zh/small-models.md
@@ -0,0 +1,80 @@
+# 小型与边缘模型
+
+[English](../small-models.md)
+
+专为**边缘部署、设备端推理和资源受限环境**设计的 AI 模型 — 参数量在 ~16B 以下的模型，可在消费级硬件、移动设备和嵌入式系统上运行。
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 为什么小型模型很重要
+
+小型模型使 AI 在云连接有限或延迟关键的场景中成为可能：
+
+- **设备端推理** — 在手机和笔记本电脑上无需互联网运行 AI
+- **边缘计算** — 部署在 IoT 设备、机器人和车辆中
+- **低延迟** — 亚 100ms 响应时间，适用于实时应用
+- **成本效益** — 运行成本更低，尤其是在大规模场景
+- **隐私** — 数据不离开设备
+- **离线能力** — 无需网络连接即可使用的 AI
+
+## 统计
+
+| 指标             | 数量 |
+| ---------------- | ---- |
+| 小型/边缘模型    | 1153 |
+| 提供商           | 63   |
+| 免费小型模型     | 30   |
+| 开源权重小型模型 | 272  |
+| 带工具调用       | 434  |
+| 带推理能力       | 250  |
+
+## 提供商
+
+`302ai`、`aihubmix`、`aimlapi`、`aion`、`alibaba`、`amazon-bedrock`、`auriko`、`baichuan`、`berget`、`bytedance`、`cerebras`、`chutes`、`clarifai`、`cloudferro-sherlock`、`cloudflare`、`cortecs`、`databricks`、`deepinfra`、`digitalocean`、`evroc`、`fastrouter`、`fireworks`、`friendli`、`gmicloud`、`google`、`google-vertex`、`groq`、`hpc-ai`、`hyperbolic`、`inferencenet`、`jiekou`、`klusterai`、`llmgateway`、`martian`、`meganova`、`meta`、`microsoft`、`mistral`、`mixlayer`、`moonshotai`、`morph`、`nanogpt`、`nebius`、`neuralwatt`、`nousresearch`、`novitaai`、`openrouter`、`orcarouter`、`ovhcloud`、`ppio`、`privatemode`、`requesty`、`sambanova`、`scaleway`、`siliconflow`、`siliconflow-cn`、`submodel`、`tencent`、`textsynth`、`togetherai`、`venice`、`vultr`、`wafer`
+
+## 免费小型模型
+
+免费小型模型 — 零成本边缘 AI。
+
+| 模型                                                 | 提供商     | 上下文 | 输入 $/M | 输出 $/M | 能力     |
+| ---------------------------------------------------- | ---------- | ------ | -------- | -------- | -------- |
+| nvidia--nemotron-3-super-120b-a12b--free             | openrouter | 1M     | Free     | Free     | 🔧 🧠 📋 |
+| google--gemma-4-26b-a4b-it--free                     | openrouter | 262K   | Free     | Free     | 🔧 🧠 📋 |
+| google--gemma-4-31b-it--free                         | openrouter | 262K   | Free     | Free     | 🔧 🧠 📋 |
+| gemma-4-26b-a4b-it                                   | auriko     | 262K   | Free     | Free     | 🔧 🧠 📋 |
+| gemma-4-31b-it                                       | auriko     | 262K   | Free     | Free     | 🔧 🧠 📋 |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter | 256K   | Free     | Free     | 🔧 🧠    |
+| gemma-3-4b-it                                        | google     | 131K   | Free     | Free     |          |
+| gemma-3-12b-it                                       | google     | 131K   | Free     | Free     |          |
+| gemma-3-27b-it                                       | google     | 131K   | Free     | Free     |          |
+| gemma-3n-E2B-it                                      | google     | 131K   | Free     | Free     |          |
+
+## 最便宜小型模型
+
+生产环境小型应用的最佳性价比模型。
+
+| 模型                                            | 提供商   | 上下文 | 输入 $/M | 输出 $/M | 能力  |
+| ----------------------------------------------- | -------- | ------ | -------- | -------- | ----- |
+| llama3-groq-8b-8192-tool-use-preview            | aihubmix | 0      | $9.5e-05 | $9.5e-05 |       |
+| mistralai--mistral-7b-instruct--free            | aihubmix | 0      | $0.001   | $0.001   |       |
+| deepseek-ai--deepseek-r1-distill-llama-8b       | aihubmix | 0      | $0.005   | $0.005   |       |
+| deepseek-ai--deepseek-r1-distill-qwen-7b        | aihubmix | 0      | $0.005   | $0.005   |       |
+| deepseek-ai--deepseek-r1-distill-qwen-1.5b      | aihubmix | 0      | $0.005   | $0.005   |       |
+| ernie-4.5-0.3b                                  | aihubmix | 0      | $0.0068  | $0.0272  | 🔧 📋 |
+| google--gemma-2-9b-it--free                     | aihubmix | 0      | $0.01    | $0.01    |       |
+| meta-llama--llama-3.2-3b-instruct--free         | aihubmix | 0      | $0.01    | $0.01    |       |
+| meta-llama--llama-3.2-11b-vision-instruct--free | aihubmix | 0      | $0.01    | $0.01    |       |
+| meta-llama--llama-3.1-8b-instruct--free         | aihubmix | 0      | $0.01    | $0.01    |       |
+
+## 相关文档
+
+- [开源权重](open-weights.md) — 527 个开源权重模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型按能力分类
+- [聊天模型](chat-models.md) — 2,350 个支持工具调用的聊天模型
+- [代码模型](code-models.md) — 189 个代码模型
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [提供商对比](provider-comparison.md) — 前 30 个提供商
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/structured-output.md b/docs/zh/structured-output.md
new file mode 100644
index 00000000..cd0c9319
--- /dev/null
+++ b/docs/zh/structured-output.md
@@ -0,0 +1,84 @@
+[English](../structured-output.md) | **中文**
+
+# AI 结构化输出模型（JSON 模式）
+
+本目录中有 829 个模型支持结构化输出 — 能够按照指定的 JSON Schema 生成回复。这对于构建可靠的 AI 驱动 API、数据管道和自动化至关重要。
+
+> 所有数据来自一手 API 和文档。"结构化输出"表示模型可以在回复中强制遵循 JSON Schema（也称为 JSON 模式、约束解码或引导生成）。
+
+## 快速统计
+
+| 能力             | 结构化输出模型数 |
+| ---------------- | ---------------: |
+| 总结构化输出模型 |              829 |
+| 唯一模型 ID      |              704 |
+| 支持工具调用     |              749 |
+| 支持推理         |              473 |
+| 支持视觉         |              411 |
+| 开源权重         |               24 |
+
+## 最便宜的结构化输出模型
+
+生成可靠 JSON 回复的最佳性价比：
+
+| 模型                  | 提供商     | 输入 $/1M | 输出 $/1M | 上下文 | 工具调用 | 推理 |
+| --------------------- | ---------- | --------: | --------: | ------ | -------- | ---- |
+| Ernie 4.5 0.3B        | AIHubMix   |   $0.0068 |   $0.0272 | —      | ✅       | ❌   |
+| Ling 2.6 Flash        | OpenRouter |     $0.01 |     $0.03 | 262K   | ✅       | ❌   |
+| Qwen3 VL Flash        | AIHubMix   |   $0.0103 |    $0.103 | —      | ✅       | ❌   |
+| Llama 3.1 8B Instruct | Auriko     |     $0.02 |     $0.03 | 131K   | ✅       | ❌   |
+| Mistral Nemo          | OpenRouter |     $0.02 |     $0.02 | —      | ✅       | ❌   |
+| Doubao Seed 1.6 Flash | AIHubMix   |    $0.022 |    $0.022 | —      | ✅       | ❌   |
+| GPT-5 Nano            | AIHubMix   |    $0.025 |     $0.20 | —      | ✅       | ✅   |
+| GPT-OSS 20B           | NeuralWatt |     $0.03 |     $0.03 | —      | ✅       | ✅   |
+| Granite 4.0 H Micro   | Cloudflare |    $0.017 |    $0.112 | 131K   | ✅       | ❌   |
+| Gemini 2.5 Flash Lite | Google     |     $0.10 |     $0.60 | 1M     | ✅       | ✅   |
+
+## 免费结构化输出模型
+
+24 个模型提供免费结构化输出 — 适合原型设计：
+
+| 模型                      | 提供商     | 上下文 | 工具调用 | 推理 |
+| ------------------------- | ---------- | ------ | -------- | ---- |
+| Ernie 4.5 0.3B            | AIMLAPI    | —      | ✅       | ❌   |
+| Gemma 4 26B A4B IT        | Auriko     | —      | ✅       | ✅   |
+| Gemma 4 31B IT            | Auriko     | —      | ✅       | ❌   |
+| Qwen3 Omni 30B A3B        | NovitaAI   | —      | ✅       | ✅   |
+| Dolphin Mistral 24B       | OpenRouter | —      | ✅       | ❌   |
+| Gemma 4 26B A4B IT (free) | OpenRouter | —      | ✅       | ✅   |
+| Gemma 4 31B IT (free)     | OpenRouter | —      | ✅       | ❌   |
+
+## 最佳结构化输出 + 工具调用 + 推理
+
+适合需要返回结构化数据、调用工具和推理的 AI 代理：
+
+| 模型                  | 上下文 | 输入 $/1M | 工具调用 | 推理 | 提供商数 |
+| --------------------- | ------ | --------: | -------- | ---- | -------: |
+| Grok 4 Fast Reasoning | 2M     |     $0.20 | ✅       | ✅   |        2 |
+| Gemini 2.5 Flash      | 1M     |     $0.15 | ✅       | ✅   |        3 |
+| Gemini 2.5 Pro        | 1M     |     $1.25 | ✅       | ✅   |        4 |
+| GPT-5.4               | 1M     |     $2.50 | ✅       | ✅   |        4 |
+| DeepSeek Reasoner     | 1M     |     $0.43 | ✅       | ✅   |        1 |
+| GPT-5 Nano            | —      |    $0.025 | ✅       | ✅   |        4 |
+
+## 要点总结
+
+- **829 个结构化输出模型** — 最大的 JSON 模式模型目录
+- **749 个模型**同时支持结构化输出和工具调用 — 完美适合 AI 代理
+- **24 个免费模型**支持结构化输出 — 零成本开始构建
+- **Gemini 2.5 Flash** 是最佳性价比：1M 上下文、结构化输出、工具调用和推理，仅 $0.15/1M
+- 小型模型（Ernie 4.5 0.3B、Ling 2.6 Flash）带结构化输出仅需 $0.01/1M
+- 91% 的结构化输出模型同时支持工具调用 — 这两种能力相辅相成
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [工具调用模型](tool-calling.md) — 2,350 个支持工具调用的模型
+- [推理模型](reasoning-models.md) — 1,306 个支持推理的模型
+- [免费 AI 模型](free-models.md) — 81 个免费模型，部分支持结构化输出
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+- [智能体模型](agentic-models.md) — 1,080 个工具调用+推理模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/tool-calling.md b/docs/zh/tool-calling.md
new file mode 100644
index 00000000..5e35f86a
--- /dev/null
+++ b/docs/zh/tool-calling.md
@@ -0,0 +1,102 @@
+[English](../tool-calling.md) | **中文**
+
+# AI 工具调用模型
+
+本目录中有 2,350 个模型支持工具调用（函数调用）。本页重点介绍构建 AI 代理和自动化最有能力和最具性价比的模型。
+
+> 所有数据来自一手 API 和文档。"工具调用"表示模型可以在回复中调用外部函数/工具。
+
+## 快速统计
+
+| 能力                 | 工具调用模型数 |
+| -------------------- | -------------: |
+| 总工具调用模型       |          2,350 |
+| 唯一模型 ID          |          1,540 |
+| 支持推理             |          1,076 |
+| 支持视觉（图像输入） |          1,063 |
+| 支持结构化输出       |            829 |
+| 开源权重             |            270 |
+
+## 最便宜的工具调用模型
+
+构建 AI 代理的最佳性价比：
+
+| 模型                       | 提供商       | 输入 $/1M | 输出 $/1M | 上下文 | 推理 |
+| -------------------------- | ------------ | --------: | --------: | ------ | ---- |
+| GLM-4-Flash                | 302AI        |   $0.0014 |   $0.0014 | 131K   | ❌   |
+| Mistral-Nemo-Instruct-2407 | KlusterAI    |    $0.008 |    $0.001 | 131K   | ❌   |
+| BDC-Coder                  | InferenceNet |     $0.01 |     $0.01 | 131K   | ❌   |
+| Qwen 3.5 0.8B              | Auriko       |     $0.01 |     $0.05 | 262K   | ✅   |
+| Qwen 3.5 0.8B              | DeepInfra    |     $0.01 |     $0.05 | 262K   | ✅   |
+| Qwen 3.5 2B                | Auriko       |     $0.02 |     $0.10 | 262K   | ✅   |
+| Qwen 3.5 2B                | DeepInfra    |     $0.02 |     $0.10 | 262K   | ✅   |
+| GPT-5 Nano                 | Requesty     |    $0.025 |     $0.20 | 400K   | ✅   |
+| Gemini 2.5 Flash Lite      | Google       |     $0.10 |     $0.60 | 1M     | ✅   |
+| Gemini 2.5 Flash           | Google       |     $0.15 |     $0.60 | 1M     | ✅   |
+| Grok 4 Fast Reasoning      | xAI          |     $0.20 |     $0.50 | 2M     | ✅   |
+
+## 最大上下文工具调用模型
+
+适合处理大型文档或长对话历史的代理：
+
+| 模型                  | 上下文 | 输入 $/1M | 推理 | 提供商数 |
+| --------------------- | ------ | --------: | ---- | -------: |
+| Llama 4 Scout         | 10M    |     $0.08 | ❌   |        4 |
+| Grok 4 Fast Reasoning | 2M     |     $0.20 | ✅   |        2 |
+| GPT-5.4               | 1M     |     $2.50 | ✅   |        4 |
+| Gemini 2.5 Pro        | 1M     |     $1.25 | ✅   |        4 |
+| Gemini 2.5 Flash      | 1M     |     $0.15 | ✅   |        3 |
+| DeepSeek-V4 Flash     | 1M     |     $0.27 | ✅   |        2 |
+| GPT-4.1               | 1M     |     $2.00 | ❌   |        4 |
+| Llama 4 Maverick      | 1M     |     $0.15 | ❌   |        3 |
+
+## 最佳工具调用 + 推理 + 视觉
+
+高级 AI 代理的"三位一体" — 工具调用、推理和视觉一体：
+
+| 模型                  | 上下文 | 输入 $/1M | 提供商数 |
+| --------------------- | ------ | --------: | -------: |
+| Grok 4 Fast Reasoning | 2M     |     $0.20 |        2 |
+| Gemini 2.5 Flash      | 1M     |     $0.15 |        3 |
+| Gemini 2.5 Pro        | 1M     |     $1.25 |        4 |
+| GPT-5.4               | 1M     |     $2.50 |        4 |
+| DeepSeek Reasoner     | 1M     |     $0.43 |        1 |
+| MiMo V2.5（开源权重） | 1M     |    varies |        2 |
+| Kimi K2.6（开源权重） | 262K   |    varies |        4 |
+
+## 免费工具调用模型
+
+45 个免费模型支持工具调用 — 适合原型设计和测试：
+
+| 模型                           | 提供商 | 上下文 | 推理 | 视觉 |
+| ------------------------------ | ------ | ------ | ---- | ---- |
+| gemini-2.0-flash               | Google | 1M     | ✅   | ✅   |
+| gemini-2.5-flash-preview-05-20 | Google | 1M     | ✅   | ✅   |
+| llama-4-scout                  | Chutes | 10M    | ❌   | ✅   |
+| llama-4-maverick               | Chutes | 1M     | ❌   | ✅   |
+| deepseek-r1                    | Chutes | 128K   | ✅   | ❌   |
+| qwen3-235b-a22b                | Chutes | 128K   | ✅   | ✅   |
+| gemma-3-27b-it                 | Chutes | 128K   | ✅   | ✅   |
+
+## 要点总结
+
+- **2,350 个工具调用模型**，涵盖 1,540 个唯一模型 ID — 最大的工具调用模型目录
+- **Gemini 2.5 Flash** 是最佳性价比：1M 上下文、工具调用、推理和视觉，仅 $0.15/1M
+- **Grok 4 Fast Reasoning** 提供最大上下文（2M）且具备全部三种能力
+- **45 个免费模型**支持工具调用 — 零成本开始构建代理
+- **829 个模型**同时支持结构化输出 — 完美适合可靠的 JSON 响应
+- 小型模型（Qwen 3.5 0.8B–4B）带工具调用仅需 $0.01–$0.03/1M tokens
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [免费 AI 模型](free-models.md) — 81 个免费模型，多数支持工具调用
+- [结构化输出](structured-output.md) — 829 个 JSON 模式模型
+- [推理模型](reasoning-models.md) — 1,306 个支持推理的模型
+- [缓存定价](cached-pricing.md) — 1,374 个支持提示缓存的模型
+- [OpenAI 替代方案](openai-alternatives.md) — GPT-4/GPT-3.5 工具调用替代
+- [智能体模型](agentic-models.md) — 1,080 个工具调用+推理模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/docs/zh/video-models.md b/docs/zh/video-models.md
new file mode 100644
index 00000000..a66fb3ed
--- /dev/null
+++ b/docs/zh/video-models.md
@@ -0,0 +1,210 @@
+# 视频模型
+
+[English](../video-models.md)
+
+支持视频输入或输出的 AI 模型，数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models)。
+
+## 统计
+
+| 指标         | 数量 |
+| ------------ | ---- |
+| 视频模型总数 | 171  |
+| 视频输入     | 167  |
+| 视频输出     | 4    |
+| 免费         | 0    |
+| 开源权重     | 6    |
+| 提供商       | 18   |
+
+## 提供商
+
+`aihubmix`, `amazon`, `amazon-bedrock`, `bytedance`, `chutes`, `fastrouter`, `google`, `google-vertex`, `hpc-ai`, `inferencenet`, `minimax`, `novitaai`, `openrouter`, `tencent`, `tencent-tokenhub`, `voyage`, `vultr`, `xiaomi`
+
+## 模型
+
+| 模型                                                 | 提供商           | 上下文 | 输入价格  | 能力           |
+| ---------------------------------------------------- | ---------------- | ------ | --------- | -------------- |
+| doubao-seed-1-6                                      | aihubmix         | —      | $0.09     | 📹 in 🔧       |
+| doubao-seed-1-6-flash                                | aihubmix         | —      | $0.022    | 📹 in 🔧       |
+| doubao-seed-1-6-lite                                 | aihubmix         | —      | $0.041    | 📹 in 🔧       |
+| doubao-seed-1-6-thinking                             | aihubmix         | —      | $0.09     | 📹 in 🔧       |
+| doubao-seed-1-8                                      | aihubmix         | —      | $0.054795 | 📹 in 🔧 🧠    |
+| gemini-2.0-flash                                     | aihubmix         | —      | $0.05     | 📹 in 🔧       |
+| gemini-2.0-flash-exp                                 | aihubmix         | —      | $0.01     | 📹 in          |
+| gemini-2.0-flash-lite                                | aihubmix         | —      | $0.038    | 📹 in          |
+| gemini-2.0-flash-search                              | aihubmix         | —      | $0.05     | 📹 in          |
+| gemini-2.0-flash-thinking-exp-01-21                  | aihubmix         | —      | $0.038    | 📹 in 🧠       |
+| gemini-2.0-pro-exp-02-05                             | aihubmix         | —      | $0.625    | 📹 in          |
+| gemini-2.0-pro-exp-02-05-search                      | aihubmix         | —      | $0.625    | 📹 in          |
+| gemini-2.5-flash                                     | aihubmix         | —      | $0.15     | 📹 in 🔧       |
+| gemini-2.5-flash-lite                                | aihubmix         | —      | $0.05     | 📹 in 🔧       |
+| gemini-2.5-flash-lite-nothink                        | aihubmix         | —      | $0.05     | 📹 in 🔧       |
+| gemini-2.5-flash-lite-preview-09-2025                | aihubmix         | —      | $0.05     | 📹 in 🔧       |
+| gemini-2.5-flash-lite-preview-09-2025-nothink        | aihubmix         | —      | $0.05     | 📹 in 🔧       |
+| gemini-2.5-flash-nothink                             | aihubmix         | —      | $0.15     | 📹 in 🔧       |
+| gemini-2.5-flash-preview-05-20-nothink               | aihubmix         | —      | $0.15     | 📹 in 🔧       |
+| gemini-2.5-flash-preview-05-20-search                | aihubmix         | —      | $0.15     | 📹 in 🔧       |
+| gemini-2.5-flash-preview-09-2025                     | aihubmix         | —      | $0.15     | 📹 in 🔧       |
+| gemini-2.5-flash-search                              | aihubmix         | —      | $0.15     | 📹 in 🔧       |
+| gemini-2.5-pro                                       | aihubmix         | —      | $0.625    | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-exp-03-25                             | aihubmix         | —      | $0.625    | 📹 in 🔧       |
+| gemini-2.5-pro-preview-03-25-search                  | aihubmix         | —      | $0.625    | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-preview-05-06                         | aihubmix         | —      | $0.625    | 📹 in 🧠       |
+| gemini-2.5-pro-preview-05-06-search                  | aihubmix         | —      | $0.625    | 📹 in 🧠       |
+| gemini-2.5-pro-preview-06-05                         | aihubmix         | —      | $0.625    | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-preview-06-05-search                  | aihubmix         | —      | $0.625    | 📹 in 🔧 🧠    |
+| gemini-2.5-pro-search                                | aihubmix         | —      | $0.625    | 📹 in 🔧 🧠    |
+| gemini-3.1-flash-lite-preview-nothink                | aihubmix         | —      | $0.125    | 📹 in 🔧 🧠    |
+| glm-4.5v                                             | aihubmix         | —      | $0.137    | 📹 in          |
+| glm-4.6v                                             | aihubmix         | —      | $0.0685   | 📹 in          |
+| gme-qwen2-vl-2b-instruct                             | aihubmix         | —      | $0.069    | 📹 in          |
+| kimi-k2.5                                            | aihubmix         | —      | $0.3      | 📹 in 🔧 🧠    |
+| mimo-v2-omni                                         | aihubmix         | —      | $0.22     | 📹 in          |
+| mimo-v2-pro                                          | aihubmix         | —      | $0.55     | 📹 in          |
+| qwen--qwen2.5-vl-32b-instruct                        | aihubmix         | —      | $0.12     | 📹 in 🔧       |
+| qwen--qwen2.5-vl-72b-instruct                        | aihubmix         | —      | $0.25     | 📹 in          |
+| qwen2-vl-72b-instruct                                | aihubmix         | —      | $1.09     | 📹 in          |
+| qwen2-vl-7b-instruct                                 | aihubmix         | —      | $0.14     | 📹 in          |
+| qwen3-vl-235b-a22b-instruct                          | aihubmix         | —      | $0.137    | 📹 in 🔧       |
+| qwen3-vl-235b-a22b-thinking                          | aihubmix         | —      | $0.137    | 📹 in 🔧 🧠    |
+| qwen3-vl-30b-a3b-instruct                            | aihubmix         | —      | $0.0514   | 📹 in 🔧       |
+| qwen3-vl-30b-a3b-thinking                            | aihubmix         | —      | $0.0514   | 📹 in 🔧 🧠    |
+| qwen3-vl-flash                                       | aihubmix         | —      | $0.0103   | 📹 in 🔧       |
+| qwen3-vl-flash-2026-01-22                            | aihubmix         | —      | $0.0103   | 📹 in 🔧       |
+| qwen3-vl-plus                                        | aihubmix         | —      | $0.0685   | 📹 in 🔧       |
+| veo-2.0-generate-001                                 | aihubmix         | —      | $1        | 📹 in          |
+| veo-3                                                | aihubmix         | —      | $1        | 📹 in          |
+| veo-3.0-generate-preview                             | aihubmix         | —      | $1        | 📹 in          |
+| veo-3.1-fast-generate-preview                        | aihubmix         | —      | $1        | 📹 in          |
+| veo-3.1-generate-preview                             | aihubmix         | —      | $1        | 📹 in          |
+| veo-3.1-lite-generate-preview                        | aihubmix         | —      | $1        | 📹 in          |
+| veo3                                                 | aihubmix         | —      | $1        | 📹 in          |
+| amazon-nova-2.0-lite                                 | amazon           | —      | $0.15     | 📹 in 🔧 🧠    |
+| amazon-nova-2.0-omni                                 | amazon           | —      | $0.2      | 📹 in 🔧 🧠    |
+| amazon-nova-2.0-pro                                  | amazon           | —      | $0.625    | 📹 in 🔧 🧠    |
+| amazon-nova-lite                                     | amazon           | —      | $0.06     | 📹 in 🔧       |
+| amazon-nova-premier                                  | amazon           | —      | $2.5      | 📹 in 🔧       |
+| amazon-nova-pro                                      | amazon           | —      | $0.8      | 📹 in 🔧       |
+| amazon-nova-2-lite                                   | amazon-bedrock   | —      | $0.33     | 📹 in 🔧       |
+| amazon-nova-lite                                     | amazon-bedrock   | —      | $0.06     | 📹 in 🔧       |
+| amazon-nova-premier                                  | amazon-bedrock   | —      | $2.5      | 📹 in 🔧       |
+| amazon-nova-pro                                      | amazon-bedrock   | —      | $0.8      | 📹 in 🔧       |
+| amazon-nova-pro-latency-optimized                    | amazon-bedrock   | —      | $1        | 📹 in 🔧       |
+| seed-1.6                                             | bytedance        | —      | $0.25     | 📹 in 🔧 🧠    |
+| seed-1.6-flash                                       | bytedance        | —      | $0.07     | 📹 in 🔧 🧠    |
+| seed-2.0-lite                                        | bytedance        | —      | $0.25     | 📹 in 🔧 🧠    |
+| seed-2.0-mini                                        | bytedance        | —      | $0.1      | 📹 in 🔧 🧠    |
+| moonshotai--Kimi-K2.5-TEE                            | chutes           | —      | $0.44     | 📹 in 🔧 🧠    |
+| moonshotai--Kimi-K2.6-TEE                            | chutes           | —      | $0.74     | 📹 in 🔧 🧠    |
+| google--gemini-3-flash-preview                       | fastrouter       | —      | $0.5      | 📹 in 🔧 🧠    |
+| google--gemini-3.1-flash-lite-preview                | fastrouter       | —      | $0.25     | 📹 in 🔧 🧠    |
+| google--gemini-3.1-pro-preview                       | fastrouter       | —      | $2        | 📹 in 🔧 🧠    |
+| google--gemma-4-31b-it                               | fastrouter       | —      | $0.2      | 📹 in 🔧 🧠    |
+| gemini-1.5-flash                                     | google           | —      | $0.075    | 📹 in 🔧       |
+| gemini-1.5-flash-8b                                  | google           | —      | $0.075    | 📹 in 🔧       |
+| gemini-1.5-pro                                       | google           | —      | $1.25     | 📹 in 🔧       |
+| gemini-2.0-flash                                     | google           | —      | $0.1      | 📹 in 🔧       |
+| gemini-2.0-flash-lite                                | google           | —      | $0.075    | 📹 in 🔧       |
+| gemini-2.5-flash                                     | google           | —      | $0.15     | 📹 in 🔧 🧠    |
+| gemini-2.5-flash-lite                                | google           | —      | $0.1      | 📹 in 🔧       |
+| gemini-2.5-pro                                       | google           | —      | $1.25     | 📹 in 🔧 🧠    |
+| gemma-3n-E2B-it                                      | google           | —      | —         | 📹 in          |
+| gemma-3n-E4B-it                                      | google           | —      | —         | 📹 in          |
+| veo-2.0-generate                                     | google           | —      | —         | 📹 out         |
+| gemini-2-5-flash                                     | google-vertex    | —      | $0.3      | 📹 in 🔧       |
+| gemini-2-5-flash-lite                                | google-vertex    | —      | $0.1      | 📹 in 🔧       |
+| gemini-2-5-pro                                       | google-vertex    | —      | $1.25     | 📹 in 🔧       |
+| gemini-3-1-flash-lite                                | google-vertex    | —      | $0.25     | 📹 in 🔧       |
+| gemini-3-flash                                       | google-vertex    | —      | $0.5      | 📹 in 🔧       |
+| gemini-3-pro                                         | google-vertex    | —      | $2        | 📹 in 🔧       |
+| xiaomi--mimo-v2.5                                    | hpc-ai           | —      | $0.4      | 📹 in 🔧 🧠 🔓 |
+| cliptagger-12b                                       | inferencenet     | —      | $0.3      | 📹 in 🔓       |
+| MiniMax-Hailuo-02                                    | minimax          | —      | —         | 📹 out         |
+| MiniMax-Hailuo-2.3                                   | minimax          | —      | —         | 📹 out         |
+| MiniMax-Hailuo-2.3-Fast                              | minimax          | —      | —         | 📹 out         |
+| baidu--ernie-4.5-vl-28b-a3b-thinking                 | novitaai         | —      | $0.39     | 📹 in 🔧 🧠    |
+| moonshotai--kimi-k2.5                                | novitaai         | —      | $0.6      | 📹 in 🔧 🧠    |
+| moonshotai--kimi-k2.6                                | novitaai         | —      | $0.8      | 📹 in 🔧 🧠    |
+| qwen--qwen2.5-vl-72b-instruct                        | novitaai         | —      | $0.8      | 📹 in          |
+| qwen--qwen3-omni-30b-a3b-instruct                    | novitaai         | —      | —         | 📹 in 🔧       |
+| qwen--qwen3-omni-30b-a3b-thinking                    | novitaai         | —      | —         | 📹 in 🔧 🧠    |
+| qwen--qwen3-vl-235b-a22b-instruct                    | novitaai         | —      | $0.3      | 📹 in 🔧       |
+| qwen--qwen3-vl-235b-a22b-thinking                    | novitaai         | —      | $0.98     | 📹 in 🔧 🧠    |
+| qwen--qwen3-vl-30b-a3b-instruct                      | novitaai         | —      | $0.2      | 📹 in 🔧       |
+| qwen--qwen3-vl-30b-a3b-thinking                      | novitaai         | —      | $0.2      | 📹 in 🔧       |
+| qwen--qwen3-vl-8b-instruct                           | novitaai         | —      | $0.08     | 📹 in 🔧       |
+| qwen--qwen3.5-122b-a10b                              | novitaai         | —      | $0.4      | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-27b                                    | novitaai         | —      | $0.3      | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-35b-a3b                                | novitaai         | —      | $0.25     | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-397b-a17b                              | novitaai         | —      | $0.6      | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-27b                                    | novitaai         | —      | $0.6      | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-35b-a3b                                | novitaai         | —      | $0.248    | 📹 in 🔧 🧠    |
+| zai-org--glm-4.5v                                    | novitaai         | —      | $0.6      | 📹 in 🔧 🧠    |
+| zai-org--glm-4.6v                                    | novitaai         | —      | $0.3      | 📹 in 🔧 🧠    |
+| amazon--nova-2-lite-v1                               | openrouter       | —      | $0.3      | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-1.6                             | openrouter       | —      | $0.25     | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-1.6-flash                       | openrouter       | —      | $0.075    | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-2.0-lite                        | openrouter       | —      | $0.25     | 📹 in 🔧 🧠    |
+| bytedance-seed--seed-2.0-mini                        | openrouter       | —      | $0.1      | 📹 in 🔧 🧠    |
+| google--gemini-2.0-flash-001                         | openrouter       | —      | $0.1      | 📹 in 🔧       |
+| google--gemini-2.0-flash-lite-001                    | openrouter       | —      | $0.075    | 📹 in 🔧       |
+| google--gemini-2.5-flash                             | openrouter       | —      | $0.3      | 📹 in 🔧 🧠    |
+| google--gemini-2.5-flash-lite                        | openrouter       | —      | $0.1      | 📹 in 🔧 🧠    |
+| google--gemini-2.5-flash-lite-preview-09-2025        | openrouter       | —      | $0.1      | 📹 in 🔧 🧠    |
+| google--gemini-2.5-pro                               | openrouter       | —      | $1.25     | 📹 in 🔧 🧠    |
+| google--gemini-2.5-pro-preview-05-06                 | openrouter       | —      | $1.25     | 📹 in 🔧 🧠    |
+| google--gemini-3-flash-preview                       | openrouter       | —      | $0.5      | 📹 in 🔧 🧠    |
+| google--gemini-3.1-flash-lite                        | openrouter       | —      | $0.25     | 📹 in 🔧 🧠    |
+| google--gemini-3.1-flash-lite-preview                | openrouter       | —      | $0.25     | 📹 in 🔧 🧠    |
+| google--gemini-3.1-pro-preview                       | openrouter       | —      | $2        | 📹 in 🔧 🧠    |
+| google--gemini-3.1-pro-preview-customtools           | openrouter       | —      | $2        | 📹 in 🔧 🧠    |
+| google--gemini-3.5-flash                             | openrouter       | —      | $1.5      | 📹 in 🔧 🧠    |
+| google--gemma-4-26b-a4b-it                           | openrouter       | —      | $0.06     | 📹 in 🔧 🧠    |
+| google--gemma-4-26b-a4b-it--free                     | openrouter       | —      | —         | 📹 in 🔧 🧠    |
+| google--gemma-4-31b-it                               | openrouter       | —      | $0.12     | 📹 in 🔧 🧠    |
+| google--gemma-4-31b-it--free                         | openrouter       | —      | —         | 📹 in 🔧 🧠    |
+| nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free | openrouter       | —      | —         | 📹 in 🔧 🧠    |
+| nvidia--nemotron-nano-12b-v2-vl--free                | openrouter       | —      | —         | 📹 in 🔧 🧠    |
+| perceptron--perceptron-mk1                           | openrouter       | —      | $0.15     | 📹 in 🧠       |
+| qwen--qwen3.5-122b-a10b                              | openrouter       | —      | $0.26     | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-27b                                    | openrouter       | —      | $0.195    | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-35b-a3b                                | openrouter       | —      | $0.139    | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-397b-a17b                              | openrouter       | —      | $0.39     | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-9b                                     | openrouter       | —      | $0.04     | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-flash-02-23                            | openrouter       | —      | $0.065    | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-plus-02-15                             | openrouter       | —      | $0.26     | 📹 in 🔧 🧠    |
+| qwen--qwen3.5-plus-20260420                          | openrouter       | —      | $0.3      | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-27b                                    | openrouter       | —      | $0.32     | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-35b-a3b                                | openrouter       | —      | $0.15     | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-flash                                  | openrouter       | —      | $0.1875   | 📹 in 🔧 🧠    |
+| qwen--qwen3.6-plus                                   | openrouter       | —      | $0.325    | 📹 in 🔧 🧠    |
+| rekaai--reka-edge                                    | openrouter       | —      | $0.1      | 📹 in 🔧       |
+| xiaomi--mimo-v2-omni                                 | openrouter       | —      | $0.4      | 📹 in 🔧 🧠    |
+| xiaomi--mimo-v2.5                                    | openrouter       | —      | $0.4      | 📹 in 🔧 🧠    |
+| z-ai--glm-4.6v                                       | openrouter       | —      | $0.3      | 📹 in 🔧 🧠    |
+| z-ai--glm-5v-turbo                                   | openrouter       | —      | $1.2      | 📹 in 🔧 🧠    |
+| ~google--gemini-flash-latest                         | openrouter       | —      | $1.5      | 📹 in 🔧 🧠    |
+| ~google--gemini-pro-latest                           | openrouter       | —      | $2        | 📹 in 🔧 🧠    |
+| hunyuan-turbos-vision-video                          | tencent          | —      | $3        | 📹 in          |
+| yt-vita                                              | tencent-tokenhub | —      | $1.2      | 📹 in          |
+| voyage-multimodal-3                                  | voyage           | —      | $0.12     | 📹 in          |
+| voyage-multimodal-3.5                                | voyage           | —      | $0.12     | 📹 in          |
+| gemma-4-26b-a4b-it                                   | vultr            | —      | $0.55     | 📹 in 🔓       |
+| gemma-4-31b-it                                       | vultr            | —      | $0.55     | 📹 in 🔓       |
+| gemma-4-e2b-it                                       | vultr            | —      | $0.55     | 📹 in 🔓       |
+| gemma-4-e4b-it                                       | vultr            | —      | $0.55     | 📹 in 🔓       |
+| mimo-v2-omni                                         | xiaomi           | —      | $0.4      | 📹 in 🔧       |
+| mimo-v2.5                                            | xiaomi           | —      | $0.4      | 📹 in 🔧       |
+
+> 💡 使用[交互式目录](https://i-need-token.github.io/ai-models/)搜索和筛选更多条件的模型。
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
+
+## 相关文档
+
+- [音频模型](audio-models.md) — 118 个音频输入 + 34 个音频输出模型
+- [视觉模型](vision-models.md) — 1,487 个视觉模型
+- [图像生成](image-generation.md) — 28 个图像生成模型
+- [模态矩阵](modality-matrix.md) — 所有模态一览
+- [模型选择指南](model-selection.md) — 决策框架
diff --git a/docs/zh/vision-models.md b/docs/zh/vision-models.md
new file mode 100644
index 00000000..d84f9bb3
--- /dev/null
+++ b/docs/zh/vision-models.md
@@ -0,0 +1,101 @@
+[English](../vision-models.md) | **中文**
+
+# AI 视觉模型
+
+本目录中有 1,487 个模型接受图像输入（视觉）。本页重点介绍图像理解、文档分析和视觉推理最有能力和最具性价比的模型。
+
+> 所有数据来自一手 API 和文档。"视觉"表示模型接受图像输入；图像生成是独立的能力。
+
+## 快速统计
+
+| 能力         | 视觉模型数 |
+| ------------ | ---------: |
+| 总视觉模型   |      1,487 |
+| 唯一模型 ID  |        930 |
+| 支持工具调用 |      1,063 |
+| 支持推理     |        697 |
+| 开源权重     |        104 |
+
+## 最便宜的视觉模型
+
+图像理解的最佳性价比：
+
+| 模型                  | 提供商      | 输入 $/1M | 输出 $/1M | 上下文 | 工具调用 | 推理 |
+| --------------------- | ----------- | --------: | --------: | ------ | -------- | ---- |
+| Qwen 3.5 0.8B         | Auriko      |     $0.01 |     $0.05 | 262K   | ✅       | ✅   |
+| Qwen 3.5 0.8B         | DeepInfra   |     $0.01 |     $0.05 | 262K   | ✅       | ✅   |
+| Qwen 3.5 2B           | Auriko      |     $0.02 |     $0.10 | 262K   | ✅       | ✅   |
+| Qwen 3.5 2B           | DeepInfra   |     $0.02 |     $0.10 | 262K   | ✅       | ✅   |
+| Qwen 3.5 4B           | Auriko      |     $0.03 |     $0.15 | 262K   | ✅       | ✅   |
+| Qwen 3.5 4B           | DeepInfra   |     $0.03 |     $0.15 | 262K   | ✅       | ✅   |
+| Gemini 2.5 Flash Lite | Google      |     $0.10 |     $0.60 | 1M     | ✅       | ✅   |
+| Gemini 2.5 Flash      | Google      |     $0.15 |     $0.60 | 1M     | ✅       | ✅   |
+| Llama 4 Maverick      | Together AI |     $0.15 |     $0.60 | 1M     | ✅       | ❌   |
+| Grok 4 Fast Reasoning | xAI         |     $0.20 |     $0.50 | 2M     | ✅       | ✅   |
+
+## 最大上下文视觉模型
+
+适合分析大型文档、多页 PDF 或长图像序列：
+
+| 模型                  | 上下文 | 输入 $/1M | 工具调用 | 推理 | 提供商数 |
+| --------------------- | ------ | --------: | -------- | ---- | -------: |
+| Llama 4 Scout         | 10M    |     $0.08 | ✅       | ❌   |        4 |
+| Grok 4 Fast Reasoning | 2M     |     $0.20 | ✅       | ✅   |        2 |
+| GPT-5.4               | 1M     |     $2.50 | ✅       | ✅   |        4 |
+| Gemini 2.5 Pro        | 1M     |     $1.25 | ✅       | ✅   |        4 |
+| Gemini 2.5 Flash      | 1M     |     $0.15 | ✅       | ✅   |        3 |
+| DeepSeek Reasoner     | 1M     |     $0.43 | ✅       | ✅   |        1 |
+| GPT-4.1               | 1M     |     $2.00 | ✅       | ❌   |        4 |
+| Llama 4 Maverick      | 1M     |     $0.15 | ✅       | ❌   |        3 |
+
+## 最佳视觉 + 工具调用 + 推理
+
+最有能力的视觉模型 — 能看、能推理、能行动：
+
+| 模型                  | 上下文 | 输入 $/1M | 提供商数 |
+| --------------------- | ------ | --------: | -------: |
+| Grok 4 Fast Reasoning | 2M     |     $0.20 |        2 |
+| Gemini 2.5 Flash      | 1M     |     $0.15 |        3 |
+| Gemini 2.5 Pro        | 1M     |     $1.25 |        4 |
+| GPT-5.4               | 1M     |     $2.50 |        4 |
+| DeepSeek Reasoner     | 1M     |     $0.43 |        1 |
+| MiMo V2.5（开源权重） | 1M     |    varies |        2 |
+| Kimi K2.6（开源权重） | 262K   |    varies |        4 |
+
+## 开源权重视觉模型
+
+104 个开源权重模型接受图像输入 — 在自己的硬件上运行视觉 AI：
+
+| 模型               | 上下文 | 工具调用 | 推理 | 提供商数 |
+| ------------------ | ------ | -------- | ---- | -------: |
+| MiMo V2.5          | 1M     | ✅       | ✅   |        2 |
+| Llama 4 Maverick   | 1M     | ✅       | ❌   |        3 |
+| Llama 4 Scout      | 10M    | ✅       | ❌   |        2 |
+| Gemma 4 31B IT     | 1M     | ✅       | ❌   |        3 |
+| Qwen3.5 Flash      | 1M     | ✅       | ❌   |        1 |
+| Kimi K2.6          | 262K   | ✅       | ✅   |        4 |
+| Gemma 4 26B A4B IT | 262K   | ✅       | ✅   |        3 |
+| Llama 4 Scout 17B  | 328K   | ✅       | ❌   |        4 |
+
+## 要点总结
+
+- **1,487 个视觉模型**，涵盖 930 个唯一模型 ID — 最大的视觉模型目录
+- **Gemini 2.5 Flash** 是最佳性价比：1M 上下文、视觉、工具调用和推理，仅 $0.15/1M
+- **Llama 4 Scout** 拥有最大的视觉上下文窗口（10M tokens）
+- **Grok 4 Fast Reasoning** 是唯一结合 2M 上下文、视觉、工具调用和推理的模型
+- **104 个开源权重视觉模型** — 在自己的基础设施上运行视觉 AI
+- 小型视觉模型（Qwen 3.5 0.8B–4B）每 1M tokens 仅需 $0.01–$0.03
+
+## 相关文档
+
+- [模型选择指南](model-selection.md) — 选择模型的决策框架
+- [图像生成](image-generation.md) — 28 个图像生成模型
+- [视频模型](video-models.md) — 167 个视频输入/输出模型
+- [模态矩阵](modality-matrix.md) — 所有模态一览
+- [免费 AI 模型](free-models.md) — 81 个免费模型，部分支持视觉
+- [OpenAI 替代方案](openai-alternatives.md) — GPT-4 级别视觉替代
+- [音频模型](audio-models.md) — 118 个音频输入 + 34 个音频输出模型
+
+---
+
+数据来源于 [AI Models Catalog](https://github.com/i-need-token/ai-models) — 结构化 YAML，包含 95 个提供商 4,587+ 模型的定价、上下文窗口和能力信息。
diff --git a/llms-full.txt b/llms-full.txt
new file mode 100644
index 00000000..42ba2b78
--- /dev/null
+++ b/llms-full.txt
@@ -0,0 +1,420 @@
+# AI Models Catalog
+
+> Structured YAML catalog of 4,587 AI models across 95 providers — pricing, context windows, modalities, capabilities. First-party data only. npm package available.
+
+## What is this?
+
+A machine-readable YAML catalog of every major AI model provider and their models. Every data point comes from the provider's own API or documentation, never third-party aggregators.
+
+## Key Stats
+
+- 95 providers
+- 4,587 model files
+- 2,712 unique model IDs
+- 441 model families
+- 1,306 reasoning models
+- 2,350 tool-calling models
+- 527 open-weight models
+- 81 free models
+- 1,487 vision models
+- 829 structured output models
+- 28 image generation models
+- 118 audio input models
+- 167 video input models
+
+## Install
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 models as JSON
+import type { Model } from "ai-models"; // TypeScript types
+```
+
+## Download
+
+```bash
+# JSON — full metadata (2.3 MB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — flat table for Excel/Google Sheets (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+
+# CDN (no install, CORS-enabled, always up-to-date)
+curl -s https://cdn.jsdelivr.net/npm/ai-models@latest/models.json | jq '.models | length'
+```
+
+## Data Format
+
+Each model is a single YAML file at `providers/<provider>/models/<model-id>.yaml`:
+
+```yaml
+id: gpt-4.1
+name: GPT-4.1
+family: gpt-4.1
+tool_call: true
+structured_output: true
+pricing:
+  input: 2.0
+  output: 8.0
+  cache_read: 0.5
+limit:
+  context: 1047576
+  output: 32768
+modalities:
+  input: [text, image]
+  output: [text]
+release_date: "2026-05-18"
+last_updated: "2026-05-18"
+```
+
+## Pricing Types
+
+| Type           | When                      | Example                         |
+| -------------- | ------------------------- | ------------------------------- |
+| `TokenPricing` | Per-million-token pricing | `input: 2.5, output: 10`        |
+| `VideoPricing` | Per-second pricing        | `unit: per_second, price: 0.03` |
+| `UnitPricing`  | Per-image or per-request  | `unit: per_image, price: 0.04`  |
+| `FreePricing`  | No cost                   | `unit: free`                    |
+
+## Covered Providers
+
+OpenAI, Anthropic, Google, Meta, DeepSeek, Alibaba Cloud, Mistral, xAI, Cohere, NVIDIA, IBM, Microsoft, Amazon Bedrock, Azure OpenAI, Google Vertex AI, OpenRouter, Together AI, Fireworks AI, Groq, Cerebras, DeepInfra, SiliconFlow, Novita AI, SambaNova, Cloudflare Workers AI, Chutes, Kluster AI, NanoGPT, and 75+ more.
+
+Full list: 01.AI, 302.AI, AI21 Labs, AIHubMix, AI/ML API, Aion Labs, Alibaba Cloud, Amazon Bedrock, Amazon Nova, Anthropic, Arcee AI, Auriko, Azure OpenAI, Baichuan AI, Baidu, Baseten, Berget, ByteDance, Cerebras, Chutes, Clarifai, CloudFerro Sherlock, Cloudflare Workers AI, Cohere, Cortecs, DInference, Databricks, DeepInfra, DeepSeek, DigitalOcean, evroc, FastRouter, Fireworks AI, FriendliAI, GMI Cloud, Google, Google Vertex AI, Groq, HPC-AI Cloud, Hyperbolic, IBM Granite, iFlytek SparkDesk, Inception Labs, InclusionAI, Inference.net, Kluster AI, LLM Gateway, Martian, MegaNova, Meta Llama, Microsoft Phi, MiniMax, Mistral AI, Mixlayer, MoArk AI, Moonshot AI, Morph, NanoGPT, Nebius, NeuralWatt, Nous Research, Novita AI, NVIDIA, OpenAI, OpenRouter, OrcaRouter, OVHcloud, PPIO, Perplexity, Privatemode AI, Qiniu AI, Regolo, Reka AI, Requesty, SambaNova, Sarvam AI, Scaleway, SiliconFlow, SiliconFlow CN, StepFun, SubModel, Tencent Cloud TokenHub, Tencent Hunyuan, TextSynth, Together AI, Upstage, Venice AI, Voyage AI, Vultr, Wafer, Writer, xAI Grok, Xiaomi, Zhipu AI, 接口 AI
+
+## Data Schema
+
+### Model Schema (Required Fields)
+
+| Field          | Type    | Description                              | Example                                    |
+| -------------- | ------- | ---------------------------------------- | ------------------------------------------ |
+| `id`           | string  | Stable model ID (no date suffix)         | `gpt-4o`, `claude-sonnet-4-5`              |
+| `name`         | string  | Display name                             | `GPT-4o`, `Claude Sonnet 4.5`              |
+| `family`       | string  | Model family (broad lineage)             | `gpt-4o`, `claude-sonnet`                  |
+| `pricing`      | Pricing | Model pricing (see below)                | —                                          |
+| `modalities`   | object  | Input/output modalities                  | `{ input: [text, image], output: [text] }` |
+| `last_updated` | string  | Last data update (YYYY-MM-DD or YYYY-MM) | `2024-08-06`                               |
+
+### Model Schema (Optional Fields)
+
+| Field               | Type    | Default | Description                      | Example                              |
+| ------------------- | ------- | ------- | -------------------------------- | ------------------------------------ |
+| `reasoning`         | boolean | `false` | Supports reasoning/thinking mode | `true`                               |
+| `temperature`       | boolean | `true`  | Supports temperature parameter   | `false`                              |
+| `tool_call`         | boolean | `false` | Supports tool/function calling   | `true`                               |
+| `attachment`        | boolean | `false` | Supports file attachments        | `true`                               |
+| `structured_output` | boolean | `false` | Supports structured/JSON output  | `true`                               |
+| `open_weights`      | boolean | `false` | Open-weight model                | `true`                               |
+| `deprecated`        | boolean | `false` | Deprecated but still accessible  | `true`                               |
+| `limit`             | object  | —       | Token limits                     | `{ context: 128000, output: 16384 }` |
+| `knowledge`         | string  | —       | Training data cutoff             | `2023-10`                            |
+| `release_date`      | string  | —       | Model release date               | `2024-05-13`                         |
+| `snapshots`         | array   | —       | Dated model versions             | See below                            |
+
+### Modality Types
+
+| Modality | Description           |
+| -------- | --------------------- |
+| `text`   | Text input or output  |
+| `image`  | Image input or output |
+| `video`  | Video input           |
+| `audio`  | Audio input or output |
+| `pdf`    | PDF document input    |
+
+### Pricing Schema
+
+Pricing is a union of four types:
+
+**TokenPricing** (most common — per-million-token pricing):
+
+```yaml
+pricing:
+  input: 2.5    # $/M input tokens
+  output: 10    # $/M output tokens
+  cache_write: 1.25  # optional
+  cache_read: 0.625  # optional
+```
+
+**VideoPricing** (per-second, optionally tiered by resolution):
+
+```yaml
+pricing:
+  unit: per_second
+  price: 0.03
+```
+
+**UnitPricing** (per-image or per-request):
+
+```yaml
+pricing:
+  unit: per_image
+  price: 0.04
+```
+
+**FreePricing** (no cost):
+
+```yaml
+pricing:
+  unit: free
+```
+
+### Snapshot Schema
+
+Snapshots represent dated versions of a model. They inherit all parent fields and only override what differs:
+
+```yaml
+id: gpt-4o
+name: GPT-4o
+snapshots:
+  - id: gpt-4o-2024-08-06
+    last_updated: "2024-08-06"
+  - id: gpt-4o-2024-05-13
+    deprecated: true
+    last_updated: "2024-05-13"
+```
+
+### Provider Schema
+
+Each provider has a `provider.yaml` file:
+
+| Field            | Type   | Required | Description                          | Example                            |
+| ---------------- | ------ | -------- | ------------------------------------ | ---------------------------------- |
+| `id`             | string | ✅       | Provider ID (matches directory name) | `openai`                           |
+| `name`           | string | ✅       | Display name                         | `OpenAI`                           |
+| `url`            | string | ✅       | Official website URL                 | `https://openai.com`               |
+| `api_docs`       | string | ❌       | API documentation URL                | `https://platform.openai.com/docs` |
+| `apis`           | object | ✅       | API endpoints keyed by format        | See below                          |
+| `apis.openai`    | string | ❌       | OpenAI-compatible API endpoint       | `https://api.openai.com/v1`        |
+| `apis.anthropic` | string | ❌       | Anthropic API endpoint               | —                                  |
+| `apis.google`    | string | ❌       | Google AI API endpoint               | —                                  |
+| `currency`       | string | ❌       | Default currency (USD/CNY/EUR)       | `USD`                              |
+
+## Quick Start
+
+### Find the cheapest model
+
+→ See [Pricing Comparison](docs/pricing-comparison.md)
+
+**Cheapest models with tool calling:**
+
+| Model            | Provider      | Input (per 1M tokens) | Output (per 1M tokens) |
+| ---------------- | ------------- | --------------------: | ---------------------: |
+| DeepSeek-V3      | DeepSeek      |                 $0.27 |                  $1.10 |
+| Qwen3-235B-A22B  | Alibaba Cloud |                 $0.14 |                  $0.42 |
+| Llama 4 Maverick | Together AI   |                 $0.20 |                  $0.80 |
+
+### Find the most capable model
+
+→ See [Model Comparison](docs/model-comparison.md)
+
+**Top-tier flagships:**
+
+| Model          | Context | Tool Call | Vision | Input $/1M | Output $/1M |
+| -------------- | ------- | --------- | ------ | ---------: | ----------: |
+| GPT-4.1        | 1M      | ✅        | ✅     |      $2.00 |       $8.00 |
+| Claude Opus 4  | 200K    | ✅        | ✅     |     $15.00 |      $75.00 |
+| Gemini 2.5 Pro | 1M      | ✅        | ✅     |      $1.25 |      $10.00 |
+
+### Find a free model
+
+→ See [Free AI Models](docs/free-models.md)
+
+- Google Gemini 2.0 Flash (1M context, tool calling, vision, reasoning)
+- 70+ models on Chutes (Llama 4, Qwen3, DeepSeek-R1, etc.)
+
+### Find the largest context window
+
+→ See [Context Window Comparison](docs/context-windows.md)
+
+| Model           | Context Window |
+| --------------- | -------------: |
+| Llama 4 Scout   |     10M tokens |
+| Gemini 2.5 Pro  |      1M tokens |
+| GPT-4.1         |     ~1M tokens |
+
+## Programmatic Access
+
+### npm package
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 models as JSON
+import type { Model } from "ai-models"; // TypeScript types
+
+// Find models with tool calling under $1/1M input
+const affordable = catalog.models.filter((m) => m.tool_call && m.pricing.input < 1);
+```
+
+### Download data files
+
+```bash
+# JSON — full metadata (2.3 MB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — flat table for Excel/Google Sheets (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+```
+
+### Python usage
+
+```python
+import json
+
+with open("models.json") as f:
+    catalog = json.load(f)
+
+# Find all reasoning models
+reasoning = [m for m in catalog["models"] if m.get("reasoning")]
+
+# Find models with largest context windows
+by_context = sorted(
+    catalog["models"],
+    key=lambda m: (m.get("limit", {}) or {}).get("context", 0),
+    reverse=True,
+)[:10]
+```
+
+### JSON structure
+
+```json
+{
+  "generated_at": "2026-05-21T02:13:04.076Z",
+  "stats": {
+    "providers": 95,
+    "models": 4587,
+    "unique_model_ids": 2712,
+    "families": 441
+  },
+  "providers": {
+    "openai": { "name": "OpenAI", "model_count": 28 },
+    "anthropic": { "name": "Anthropic", "model_count": 11 }
+  },
+  "models": [
+    {
+      "id": "gpt-4.1",
+      "name": "GPT-4.1",
+      "family": "gpt-4.1",
+      "provider": "openai",
+      "tool_call": true,
+      "structured_output": true,
+      "pricing": { "input": 2, "output": 8, "cache_read": 0.5 },
+      "limit": { "context": 1047576, "output": 32768 },
+      "modalities": { "input": ["text", "image"], "output": ["text"] }
+    }
+  ]
+}
+```
+
+## Documentation
+
+- [Quick Start](docs/quick-start.md) — find the right model in 30 seconds
+- [Model Selection Guide](docs/model-selection.md) — decision framework: free, best value, large context models
+- [Model Selection Cheatsheet](docs/model-selection-cheatsheet.md)
+- [AI Model Picker](docs/ai-model-picker.md) — quick-reference: best model by budget and use case
+- [Small Language Models Guide](docs/small-language-models.md) — 2,002 SLMs for edge, mobile, and cost-efficient production
+- [Benchmarks & Leaderboards](docs/benchmarks.md) — key benchmarks, leaderboard landscape, interpretation guide
+- [API & Programmatic Access](docs/api.md) — download models.json, code examples
+- [Code Examples](docs/code-examples.md) — practical examples in TypeScript, Python, Go, Rust, jq
+- [FAQ](docs/faq.md) — frequently asked questions about the catalog, data, and contributing
+- [Glossary](docs/glossary.md) — key terms and definitions for AI model terminology
+- [Model Comparison](docs/model-comparison.md) — flagship, cost-effective, free, open-weight
+- [Pricing Comparison](docs/pricing-comparison.md) — side-by-side pricing across providers
+- [Cached Pricing](docs/cached-pricing.md) — 1,374 models with prompt caching, 50-90% input cost savings
+- [Context Window Comparison](docs/context-windows.md) — largest context windows, best value
+- [Large Context Models](docs/large-context-models.md) — 2,195 models with 128K+ context, 397 with 1M+
+- [Small & Edge Models](docs/small-models.md) — 1,153 models under 10B params for on-device use
+- [Provider Comparison](docs/provider-comparison.md) — top 30 providers by model count and capabilities
+- [Migration Guide](docs/migration-guide.md) — switch providers with pricing, API compatibility, checklist
+- [OpenAI Alternatives](docs/openai-alternatives.md) — GPT-4/GPT-3.5 alternatives, free options, OpenAI-compatible providers
+- [Agentic Models](docs/agentic-models.md) — 1,080 models with tool_call + reasoning for AI agents
+- [Code Models](docs/code-models.md) — 189 code-focused models for generation, review, debugging
+- [Audio Models](docs/audio-models.md) — 118 audio input + 34 audio output models for speech/voice
+- [Free AI Models](docs/free-models.md) — 81 free models by capability
+- [Open-Weight Models](docs/open-weights.md) — 513 open-weight models
+- [Reasoning Models](docs/reasoning-models.md) — 1,306 reasoning models
+- [Tool Calling Models](docs/tool-calling.md) — 2,350 tool-calling models
+- [Vision Models](docs/vision-models.md) — 1,487 vision models
+- [Image Generation](docs/image-generation.md) — 28 image generation models
+- [Audio Models](docs/audio-models.md) — 118 audio input + 34 audio output models
+- [Code Models](docs/code-models.md) — 189 code-focused models across 41 providers
+- [Agentic Models](docs/agentic-models.md) — models with tool calling + reasoning for AI agents
+- [Chat Models](docs/chat-models.md) — 2,350 models with tool calling for chat applications
+- [Multimodal Models](docs/multimodal-models.md) — 1,519 models with image/audio/video input
+- [Embedding Models](docs/embedding-models.md) — 5 embedding models for search, RAG, similarity
+- [Video Models](docs/video-models.md) — 167 video input + 4 video output models
+- [Structured Output](docs/structured-output.md) — 829 JSON-mode models
+- [Modality Matrix](docs/modality-matrix.md) — vision, image gen, audio, video
+- [Provider Overview](docs/providers.md) — all 95 providers by type and market
+- [Data Schema Reference](docs/data-schema.md) — complete YAML schema
+- [Data Acquisition](docs/data-acquisition.md) — how we acquire and update data
+- [Design Principles](docs/lessons-learned.md) — lessons learned
+
+## Design Principles
+
+- **First-party data only** — all model data comes from the provider's own API or website
+- **Dynamic discovery** — scrape functions discover models from the source, not from hardcoded lists
+- **Include deprecated, exclude retired** — deprecated models are included with `deprecated: true`; retired (inaccessible) models are excluded
+- **Never fabricate data** — if required data is missing, skip the model with a warning rather than filling in guessed values
+- **YAML source format** — human-readable, supports comments, machine-parseable
+- **Snapshot inheritance** — dated model versions are nested within the parent model, inheriting all fields
+
+## Adding a New Provider
+
+1. Create `providers/<id>/scrape.ts` with a `scrape()` function that returns `{ provider, models }`
+2. Data must come from a first-party source (provider's API or website)
+3. Include a discovery step — no hardcoded model ID lists
+4. Run `npx tsx scripts/sync.ts <id>` to generate initial data
+5. Validate with `npx tsx scripts/validate.ts`
+
+## CLI Tools
+
+```bash
+# Validate all YAML data
+npx tsx scripts/validate.ts
+
+# Compute catalog statistics
+npx tsx scripts/stats.ts          # table format
+npx tsx scripts/stats.ts json     # JSON format
+
+# Compile to models.json
+npx tsx scripts/compile.ts
+
+# Sync data from providers
+npx tsx scripts/sync.ts openai    # single provider
+npx tsx scripts/sync.ts           # all providers
+
+# Export to CSV
+npx tsx scripts/export-csv.ts
+```
+## SEO Comparison Pages
+- Best AI Models: site/best-ai-models.html
+- Free AI Models: site/free-ai-models.html
+- LLM Pricing: site/llm-pricing.html
+- OpenAI Alternatives: site/openai-alternatives.html
+- AI Models by Provider: site/ai-models-by-provider.html
+- Context Window Comparison: site/context-window-comparison.html
+- Best AI Models for Coding: site/best-ai-models-for-coding.html
+- Best AI Models for Agents: site/best-ai-models-for-agents.html
+- Reasoning Models Comparison: site/reasoning-models-comparison.html
+- Cheapest AI Models: site/cheapest-ai-models.html
+- Tool Calling Models Comparison: site/tool-calling-models-comparison.html
+- AI Model Pricing Calculator: site/ai-model-pricing-calculator.html
+- Best AI Models for Image Generation: site/best-ai-models-for-image-generation.html
+- Best AI Models for Vision: site/best-ai-models-for-vision.html
+- Structured Output Models Comparison: site/structured-output-models-comparison.html
+- Open Source AI Models: site/open-source-ai-models.html
+- Multimodal AI Models: site/multimodal-ai-models.html
+- State of AI Models 2025: site/state-of-ai-models.html
+- AI Model Benchmarks Comparison: site/ai-model-benchmarks.html
+- ChatGPT vs Claude vs Gemini: site/chatgpt-vs-claude-vs-gemini.html
+- AI Model Comparison Chart: site/ai-model-comparison-chart.html
+- State of AI Models 2025: site/state-of-ai-models.html
+- AI Model Benchmarks Comparison: site/ai-model-benchmarks.html
+- ChatGPT vs Claude vs Gemini: site/chatgpt-vs-claude-vs-gemini.html
+- AI Model Comparison Chart: site/ai-model-comparison-chart.html
diff --git a/llms.txt b/llms.txt
new file mode 100644
index 00000000..c2411c39
--- /dev/null
+++ b/llms.txt
@@ -0,0 +1,416 @@
+# AI Models Catalog
+
+> Structured YAML catalog of 4,587 AI models across 95 providers — pricing, context windows, modalities, capabilities. First-party data only. npm package available.
+
+## What is this?
+
+A machine-readable YAML catalog of every major AI model provider and their models. Every data point comes from the provider's own API or documentation, never third-party aggregators.
+
+## Key Stats
+
+- 95 providers
+- 4,587 model files
+- 2,712 unique model IDs
+- 441 model families
+- 1,306 reasoning models
+- 2,350 tool-calling models
+- 527 open-weight models
+- 81 free models
+- 1,487 vision models
+- 829 structured output models
+- 28 image generation models
+- 118 audio input models
+- 167 video input models
+
+## Install
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 models as JSON
+import type { Model } from "ai-models"; // TypeScript types
+```
+
+## Download
+
+```bash
+# JSON — full metadata (2.3 MB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — flat table for Excel/Google Sheets (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+
+# CDN (no install, CORS-enabled, always up-to-date)
+curl -s https://cdn.jsdelivr.net/npm/ai-models@latest/models.json | jq '.models | length'
+```
+
+## Data Format
+
+Each model is a single YAML file at `providers/<provider>/models/<model-id>.yaml`:
+
+```yaml
+id: gpt-4.1
+name: GPT-4.1
+family: gpt-4.1
+tool_call: true
+structured_output: true
+pricing:
+  input: 2.0
+  output: 8.0
+  cache_read: 0.5
+limit:
+  context: 1047576
+  output: 32768
+modalities:
+  input: [text, image]
+  output: [text]
+release_date: "2026-05-18"
+last_updated: "2026-05-18"
+```
+
+## Pricing Types
+
+| Type           | When                      | Example                         |
+| -------------- | ------------------------- | ------------------------------- |
+| `TokenPricing` | Per-million-token pricing | `input: 2.5, output: 10`        |
+| `VideoPricing` | Per-second pricing        | `unit: per_second, price: 0.03` |
+| `UnitPricing`  | Per-image or per-request  | `unit: per_image, price: 0.04`  |
+| `FreePricing`  | No cost                   | `unit: free`                    |
+
+## Covered Providers
+
+OpenAI, Anthropic, Google, Meta, DeepSeek, Alibaba Cloud, Mistral, xAI, Cohere, NVIDIA, IBM, Microsoft, Amazon Bedrock, Azure OpenAI, Google Vertex AI, OpenRouter, Together AI, Fireworks AI, Groq, Cerebras, DeepInfra, SiliconFlow, Novita AI, SambaNova, Cloudflare Workers AI, Chutes, Kluster AI, NanoGPT, and 75+ more.
+
+Full list: 01.AI, 302.AI, AI21 Labs, AIHubMix, AI/ML API, Aion Labs, Alibaba Cloud, Amazon Bedrock, Amazon Nova, Anthropic, Arcee AI, Auriko, Azure OpenAI, Baichuan AI, Baidu, Baseten, Berget, ByteDance, Cerebras, Chutes, Clarifai, CloudFerro Sherlock, Cloudflare Workers AI, Cohere, Cortecs, DInference, Databricks, DeepInfra, DeepSeek, DigitalOcean, evroc, FastRouter, Fireworks AI, FriendliAI, GMI Cloud, Google, Google Vertex AI, Groq, HPC-AI Cloud, Hyperbolic, IBM Granite, iFlytek SparkDesk, Inception Labs, InclusionAI, Inference.net, Kluster AI, LLM Gateway, Martian, MegaNova, Meta Llama, Microsoft Phi, MiniMax, Mistral AI, Mixlayer, MoArk AI, Moonshot AI, Morph, NanoGPT, Nebius, NeuralWatt, Nous Research, Novita AI, NVIDIA, OpenAI, OpenRouter, OrcaRouter, OVHcloud, PPIO, Perplexity, Privatemode AI, Qiniu AI, Regolo, Reka AI, Requesty, SambaNova, Sarvam AI, Scaleway, SiliconFlow, SiliconFlow CN, StepFun, SubModel, Tencent Cloud TokenHub, Tencent Hunyuan, TextSynth, Together AI, Upstage, Venice AI, Voyage AI, Vultr, Wafer, Writer, xAI Grok, Xiaomi, Zhipu AI, 接口 AI
+
+## Data Schema
+
+### Model Schema (Required Fields)
+
+| Field          | Type    | Description                              | Example                                    |
+| -------------- | ------- | ---------------------------------------- | ------------------------------------------ |
+| `id`           | string  | Stable model ID (no date suffix)         | `gpt-4o`, `claude-sonnet-4-5`              |
+| `name`         | string  | Display name                             | `GPT-4o`, `Claude Sonnet 4.5`              |
+| `family`       | string  | Model family (broad lineage)             | `gpt-4o`, `claude-sonnet`                  |
+| `pricing`      | Pricing | Model pricing (see below)                | —                                          |
+| `modalities`   | object  | Input/output modalities                  | `{ input: [text, image], output: [text] }` |
+| `last_updated` | string  | Last data update (YYYY-MM-DD or YYYY-MM) | `2024-08-06`                               |
+
+### Model Schema (Optional Fields)
+
+| Field               | Type    | Default | Description                      | Example                              |
+| ------------------- | ------- | ------- | -------------------------------- | ------------------------------------ |
+| `reasoning`         | boolean | `false` | Supports reasoning/thinking mode | `true`                               |
+| `temperature`       | boolean | `true`  | Supports temperature parameter   | `false`                              |
+| `tool_call`         | boolean | `false` | Supports tool/function calling   | `true`                               |
+| `attachment`        | boolean | `false` | Supports file attachments        | `true`                               |
+| `structured_output` | boolean | `false` | Supports structured/JSON output  | `true`                               |
+| `open_weights`      | boolean | `false` | Open-weight model                | `true`                               |
+| `deprecated`        | boolean | `false` | Deprecated but still accessible  | `true`                               |
+| `limit`             | object  | —       | Token limits                     | `{ context: 128000, output: 16384 }` |
+| `knowledge`         | string  | —       | Training data cutoff             | `2023-10`                            |
+| `release_date`      | string  | —       | Model release date               | `2024-05-13`                         |
+| `snapshots`         | array   | —       | Dated model versions             | See below                            |
+
+### Modality Types
+
+| Modality | Description           |
+| -------- | --------------------- |
+| `text`   | Text input or output  |
+| `image`  | Image input or output |
+| `video`  | Video input           |
+| `audio`  | Audio input or output |
+| `pdf`    | PDF document input    |
+
+### Pricing Schema
+
+Pricing is a union of four types:
+
+**TokenPricing** (most common — per-million-token pricing):
+
+```yaml
+pricing:
+  input: 2.5    # $/M input tokens
+  output: 10    # $/M output tokens
+  cache_write: 1.25  # optional
+  cache_read: 0.625  # optional
+```
+
+**VideoPricing** (per-second, optionally tiered by resolution):
+
+```yaml
+pricing:
+  unit: per_second
+  price: 0.03
+```
+
+**UnitPricing** (per-image or per-request):
+
+```yaml
+pricing:
+  unit: per_image
+  price: 0.04
+```
+
+**FreePricing** (no cost):
+
+```yaml
+pricing:
+  unit: free
+```
+
+### Snapshot Schema
+
+Snapshots represent dated versions of a model. They inherit all parent fields and only override what differs:
+
+```yaml
+id: gpt-4o
+name: GPT-4o
+snapshots:
+  - id: gpt-4o-2024-08-06
+    last_updated: "2024-08-06"
+  - id: gpt-4o-2024-05-13
+    deprecated: true
+    last_updated: "2024-05-13"
+```
+
+### Provider Schema
+
+Each provider has a `provider.yaml` file:
+
+| Field            | Type   | Required | Description                          | Example                            |
+| ---------------- | ------ | -------- | ------------------------------------ | ---------------------------------- |
+| `id`             | string | ✅       | Provider ID (matches directory name) | `openai`                           |
+| `name`           | string | ✅       | Display name                         | `OpenAI`                           |
+| `url`            | string | ✅       | Official website URL                 | `https://openai.com`               |
+| `api_docs`       | string | ❌       | API documentation URL                | `https://platform.openai.com/docs` |
+| `apis`           | object | ✅       | API endpoints keyed by format        | See below                          |
+| `apis.openai`    | string | ❌       | OpenAI-compatible API endpoint       | `https://api.openai.com/v1`        |
+| `apis.anthropic` | string | ❌       | Anthropic API endpoint               | —                                  |
+| `apis.google`    | string | ❌       | Google AI API endpoint               | —                                  |
+| `currency`       | string | ❌       | Default currency (USD/CNY/EUR)       | `USD`                              |
+
+## Quick Start
+
+### Find the cheapest model
+
+→ See [Pricing Comparison](docs/pricing-comparison.md)
+
+**Cheapest models with tool calling:**
+
+| Model            | Provider      | Input (per 1M tokens) | Output (per 1M tokens) |
+| ---------------- | ------------- | --------------------: | ---------------------: |
+| DeepSeek-V3      | DeepSeek      |                 $0.27 |                  $1.10 |
+| Qwen3-235B-A22B  | Alibaba Cloud |                 $0.14 |                  $0.42 |
+| Llama 4 Maverick | Together AI   |                 $0.20 |                  $0.80 |
+
+### Find the most capable model
+
+→ See [Model Comparison](docs/model-comparison.md)
+
+**Top-tier flagships:**
+
+| Model          | Context | Tool Call | Vision | Input $/1M | Output $/1M |
+| -------------- | ------- | --------- | ------ | ---------: | ----------: |
+| GPT-4.1        | 1M      | ✅        | ✅     |      $2.00 |       $8.00 |
+| Claude Opus 4  | 200K    | ✅        | ✅     |     $15.00 |      $75.00 |
+| Gemini 2.5 Pro | 1M      | ✅        | ✅     |      $1.25 |      $10.00 |
+
+### Find a free model
+
+→ See [Free AI Models](docs/free-models.md)
+
+- Google Gemini 2.0 Flash (1M context, tool calling, vision, reasoning)
+- 70+ models on Chutes (Llama 4, Qwen3, DeepSeek-R1, etc.)
+
+### Find the largest context window
+
+→ See [Context Window Comparison](docs/context-windows.md)
+
+| Model           | Context Window |
+| --------------- | -------------: |
+| Llama 4 Scout   |     10M tokens |
+| Gemini 2.5 Pro  |      1M tokens |
+| GPT-4.1         |     ~1M tokens |
+
+## Programmatic Access
+
+### npm package
+
+```bash
+npm install ai-models
+```
+
+```typescript
+import catalog from "ai-models"; // 4,587 models as JSON
+import type { Model } from "ai-models"; // TypeScript types
+
+// Find models with tool calling under $1/1M input
+const affordable = catalog.models.filter((m) => m.tool_call && m.pricing.input < 1);
+```
+
+### Download data files
+
+```bash
+# JSON — full metadata (2.3 MB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.json
+
+# CSV — flat table for Excel/Google Sheets (560 KB)
+curl -LO https://github.com/i-need-token/ai-models/releases/latest/download/models.csv
+```
+
+### Python usage
+
+```python
+import json
+
+with open("models.json") as f:
+    catalog = json.load(f)
+
+# Find all reasoning models
+reasoning = [m for m in catalog["models"] if m.get("reasoning")]
+
+# Find models with largest context windows
+by_context = sorted(
+    catalog["models"],
+    key=lambda m: (m.get("limit", {}) or {}).get("context", 0),
+    reverse=True,
+)[:10]
+```
+
+### JSON structure
+
+```json
+{
+  "generated_at": "2026-05-21T02:13:04.076Z",
+  "stats": {
+    "providers": 95,
+    "models": 4587,
+    "unique_model_ids": 2712,
+    "families": 441
+  },
+  "providers": {
+    "openai": { "name": "OpenAI", "model_count": 28 },
+    "anthropic": { "name": "Anthropic", "model_count": 11 }
+  },
+  "models": [
+    {
+      "id": "gpt-4.1",
+      "name": "GPT-4.1",
+      "family": "gpt-4.1",
+      "provider": "openai",
+      "tool_call": true,
+      "structured_output": true,
+      "pricing": { "input": 2, "output": 8, "cache_read": 0.5 },
+      "limit": { "context": 1047576, "output": 32768 },
+      "modalities": { "input": ["text", "image"], "output": ["text"] }
+    }
+  ]
+}
+```
+
+## Documentation
+
+- [Quick Start](docs/quick-start.md) — find the right model in 30 seconds
+- [Model Selection Guide](docs/model-selection.md) — decision framework: free, best value, large context models
+- [Model Selection Cheatsheet](docs/model-selection-cheatsheet.md)
+- [AI Model Picker](docs/ai-model-picker.md) — quick-reference: best model by budget and use case
+- [Small Language Models Guide](docs/small-language-models.md) — 2,002 SLMs for edge, mobile, and cost-efficient production
+- [Benchmarks & Leaderboards](docs/benchmarks.md) — key benchmarks, leaderboard landscape, interpretation guide
+- [API & Programmatic Access](docs/api.md) — download models.json, code examples
+- [Code Examples](docs/code-examples.md) — practical examples in TypeScript, Python, Go, Rust, jq
+- [FAQ](docs/faq.md) — frequently asked questions about the catalog, data, and contributing
+- [Glossary](docs/glossary.md) — key terms and definitions for AI model terminology
+- [Model Comparison](docs/model-comparison.md) — flagship, cost-effective, free, open-weight
+- [Pricing Comparison](docs/pricing-comparison.md) — side-by-side pricing across providers
+- [Cached Pricing](docs/cached-pricing.md) — 1,374 models with prompt caching, 50-90% input cost savings
+- [Context Window Comparison](docs/context-windows.md) — largest context windows, best value
+- [Large Context Models](docs/large-context-models.md) — 2,195 models with 128K+ context, 397 with 1M+
+- [Small & Edge Models](docs/small-models.md) — 1,153 models under 10B params for on-device use
+- [Provider Comparison](docs/provider-comparison.md) — top 30 providers by model count and capabilities
+- [Migration Guide](docs/migration-guide.md) — switch providers with pricing, API compatibility, checklist
+- [OpenAI Alternatives](docs/openai-alternatives.md) — GPT-4/GPT-3.5 alternatives, free options, OpenAI-compatible providers
+- [Agentic Models](docs/agentic-models.md) — 1,080 models with tool_call + reasoning for AI agents
+- [Code Models](docs/code-models.md) — 189 code-focused models for generation, review, debugging
+- [Audio Models](docs/audio-models.md) — 118 audio input + 34 audio output models for speech/voice
+- [Free AI Models](docs/free-models.md) — 81 free models by capability
+- [Open-Weight Models](docs/open-weights.md) — 513 open-weight models
+- [Reasoning Models](docs/reasoning-models.md) — 1,306 reasoning models
+- [Tool Calling Models](docs/tool-calling.md) — 2,350 tool-calling models
+- [Vision Models](docs/vision-models.md) — 1,487 vision models
+- [Image Generation](docs/image-generation.md) — 28 image generation models
+- [Audio Models](docs/audio-models.md) — 118 audio input + 34 audio output models
+- [Code Models](docs/code-models.md) — 189 code-focused models across 41 providers
+- [Agentic Models](docs/agentic-models.md) — models with tool calling + reasoning for AI agents
+- [Chat Models](docs/chat-models.md) — 2,350 models with tool calling for chat applications
+- [Multimodal Models](docs/multimodal-models.md) — 1,519 models with image/audio/video input
+- [Embedding Models](docs/embedding-models.md) — 5 embedding models for search, RAG, similarity
+- [Video Models](docs/video-models.md) — 167 video input + 4 video output models
+- [Structured Output](docs/structured-output.md) — 829 JSON-mode models
+- [Modality Matrix](docs/modality-matrix.md) — vision, image gen, audio, video
+- [Provider Overview](docs/providers.md) — all 95 providers by type and market
+- [Data Schema Reference](docs/data-schema.md) — complete YAML schema
+- [Data Acquisition](docs/data-acquisition.md) — how we acquire and update data
+- [Design Principles](docs/lessons-learned.md) — lessons learned
+
+## Design Principles
+
+- **First-party data only** — all model data comes from the provider's own API or website
+- **Dynamic discovery** — scrape functions discover models from the source, not from hardcoded lists
+- **Include deprecated, exclude retired** — deprecated models are included with `deprecated: true`; retired (inaccessible) models are excluded
+- **Never fabricate data** — if required data is missing, skip the model with a warning rather than filling in guessed values
+- **YAML source format** — human-readable, supports comments, machine-parseable
+- **Snapshot inheritance** — dated model versions are nested within the parent model, inheriting all fields
+
+## Adding a New Provider
+
+1. Create `providers/<id>/scrape.ts` with a `scrape()` function that returns `{ provider, models }`
+2. Data must come from a first-party source (provider's API or website)
+3. Include a discovery step — no hardcoded model ID lists
+4. Run `npx tsx scripts/sync.ts <id>` to generate initial data
+5. Validate with `npx tsx scripts/validate.ts`
+
+## CLI Tools
+
+```bash
+# Validate all YAML data
+npx tsx scripts/validate.ts
+
+# Compute catalog statistics
+npx tsx scripts/stats.ts          # table format
+npx tsx scripts/stats.ts json     # JSON format
+
+# Compile to models.json
+npx tsx scripts/compile.ts
+
+# Sync data from providers
+npx tsx scripts/sync.ts openai    # single provider
+npx tsx scripts/sync.ts           # all providers
+
+# Export to CSV
+npx tsx scripts/export-csv.ts
+```
+## SEO Comparison Pages
+- Best AI Models: site/best-ai-models.html
+- Free AI Models: site/free-ai-models.html
+- LLM Pricing: site/llm-pricing.html
+- OpenAI Alternatives: site/openai-alternatives.html
+- AI Models by Provider: site/ai-models-by-provider.html
+- Context Window Comparison: site/context-window-comparison.html
+- Best AI Models for Coding: site/best-ai-models-for-coding.html
+- Best AI Models for Agents: site/best-ai-models-for-agents.html
+- Reasoning Models Comparison: site/reasoning-models-comparison.html
+- Cheapest AI Models: site/cheapest-ai-models.html
+- Tool Calling Models Comparison: site/tool-calling-models-comparison.html
+- AI Model Pricing Calculator: site/ai-model-pricing-calculator.html
+- Best AI Models for Image Generation: site/best-ai-models-for-image-generation.html
+- Best AI Models for Vision: site/best-ai-models-for-vision.html
+- Structured Output Models Comparison: site/structured-output-models-comparison.html
+- Open Source AI Models: site/open-source-ai-models.html
+- Multimodal AI Models: site/multimodal-ai-models.html
+- State of AI Models 2025: site/state-of-ai-models.html
+- AI Model Benchmarks Comparison: site/ai-model-benchmarks.html
+- ChatGPT vs Claude vs Gemini: site/chatgpt-vs-claude-vs-gemini.html
+- AI Model Comparison Chart: site/ai-model-comparison-chart.html
diff --git a/package-lock.json b/package-lock.json
index 6a9b3687..7be227c6 100644
--- a/package-lock.json
+++ b/package-lock.json
@@ -1,30 +1,30 @@
 {
   "name": "ai-models",
-  "version": "0.1.0",
+  "version": "0.2.2",
   "lockfileVersion": 3,
   "requires": true,
   "packages": {
     "": {
       "name": "ai-models",
-      "version": "0.1.0",
+      "version": "0.2.2",
       "license": "MIT",
       "dependencies": {
         "linkedom": "^0.18.12",
-        "yaml": "^2.7.0",
+        "yaml": "^2.9.0",
         "zod": "^3.24.0"
       },
       "devDependencies": {
-        "@types/node": "^25.6.0",
+        "@types/node": "^25.9.1",
         "husky": "^9.1.7",
-        "oxfmt": "^0.48.0",
-        "oxlint": "^1.63.0",
-        "typescript": "^5.7.0"
+        "oxfmt": "^0.51.0",
+        "oxlint": "^1.66.0",
+        "typescript": "^6.0.3"
       }
     },
     "node_modules/@oxfmt/binding-android-arm-eabi": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-android-arm-eabi/-/binding-android-arm-eabi-0.48.0.tgz",
-      "integrity": "sha512-uwqk+/KhQvBIpULD8SMM/zAafMRC/+DV/xsEQjkkIsJ/kLmEI/2bxonVowcYTiXqqZ/a0FEW8DPkZY3VvwELDA==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-android-arm-eabi/-/binding-android-arm-eabi-0.51.0.tgz",
+      "integrity": "sha512-Ni0sCqg5CIHaLIYFGj+ncbcumylvNC6FE4rfD0KfdmnWHbPJ+zev0qZCXKxy2hFVa0fYRK0yPzf5nzPbkZou7g==",
       "cpu": [
         "arm"
       ],
@@ -39,9 +39,9 @@
       }
     },
     "node_modules/@oxfmt/binding-android-arm64": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-android-arm64/-/binding-android-arm64-0.48.0.tgz",
-      "integrity": "sha512-VUCiKuXK5+McVssgHEJdrcGK7hRJzrRb36zm9/jwzMholyYt4BgXhw5Nm1V1DX6Ce717Zi/1jk432b/tgmQgtQ==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-android-arm64/-/binding-android-arm64-0.51.0.tgz",
+      "integrity": "sha512-eu5lAZjuo0KAkp+M24EhDqfOwA8owQ8d7wyBlOUUGRbDLHpU3IRlDHp8Dif+YqGlxs6jra7yS6WQu/NkPhAxeg==",
       "cpu": [
         "arm64"
       ],
@@ -56,9 +56,9 @@
       }
     },
     "node_modules/@oxfmt/binding-darwin-arm64": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-darwin-arm64/-/binding-darwin-arm64-0.48.0.tgz",
-      "integrity": "sha512-IkKp8rnIyQLW6Jt+6jragCbUVYSayk55lapiprLjIVvt4NczLyO/nwX2GgefLQ5iaBdfS8UEAFgCs/pLO6Cl0w==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-darwin-arm64/-/binding-darwin-arm64-0.51.0.tgz",
+      "integrity": "sha512-6LsUNIdURhhcIfIn8+xsOb61mSTa9msAHTeSGx9Jf4rsP/gN8PGCF+SKWPAQZbND2w/WBkqQ6303jqEEIXzMdQ==",
       "cpu": [
         "arm64"
       ],
@@ -73,9 +73,9 @@
       }
     },
     "node_modules/@oxfmt/binding-darwin-x64": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-darwin-x64/-/binding-darwin-x64-0.48.0.tgz",
-      "integrity": "sha512-+aFuhsGIuvnoOjXyKVHMhPKJZR1kQkAl8QyrKoMlA7yJsSTC3N0Asl53La8TChSHhW8epToQ/Q0nvLmEmfNmLg==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-darwin-x64/-/binding-darwin-x64-0.51.0.tgz",
+      "integrity": "sha512-9aUMGmVxdHjYMsEAW1tNRoieTJXlVNDFkRvIR1J7LttJXWjVYCu2ekclLij2KJtxBxSQOYSHd12ME/adVGVbZg==",
       "cpu": [
         "x64"
       ],
@@ -90,9 +90,9 @@
       }
     },
     "node_modules/@oxfmt/binding-freebsd-x64": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-freebsd-x64/-/binding-freebsd-x64-0.48.0.tgz",
-      "integrity": "sha512-fbqzQL8FjI9gGnktI7RIo0dksDziTAYBy7xlI7jU7eID5fxLF/25fS4Xj6GydD8Y5oWHL83U4NK160QaOAxtyg==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-freebsd-x64/-/binding-freebsd-x64-0.51.0.tgz",
+      "integrity": "sha512-mkY1nhZTqYb+NHaAWxOCKISN6FwdrwMNsu17vTUA3wzUV2VJ+Paq15ZokRcsMU/2PUdHO73prxyeJpjXQ3MPpQ==",
       "cpu": [
         "x64"
       ],
@@ -107,9 +107,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-arm-gnueabihf": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm-gnueabihf/-/binding-linux-arm-gnueabihf-0.48.0.tgz",
-      "integrity": "sha512-hn4i0zhAyTiB3ZHjQfYUZkDvrbVkohw1S7pySWxWUoZ87HnkDoTFThj7QTxk40hNPOTUP0vHbPRNamFIv1HBJQ==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm-gnueabihf/-/binding-linux-arm-gnueabihf-0.51.0.tgz",
+      "integrity": "sha512-wtFwNwE4+YCNuPaWoGDZeGsKvD6D1YSUNBJNn/rJBh7CrDBThFE+TBI5kY7vRW9rIOQRsbW2IpyyL3Du4Zqwiw==",
       "cpu": [
         "arm"
       ],
@@ -124,9 +124,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-arm-musleabihf": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm-musleabihf/-/binding-linux-arm-musleabihf-0.48.0.tgz",
-      "integrity": "sha512-R4WBD9qF3QM9hqgdAa+fBGXmquTvDUujrPQ36t2Sjk8RPOSKGHDeN7l/khr10hqbQaOq9KCgPHG9ubNET/X/RQ==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm-musleabihf/-/binding-linux-arm-musleabihf-0.51.0.tgz",
+      "integrity": "sha512-rnOaNx86G7iRKM6lsCIQMux0SMGNC/TEbFR+r7lpruJ12bnrIWgxd5w1PLqOvgR9r8ZJbpK/zfRKctJnh8/Jfg==",
       "cpu": [
         "arm"
       ],
@@ -141,9 +141,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-arm64-gnu": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm64-gnu/-/binding-linux-arm64-gnu-0.48.0.tgz",
-      "integrity": "sha512-5bVdwSwlm1M8wbYCorLOxWxUBw/8tBvHYyQNIfwWVPwOJaj5vg1APSGJQVpwJfV5VNE9PSrR91UKEpoNwHhqUA==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm64-gnu/-/binding-linux-arm64-gnu-0.51.0.tgz",
+      "integrity": "sha512-jOgDzSqWcICGRjsp4mc08FxKMN8vzP2Kgs4E0d2HUP99F+nJDQKklRV4Zuj+0gcBgjrzx2CbpqaIdUVPepCojA==",
       "cpu": [
         "arm64"
       ],
@@ -158,9 +158,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-arm64-musl": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm64-musl/-/binding-linux-arm64-musl-0.48.0.tgz",
-      "integrity": "sha512-vCS3Fk7gFslTqE1lUE2IlroyVV7u/9SmMA/uBqDoshuck2psGWcjW0ePyPZI3rM3+qtf2pDaMVIKMHozraifuw==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-arm64-musl/-/binding-linux-arm64-musl-0.51.0.tgz",
+      "integrity": "sha512-KBUCdrH5bwVrAvI9gU/1S55oH6fzXjr++J/oVocdu7bYTks1l7DNNT+rLd/1TDdAEjObGwmfWamn7LC1m8A0DQ==",
       "cpu": [
         "arm64"
       ],
@@ -175,9 +175,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-ppc64-gnu": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-ppc64-gnu/-/binding-linux-ppc64-gnu-0.48.0.tgz",
-      "integrity": "sha512-gKtfFfueUClXDumyoHUbymqRf7prHejOOyzJK0eIJn93GF9JBdFHdo60TM1ZBHxkEwZvjuOgHmKtneKbEOc/Eg==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-ppc64-gnu/-/binding-linux-ppc64-gnu-0.51.0.tgz",
+      "integrity": "sha512-NapfjYsABFqTJ1Dn9Efq6sN5esaHconVKwVLbDGNQLrwpOx/g17mkwErHzU72PutL67nf3wNAkbq122H+zLxag==",
       "cpu": [
         "ppc64"
       ],
@@ -192,9 +192,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-riscv64-gnu": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-riscv64-gnu/-/binding-linux-riscv64-gnu-0.48.0.tgz",
-      "integrity": "sha512-SYt0UhOvZD/UwZz9sXq6J2uAw8o24f5VZpLB2DH01f6MevshmlgakQlZe2lwek2sZJkd07eLu7mZa0g7yeiw7Q==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-riscv64-gnu/-/binding-linux-riscv64-gnu-0.51.0.tgz",
+      "integrity": "sha512-5dlDt1dUZCVi6elIhiK1PWg9wpTzTcIuj0IZnSurvIoMrhOWqqTcc1dSTxcSkNaBZhfsNqRZdINI1zAgbKkJNQ==",
       "cpu": [
         "riscv64"
       ],
@@ -209,9 +209,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-riscv64-musl": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-riscv64-musl/-/binding-linux-riscv64-musl-0.48.0.tgz",
-      "integrity": "sha512-JLbrwck2AopG4ud/XklZO5N+qxGC7cS7ROvXZVNfx0MCLDDL2kGOLvzuWORkVjnjAM0CMAfIMU2zNBtQbM+4dw==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-riscv64-musl/-/binding-linux-riscv64-musl-0.51.0.tgz",
+      "integrity": "sha512-pgdWUJn0S5nulyiVdlFV8DzCUnGXkU99W5PSkkmbaZW+LrZBPxpezun4G0DDHbQaVYuJeCuKsXsGKGo77CkUTQ==",
       "cpu": [
         "riscv64"
       ],
@@ -226,9 +226,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-s390x-gnu": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-s390x-gnu/-/binding-linux-s390x-gnu-0.48.0.tgz",
-      "integrity": "sha512-mdxt5L8OQLxkQH+JVpdC/lknZNe0lX4hlO3d8+xvw2wToo+iDrid9tiGOd5bmHfUVd5wVhrUry0qlu5vq66NkQ==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-s390x-gnu/-/binding-linux-s390x-gnu-0.51.0.tgz",
+      "integrity": "sha512-2XTFUe97CbDGAI8vjwDfZ1HdakO0XIADyJ24idEg64SC4/K4in/OisXVnrW4NMK7I6TgC7EqRhC0Ln/nKhAemA==",
       "cpu": [
         "s390x"
       ],
@@ -243,9 +243,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-x64-gnu": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-x64-gnu/-/binding-linux-x64-gnu-0.48.0.tgz",
-      "integrity": "sha512-oEz1BQwMrV7OMEFx/3VPDU3n9TM0AnxpktDYXjEg5i6nTX87wo18wSfBvkl4tzAICdKtoAQAdBIl7Y7hsPlx5w==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-x64-gnu/-/binding-linux-x64-gnu-0.51.0.tgz",
+      "integrity": "sha512-kQ1OuCqqt/yyf0ZN9VFxW1/JnlgJgii3Dr7pWf9vNBvrX1hv6g39/+mc5oGRHRGJFZtl3zsGDWR9c5N2B/gwBw==",
       "cpu": [
         "x64"
       ],
@@ -260,9 +260,9 @@
       }
     },
     "node_modules/@oxfmt/binding-linux-x64-musl": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-x64-musl/-/binding-linux-x64-musl-0.48.0.tgz",
-      "integrity": "sha512-g2SKTTurP5mWjd8Ecait0erYqmltL4IqW1EwttM25BxM6NiTt4ubobJYMR1uox1V2QgG4UfHH10CGRvWlUixjw==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-linux-x64-musl/-/binding-linux-x64-musl-0.51.0.tgz",
+      "integrity": "sha512-ARTYqxHF475o96Gbn41hvSWSSRygPlRDXZZgZ9I2scU1y0qiWpCQyZCoefaQa0mwv+wwtZ+luS4YOzsRzM/izg==",
       "cpu": [
         "x64"
       ],
@@ -277,9 +277,9 @@
       }
     },
     "node_modules/@oxfmt/binding-openharmony-arm64": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-openharmony-arm64/-/binding-openharmony-arm64-0.48.0.tgz",
-      "integrity": "sha512-CIg24VgheEpvolHL2gQuax5qcQ602bRMHrJ9g8XsQr3iVj9aSPgopigBKuMqrXsupwkrU+RQCn5cG8PgFntR6w==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-openharmony-arm64/-/binding-openharmony-arm64-0.51.0.tgz",
+      "integrity": "sha512-QiC1XrCl6a6BmqMzduO8hdIRMf1m44hCkt2Q68KWkTvUB/E7fd2iomyNh6KnnRca5w6eBrRAAtLFqTh+xjsjJA==",
       "cpu": [
         "arm64"
       ],
@@ -294,9 +294,9 @@
       }
     },
     "node_modules/@oxfmt/binding-win32-arm64-msvc": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-win32-arm64-msvc/-/binding-win32-arm64-msvc-0.48.0.tgz",
-      "integrity": "sha512-zeaWkcxcEULwkGF3I/HgEvcDPN8buYDrxibBUa/IFh5Vmwyge+KpLO+hEwSovW349H0O/C0Z2kaFmEzEDm00/Q==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-win32-arm64-msvc/-/binding-win32-arm64-msvc-0.51.0.tgz",
+      "integrity": "sha512-NC/hJb9dtU23Zf8L7IVK95xnFjiQ7AfcLO2l5pb69TDEr958qxrtnB2CveeeNSCBFNIkgaTCfd/vHNSoG78l9g==",
       "cpu": [
         "arm64"
       ],
@@ -311,9 +311,9 @@
       }
     },
     "node_modules/@oxfmt/binding-win32-ia32-msvc": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-win32-ia32-msvc/-/binding-win32-ia32-msvc-0.48.0.tgz",
-      "integrity": "sha512-yiEKnIAGvx5CyZQOlMaNlZkAbwT7/Quk0j3WLt+PR5hK+qYjPTRRJYDfD77wCBPLvEYAG41v4KG3iL0H+uxoxg==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-win32-ia32-msvc/-/binding-win32-ia32-msvc-0.51.0.tgz",
+      "integrity": "sha512-2C45za4Rj36n8YIbhRL1PQbxmXJYf81WEcAgvj5I4ptRROG+A+81hREEN5bmCHADE1UfYaN312U6tkILoZZy6w==",
       "cpu": [
         "ia32"
       ],
@@ -328,9 +328,9 @@
       }
     },
     "node_modules/@oxfmt/binding-win32-x64-msvc": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/@oxfmt/binding-win32-x64-msvc/-/binding-win32-x64-msvc-0.48.0.tgz",
-      "integrity": "sha512-GSD2+7t2UoVMV2NgxXypa4bKewflPMAjYnF0Xw9/ht82ZfafAHhb8STwrEd7wlH2PFogt5zw3WVCxYJaHUdbeQ==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/@oxfmt/binding-win32-x64-msvc/-/binding-win32-x64-msvc-0.51.0.tgz",
+      "integrity": "sha512-73RqdAuVKQTkjZIDw08JaDHUM4lav5Qu+CaPwg4QbbA7k8o7LEW0p3UsfZ/F8dsO/pwVYh3RzFcanwLRTTahbQ==",
       "cpu": [
         "x64"
       ],
@@ -345,9 +345,9 @@
       }
     },
     "node_modules/@oxlint/binding-android-arm-eabi": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-android-arm-eabi/-/binding-android-arm-eabi-1.63.0.tgz",
-      "integrity": "sha512-A9xLtQt7i0OA1PoB/meog6kikXI9CdwEp7ZwQqmgnpKn3G3b1orvTDy8CQ6T7w1HvDrgWGB78PkFKcWgibcTCg==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-android-arm-eabi/-/binding-android-arm-eabi-1.66.0.tgz",
+      "integrity": "sha512-f7kq8N51T4phpzqfBpA2qaVTI/KrkCmNwaj3t/97I/WLTDI+UhlP5GL9eER+zVxBhtlx5rKXWByJU1/zDAvyaw==",
       "cpu": [
         "arm"
       ],
@@ -362,9 +362,9 @@
       }
     },
     "node_modules/@oxlint/binding-android-arm64": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-android-arm64/-/binding-android-arm64-1.63.0.tgz",
-      "integrity": "sha512-SQo+ZMvdR9l3CxZp5W5gFNxSiDxclY6lOzzNpKYLF8asESpm3Pwumx0gER5T7aHLF1/2BAAtLD3DiDkdgy4V1A==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-android-arm64/-/binding-android-arm64-1.66.0.tgz",
+      "integrity": "sha512-xu6QO71tdDS9mjmLZ3AqhtaVHBvdmsOKkYnReNNDgh+XiwnsipeQOIxbiYOOO0iAXycJ+GK0wdMSZP/2j/AmSg==",
       "cpu": [
         "arm64"
       ],
@@ -379,9 +379,9 @@
       }
     },
     "node_modules/@oxlint/binding-darwin-arm64": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-darwin-arm64/-/binding-darwin-arm64-1.63.0.tgz",
-      "integrity": "sha512-6W82XjJDTmMnjg30427l0dufpnyLoq7wEukKdM6/g2VIybRVuQiBVh43EA4b+UxZ3+tLcKm+Or/pXGNgLCEU8g==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-darwin-arm64/-/binding-darwin-arm64-1.66.0.tgz",
+      "integrity": "sha512-HZ24VimSOC7mxuEA99e0H2FS0C1yO3+iW13jPRAk+e2njsUs3QeAXsafCDyaIrV/MirdOVez+etQNQsJE43zNQ==",
       "cpu": [
         "arm64"
       ],
@@ -396,9 +396,9 @@
       }
     },
     "node_modules/@oxlint/binding-darwin-x64": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-darwin-x64/-/binding-darwin-x64-1.63.0.tgz",
-      "integrity": "sha512-CnWd/YCuVG5W1BYkjJEVbJG11o526O9qAwBEQM+nh8K19CRFUkFdROXCyYkGmroHEYQe4vgQ6+lh3550Lp35Xw==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-darwin-x64/-/binding-darwin-x64-1.66.0.tgz",
+      "integrity": "sha512-awhj8ZvJrrRSnXj7V++rpZvTmnl99L6mi0B7gg7Cp7BN6cKpzuI481bHNLvXGA9GB1/oEgA3ponuyoAc6Md12A==",
       "cpu": [
         "x64"
       ],
@@ -413,9 +413,9 @@
       }
     },
     "node_modules/@oxlint/binding-freebsd-x64": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-freebsd-x64/-/binding-freebsd-x64-1.63.0.tgz",
-      "integrity": "sha512-a4eZAqrmtajqcxfdAzC+l7g3PaE3V8hpAYqqeD3fTxLXOMFdK3eNTZrU80n4dDEVm0JXy1aL5PqvqWldBl6zYA==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-freebsd-x64/-/binding-freebsd-x64-1.66.0.tgz",
+      "integrity": "sha512-KQF0oVV21/FjIqkRuL8Q1vh8ECsE5+ocdH5tcqTQ4ZnYuDVoYibQUNfqBjQaUsP6UIIda5Y75Wpm5p4RgQWiWw==",
       "cpu": [
         "x64"
       ],
@@ -430,9 +430,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-arm-gnueabihf": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm-gnueabihf/-/binding-linux-arm-gnueabihf-1.63.0.tgz",
-      "integrity": "sha512-tYUtU9TdbU3uXF5D62g5zXJ13iniFGhXQx5vp9cyEjGdbSAY3VdFBSaldYvyoDmgMZ0ZYuwQP1Y4t2Fhejwa0w==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm-gnueabihf/-/binding-linux-arm-gnueabihf-1.66.0.tgz",
+      "integrity": "sha512-9u1rgwZSEXWb30vbFZzQ78HVXBo0WCKNwJ3a2InRUTNMRng+PUDIoSFmA+m4HdUfBaIqftShq8J8qHc+eE/Vig==",
       "cpu": [
         "arm"
       ],
@@ -447,9 +447,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-arm-musleabihf": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm-musleabihf/-/binding-linux-arm-musleabihf-1.63.0.tgz",
-      "integrity": "sha512-I5r3twFf776UZg9dmRo2xbrKt00tTkORXEVe0ctg4vdTkQvJAjiCHxnbAU2HL1AiJ9cqADA76MAliuilsAWnvg==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm-musleabihf/-/binding-linux-arm-musleabihf-1.66.0.tgz",
+      "integrity": "sha512-Ynot2HR1bHxUaNWoC280MVTDfZuaWuP3XfSMRDhyuZrVjhzoaBCVFlw8h8qeZjWKVUBhPWFIxB7AQTlK8Z2WWg==",
       "cpu": [
         "arm"
       ],
@@ -464,9 +464,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-arm64-gnu": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm64-gnu/-/binding-linux-arm64-gnu-1.63.0.tgz",
-      "integrity": "sha512-t7ltUkg6FFh4b564QyGir8xIj/QZbXu8FlcRkcyW9+ztr/mfRHlvUOFd95pJCXi9s/L5DrUeWWgpXRS+V+6igQ==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm64-gnu/-/binding-linux-arm64-gnu-1.66.0.tgz",
+      "integrity": "sha512-xCbgzciGgo+A4aQZEknsNrNiIwY7sU5SfRuMmRjPIvZAgdF34cIHiKvwOsS5XRLjlTVSFwitmq6YclTtHTfU+g==",
       "cpu": [
         "arm64"
       ],
@@ -481,9 +481,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-arm64-musl": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm64-musl/-/binding-linux-arm64-musl-1.63.0.tgz",
-      "integrity": "sha512-Q5mmZy/XWjuYFUuQyYjOvZ5U/JkKEwnpir6hGxhh6HcdP0V/BKxLo8dqkfF/t7r7AguB17dfS/8+go5AQDRR6g==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-arm64-musl/-/binding-linux-arm64-musl-1.66.0.tgz",
+      "integrity": "sha512-hmo+ZB/lHkR1HdDmnziNpzSLmulnUSu10VEqX2Yex7OwvoBAbjJQLvy4gIBRV3AAwWnCvAxKp5Nv1GE6LU1QMg==",
       "cpu": [
         "arm64"
       ],
@@ -498,9 +498,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-ppc64-gnu": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-ppc64-gnu/-/binding-linux-ppc64-gnu-1.63.0.tgz",
-      "integrity": "sha512-uBGtuZ0TzLB4x5wVa82HGNvYqY8buwDhyCnCP0R0gkk9szqVsP0MeTtD5HX7EsEuFIt+aYmYxuxeVxs3nTSwtQ==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-ppc64-gnu/-/binding-linux-ppc64-gnu-1.66.0.tgz",
+      "integrity": "sha512-2Invd4Uyy81mVooQC5FBtfxSNrvcX1OxbMlVQ6M2erRrNI2awFYF26YNW2yFxdVFZ4ffNOWKghtMjhnUPsXsVA==",
       "cpu": [
         "ppc64"
       ],
@@ -515,9 +515,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-riscv64-gnu": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-riscv64-gnu/-/binding-linux-riscv64-gnu-1.63.0.tgz",
-      "integrity": "sha512-h4s6FwxE+9MeA181o0dnDwHP32Y/bG8EiB/vrD6Ib+AMt6haigDc/0bUtI/sLmQDBMJnUfaCmtSSrEAqjtEVrA==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-riscv64-gnu/-/binding-linux-riscv64-gnu-1.66.0.tgz",
+      "integrity": "sha512-s0iXPDQVdgayE3RGa/N2DZF7tjgg0TwEtD1sGoDxqPDGrIXgo45H0yHknT0f9A0yteASsweYZtDyTuVlM4aSag==",
       "cpu": [
         "riscv64"
       ],
@@ -532,9 +532,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-riscv64-musl": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-riscv64-musl/-/binding-linux-riscv64-musl-1.63.0.tgz",
-      "integrity": "sha512-2EaNcCBR8Mcjl5ARtuN3BdEpVkX7KpjSjMGZ/mJMIeaXgTtdz5ytg2VwygMSStA/k0ixfvZFoZOfjDEcouV5vQ==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-riscv64-musl/-/binding-linux-riscv64-musl-1.66.0.tgz",
+      "integrity": "sha512-OekL4XFiu7RPK0JIZi8VeHgtIXPREf42t8Cy/rKEsC+P3gcqDgNAAGiyuUOpdbG4wwbfue1q4CHcCO7spSve6w==",
       "cpu": [
         "riscv64"
       ],
@@ -549,9 +549,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-s390x-gnu": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-s390x-gnu/-/binding-linux-s390x-gnu-1.63.0.tgz",
-      "integrity": "sha512-p4hlf/fd7TrYYl3QrWWD0GocqJefwMu3cHQhmi2FvEB/YOvFb5DZN3SMBaPi7B1TM5DeypkEtrVib674q1KKPg==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-s390x-gnu/-/binding-linux-s390x-gnu-1.66.0.tgz",
+      "integrity": "sha512-Ga1D0kj1SFslm34ThA/BdkUlyAYEnTsXyRC4pF0C5agZSwtGdHYWMTQWemUfBGp4RCG4QWXgdO+HmmmKqOtlBg==",
       "cpu": [
         "s390x"
       ],
@@ -566,9 +566,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-x64-gnu": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-x64-gnu/-/binding-linux-x64-gnu-1.63.0.tgz",
-      "integrity": "sha512-Vgq9rkRVcPcjbcH+ihYTfpeR7vCXfqpd+z5ItTGc0yYUV59L5ceHYN1iV4H9bKGV7Rn5hkVc7x3mSvHegduENA==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-x64-gnu/-/binding-linux-x64-gnu-1.66.0.tgz",
+      "integrity": "sha512-p5jfP1wUZe/IC3qpQO84n9DRnf9g3lKRtLBlQq23ykyrDglHcVx7sWmVTlPuU6SBw8mNnPzyOn022G3XZHnlww==",
       "cpu": [
         "x64"
       ],
@@ -583,9 +583,9 @@
       }
     },
     "node_modules/@oxlint/binding-linux-x64-musl": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-x64-musl/-/binding-linux-x64-musl-1.63.0.tgz",
-      "integrity": "sha512-3/Lkq/ncooA61rorrC+ZQed1Bc4VpGj+WnGsp58zmxKgvZ2vhreu+dcVyr3mX8NUpq7mfZ4gDDTou/yrF1Pd7A==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-linux-x64-musl/-/binding-linux-x64-musl-1.66.0.tgz",
+      "integrity": "sha512-vUB/sYlYZorDL1ZD+o9mRv7zbsykrrFRtmgS6R8musZqLtrPRQn1gc1eGpuX+sfdccz42STl/AqldY6XRb2upQ==",
       "cpu": [
         "x64"
       ],
@@ -600,9 +600,9 @@
       }
     },
     "node_modules/@oxlint/binding-openharmony-arm64": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-openharmony-arm64/-/binding-openharmony-arm64-1.63.0.tgz",
-      "integrity": "sha512-0/EdD/6hDkx5Mfd769PTjvEM8mZ/6Dfukp1dBCL/2PjlIVGEtYdNZyok6ChqYPsT9JcFnlQnUeQzO0/1L/oC9w==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-openharmony-arm64/-/binding-openharmony-arm64-1.66.0.tgz",
+      "integrity": "sha512-yde+6p/F59xRkGR9H1HfngWRif1QRJjynZK349l+UI0H6w9hL3G8/AVaTHFyTtLVQ56qtNbX2/5Dc77n1ovnOg==",
       "cpu": [
         "arm64"
       ],
@@ -617,9 +617,9 @@
       }
     },
     "node_modules/@oxlint/binding-win32-arm64-msvc": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-win32-arm64-msvc/-/binding-win32-arm64-msvc-1.63.0.tgz",
-      "integrity": "sha512-wb0CUkN8ngwPiRQBjD1Cj0LsHeNvm+Xt6YBHDMtj2DVQVD6Oj8Ri7g6BD+KICf6LaBqZlmzOvy6nF9E/8yyGOg==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-win32-arm64-msvc/-/binding-win32-arm64-msvc-1.66.0.tgz",
+      "integrity": "sha512-O9GLucgoTdmOrbBX+EjzNe7o/Ze5TFOvXcib6bzUOtBOmj6cV+zw18NgB+cGKAkDw1Pdqs8vGkfHbbsLuDtXWg==",
       "cpu": [
         "arm64"
       ],
@@ -634,9 +634,9 @@
       }
     },
     "node_modules/@oxlint/binding-win32-ia32-msvc": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-win32-ia32-msvc/-/binding-win32-ia32-msvc-1.63.0.tgz",
-      "integrity": "sha512-BX5iq+ovdNlVYhSn5qPMUIT0uwAwt2lmEnCnzK+Gkhw4DovIvhGb96OFhV8yzQNUnQxn/xGkOR+X+BLrLDNm8w==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-win32-ia32-msvc/-/binding-win32-ia32-msvc-1.66.0.tgz",
+      "integrity": "sha512-m3Pjwc2MfTcom4E4gOv7DyuGyt7OfGNCbmqDHd+N7EzXmP+ppHuudm2NjcA3AjV5TSeGxaguVF4SbTKHe1USYA==",
       "cpu": [
         "ia32"
       ],
@@ -651,9 +651,9 @@
       }
     },
     "node_modules/@oxlint/binding-win32-x64-msvc": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/@oxlint/binding-win32-x64-msvc/-/binding-win32-x64-msvc-1.63.0.tgz",
-      "integrity": "sha512-QeN/WELOfsXMeYwxvfgQrl6CbVftYUCZsGXHjXQd5Trccm8+i4gmtxaOui4xbJQaiDlviF8F3yLSBloQUeFsfA==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/@oxlint/binding-win32-x64-msvc/-/binding-win32-x64-msvc-1.66.0.tgz",
+      "integrity": "sha512-/DbBvw8UFBhja6PqudUjV4UtfsJr0Oa7jUjWVKB0g86lj/VwnPrkngn0sFql3c9RDA0O16dh7ozsXb6GjNAzBQ==",
       "cpu": [
         "x64"
       ],
@@ -668,13 +668,13 @@
       }
     },
     "node_modules/@types/node": {
-      "version": "25.6.0",
-      "resolved": "https://registry.npmjs.org/@types/node/-/node-25.6.0.tgz",
-      "integrity": "sha512-+qIYRKdNYJwY3vRCZMdJbPLJAtGjQBudzZzdzwQYkEPQd+PJGixUL5QfvCLDaULoLv+RhT3LDkwEfKaAkgSmNQ==",
+      "version": "25.9.1",
+      "resolved": "https://registry.npmjs.org/@types/node/-/node-25.9.1.tgz",
+      "integrity": "sha512-xfrlY7UD5rMJk3ZVJP8BNzS28J36YJg+xp+LPXV1TdWxr8uMH5A860QNxYDGQe/ylDSgjxE52Q9VnO7p75tJxg==",
       "dev": true,
       "license": "MIT",
       "dependencies": {
-        "undici-types": "~7.19.0"
+        "undici-types": ">=7.24.0 <7.24.7"
       }
     },
     "node_modules/boolbase": {
@@ -874,9 +874,9 @@
       }
     },
     "node_modules/oxfmt": {
-      "version": "0.48.0",
-      "resolved": "https://registry.npmjs.org/oxfmt/-/oxfmt-0.48.0.tgz",
-      "integrity": "sha512-AVaLh+7XeGx+R1zfFV+f6VV61nT2MWVJXVUDhbTm5LBWGyNt64xAyh3NYYyjeY2WykNt9AvqSQLPHcbWquYF9g==",
+      "version": "0.51.0",
+      "resolved": "https://registry.npmjs.org/oxfmt/-/oxfmt-0.51.0.tgz",
+      "integrity": "sha512-l/AoAnaEOV7Q5/Z9kHOMDehVJnCgYN7wRoooWCTUMBMi16BJhLZqd9cmCnwcVFfVlzkt53zK2KLPFNp8vSsoDg==",
       "dev": true,
       "license": "MIT",
       "dependencies": {
@@ -892,31 +892,39 @@
         "url": "https://github.com/sponsors/Boshen"
       },
       "optionalDependencies": {
-        "@oxfmt/binding-android-arm-eabi": "0.48.0",
-        "@oxfmt/binding-android-arm64": "0.48.0",
-        "@oxfmt/binding-darwin-arm64": "0.48.0",
-        "@oxfmt/binding-darwin-x64": "0.48.0",
-        "@oxfmt/binding-freebsd-x64": "0.48.0",
-        "@oxfmt/binding-linux-arm-gnueabihf": "0.48.0",
-        "@oxfmt/binding-linux-arm-musleabihf": "0.48.0",
-        "@oxfmt/binding-linux-arm64-gnu": "0.48.0",
-        "@oxfmt/binding-linux-arm64-musl": "0.48.0",
-        "@oxfmt/binding-linux-ppc64-gnu": "0.48.0",
-        "@oxfmt/binding-linux-riscv64-gnu": "0.48.0",
-        "@oxfmt/binding-linux-riscv64-musl": "0.48.0",
-        "@oxfmt/binding-linux-s390x-gnu": "0.48.0",
-        "@oxfmt/binding-linux-x64-gnu": "0.48.0",
-        "@oxfmt/binding-linux-x64-musl": "0.48.0",
-        "@oxfmt/binding-openharmony-arm64": "0.48.0",
-        "@oxfmt/binding-win32-arm64-msvc": "0.48.0",
-        "@oxfmt/binding-win32-ia32-msvc": "0.48.0",
-        "@oxfmt/binding-win32-x64-msvc": "0.48.0"
+        "@oxfmt/binding-android-arm-eabi": "0.51.0",
+        "@oxfmt/binding-android-arm64": "0.51.0",
+        "@oxfmt/binding-darwin-arm64": "0.51.0",
+        "@oxfmt/binding-darwin-x64": "0.51.0",
+        "@oxfmt/binding-freebsd-x64": "0.51.0",
+        "@oxfmt/binding-linux-arm-gnueabihf": "0.51.0",
+        "@oxfmt/binding-linux-arm-musleabihf": "0.51.0",
+        "@oxfmt/binding-linux-arm64-gnu": "0.51.0",
+        "@oxfmt/binding-linux-arm64-musl": "0.51.0",
+        "@oxfmt/binding-linux-ppc64-gnu": "0.51.0",
+        "@oxfmt/binding-linux-riscv64-gnu": "0.51.0",
+        "@oxfmt/binding-linux-riscv64-musl": "0.51.0",
+        "@oxfmt/binding-linux-s390x-gnu": "0.51.0",
+        "@oxfmt/binding-linux-x64-gnu": "0.51.0",
+        "@oxfmt/binding-linux-x64-musl": "0.51.0",
+        "@oxfmt/binding-openharmony-arm64": "0.51.0",
+        "@oxfmt/binding-win32-arm64-msvc": "0.51.0",
+        "@oxfmt/binding-win32-ia32-msvc": "0.51.0",
+        "@oxfmt/binding-win32-x64-msvc": "0.51.0"
+      },
+      "peerDependencies": {
+        "svelte": "^5.0.0"
+      },
+      "peerDependenciesMeta": {
+        "svelte": {
+          "optional": true
+        }
       }
     },
     "node_modules/oxlint": {
-      "version": "1.63.0",
-      "resolved": "https://registry.npmjs.org/oxlint/-/oxlint-1.63.0.tgz",
-      "integrity": "sha512-9TGXetdjgIHOJ9OiReomP7nnrMkV9HxC1xM2ramJSLQpzxjsAJtQwa4wqkJN2f/uCrqZuJseFuSlWDdvcruveg==",
+      "version": "1.66.0",
+      "resolved": "https://registry.npmjs.org/oxlint/-/oxlint-1.66.0.tgz",
+      "integrity": "sha512-N4LLxYLd94KEBqXDMDM5f+2PUpItTjDLreXe2Gn5KhjhCK4Qp2YUXaBi8Yu325ryOgKwt22m45fpD7nPOn69Yw==",
       "dev": true,
       "license": "MIT",
       "bin": {
@@ -929,25 +937,25 @@
         "url": "https://github.com/sponsors/Boshen"
       },
       "optionalDependencies": {
-        "@oxlint/binding-android-arm-eabi": "1.63.0",
-        "@oxlint/binding-android-arm64": "1.63.0",
-        "@oxlint/binding-darwin-arm64": "1.63.0",
-        "@oxlint/binding-darwin-x64": "1.63.0",
-        "@oxlint/binding-freebsd-x64": "1.63.0",
-        "@oxlint/binding-linux-arm-gnueabihf": "1.63.0",
-        "@oxlint/binding-linux-arm-musleabihf": "1.63.0",
-        "@oxlint/binding-linux-arm64-gnu": "1.63.0",
-        "@oxlint/binding-linux-arm64-musl": "1.63.0",
-        "@oxlint/binding-linux-ppc64-gnu": "1.63.0",
-        "@oxlint/binding-linux-riscv64-gnu": "1.63.0",
-        "@oxlint/binding-linux-riscv64-musl": "1.63.0",
-        "@oxlint/binding-linux-s390x-gnu": "1.63.0",
-        "@oxlint/binding-linux-x64-gnu": "1.63.0",
-        "@oxlint/binding-linux-x64-musl": "1.63.0",
-        "@oxlint/binding-openharmony-arm64": "1.63.0",
-        "@oxlint/binding-win32-arm64-msvc": "1.63.0",
-        "@oxlint/binding-win32-ia32-msvc": "1.63.0",
-        "@oxlint/binding-win32-x64-msvc": "1.63.0"
+        "@oxlint/binding-android-arm-eabi": "1.66.0",
+        "@oxlint/binding-android-arm64": "1.66.0",
+        "@oxlint/binding-darwin-arm64": "1.66.0",
+        "@oxlint/binding-darwin-x64": "1.66.0",
+        "@oxlint/binding-freebsd-x64": "1.66.0",
+        "@oxlint/binding-linux-arm-gnueabihf": "1.66.0",
+        "@oxlint/binding-linux-arm-musleabihf": "1.66.0",
+        "@oxlint/binding-linux-arm64-gnu": "1.66.0",
+        "@oxlint/binding-linux-arm64-musl": "1.66.0",
+        "@oxlint/binding-linux-ppc64-gnu": "1.66.0",
+        "@oxlint/binding-linux-riscv64-gnu": "1.66.0",
+        "@oxlint/binding-linux-riscv64-musl": "1.66.0",
+        "@oxlint/binding-linux-s390x-gnu": "1.66.0",
+        "@oxlint/binding-linux-x64-gnu": "1.66.0",
+        "@oxlint/binding-linux-x64-musl": "1.66.0",
+        "@oxlint/binding-openharmony-arm64": "1.66.0",
+        "@oxlint/binding-win32-arm64-msvc": "1.66.0",
+        "@oxlint/binding-win32-ia32-msvc": "1.66.0",
+        "@oxlint/binding-win32-x64-msvc": "1.66.0"
       },
       "peerDependencies": {
         "oxlint-tsgolint": ">=0.22.1"
@@ -969,9 +977,9 @@
       }
     },
     "node_modules/typescript": {
-      "version": "5.9.3",
-      "resolved": "https://registry.npmjs.org/typescript/-/typescript-5.9.3.tgz",
-      "integrity": "sha512-jl1vZzPDinLr9eUt3J/t7V6FgNEw9QjvBPdysz9KfQDD41fQrC2Y4vKQdiaUpFT4bXlb1RHhLpp8wtm6M5TgSw==",
+      "version": "6.0.3",
+      "resolved": "https://registry.npmjs.org/typescript/-/typescript-6.0.3.tgz",
+      "integrity": "sha512-y2TvuxSZPDyQakkFRPZHKFm+KKVqIisdg9/CZwm9ftvKXLP8NRWj38/ODjNbr43SsoXqNuAisEf1GdCxqWcdBw==",
       "dev": true,
       "license": "Apache-2.0",
       "bin": {
@@ -989,16 +997,16 @@
       "license": "ISC"
     },
     "node_modules/undici-types": {
-      "version": "7.19.2",
-      "resolved": "https://registry.npmjs.org/undici-types/-/undici-types-7.19.2.tgz",
-      "integrity": "sha512-qYVnV5OEm2AW8cJMCpdV20CDyaN3g0AjDlOGf1OW4iaDEx8MwdtChUp4zu4H0VP3nDRF/8RKWH+IPp9uW0YGZg==",
+      "version": "7.24.6",
+      "resolved": "https://registry.npmjs.org/undici-types/-/undici-types-7.24.6.tgz",
+      "integrity": "sha512-WRNW+sJgj5OBN4/0JpHFqtqzhpbnV0GuB+OozA9gCL7a993SmU+1JBZCzLNxYsbMfIeDL+lTsphD5jN5N+n0zg==",
       "dev": true,
       "license": "MIT"
     },
     "node_modules/yaml": {
-      "version": "2.8.4",
-      "resolved": "https://registry.npmjs.org/yaml/-/yaml-2.8.4.tgz",
-      "integrity": "sha512-ml/JPOj9fOQK8RNnWojA67GbZ0ApXAUlN2UQclwv2eVgTgn7O9gg9o7paZWKMp4g0H3nTLtS9LVzhkpOFIKzog==",
+      "version": "2.9.0",
+      "resolved": "https://registry.npmjs.org/yaml/-/yaml-2.9.0.tgz",
+      "integrity": "sha512-2AvhNX3mb8zd6Zy7INTtSpl1F15HW6Wnqj0srWlkKLcpYl/gMIMJiyuGq2KeI2YFxUPjdlB+3Lc10seMLtL4cA==",
       "license": "ISC",
       "bin": {
         "yaml": "bin.mjs"
diff --git a/package.json b/package.json
index 336fc645..94711a13 100644
--- a/package.json
+++ b/package.json
@@ -1,29 +1,116 @@
 {
   "name": "ai-models",
-  "version": "0.1.0",
-  "description": "A structured catalog of AI model providers and their models",
+  "version": "0.2.2",
+  "description": "Structured YAML catalog of 4,587 AI models across 95 providers — pricing, context windows, modalities, capabilities. First-party data with TypeScript types and Zod validation.",
+  "keywords": [
+    "agentic-models",
+    "ai-agents",
+    "ai-catalog",
+    "ai-directory",
+    "ai-model-pricing",
+    "ai-models",
+    "ai-pricing",
+    "ai-provider",
+    "anthropic",
+    "cached-pricing",
+    "cdn",
+    "cerebras",
+    "chat-models",
+    "chatgpt",
+    "claude",
+    "code-models",
+    "context-window",
+    "deepseek",
+    "edge-ai",
+    "embedding-models",
+    "free-models",
+    "function-calling",
+    "github-action",
+    "google-gemini",
+    "gpt-4",
+    "groq",
+    "image-generation",
+    "inference-api",
+    "json-mode",
+    "large-context-models",
+    "large-language-model",
+    "llama",
+    "llm",
+    "llm-api",
+    "llm-catalog",
+    "llm-pricing",
+    "machine-readable",
+    "migration-guide",
+    "mistral",
+    "model-catalog",
+    "model-comparison",
+    "model-directory",
+    "model-metadata",
+    "model-pricing",
+    "model-selection",
+    "multimodal-models",
+    "on-device-ai",
+    "open-weights",
+    "openai",
+    "prompt-caching",
+    "provider-comparison",
+    "qwen",
+    "reasoning-models",
+    "small-models",
+    "structured-output",
+    "tool-calling",
+    "vision-models",
+    "yaml"
+  ],
+  "homepage": "https://i-need-token.github.io/ai-models/",
+  "bugs": {
+    "url": "https://github.com/i-need-token/ai-models/issues"
+  },
   "license": "MIT",
+  "repository": {
+    "type": "git",
+    "url": "git+https://github.com/i-need-token/ai-models.git"
+  },
+  "files": [
+    "dist/",
+    "types/",
+    "providers/",
+    "LICENSE"
+  ],
   "type": "module",
+  "main": "dist/models.json",
+  "types": "dist/index.d.ts",
+  "exports": {
+    ".": {
+      "types": "./dist/index.d.ts",
+      "default": "./dist/models.json"
+    },
+    "./models.json": "./dist/models.json"
+  },
   "scripts": {
     "sync": "npx tsx scripts/sync.ts",
     "validate": "npx tsx scripts/validate.ts",
+    "stats": "npx tsx scripts/stats.ts",
+    "compile": "npx tsx scripts/compile.ts",
     "fmt": "oxfmt",
     "fmt:check": "oxfmt --check",
     "lint": "oxlint",
     "typecheck": "tsc --noEmit",
     "check": "npm run fmt:check && npm run lint && npm run typecheck",
-    "prepare": "husky"
+    "prepare": "husky",
+    "build": "tsc -p tsconfig.build.json && npx tsx scripts/compile.ts",
+    "prepublishOnly": "npm run build"
   },
   "dependencies": {
     "linkedom": "^0.18.12",
-    "yaml": "^2.7.0",
+    "yaml": "^2.9.0",
     "zod": "^3.24.0"
   },
   "devDependencies": {
-    "@types/node": "^25.6.0",
+    "@types/node": "^25.9.1",
     "husky": "^9.1.7",
-    "oxfmt": "^0.48.0",
-    "oxlint": "^1.63.0",
-    "typescript": "^5.7.0"
+    "oxfmt": "^0.51.0",
+    "oxlint": "^1.66.0",
+    "typescript": "^6.0.3"
   }
 }
diff --git a/providers/aion/README.md b/providers/aion/README.md
new file mode 100644
index 00000000..0f7281f7
--- /dev/null
+++ b/providers/aion/README.md
@@ -0,0 +1,12 @@
+# Aion Labs
+
+[Aion Labs](https://aionlabs.ai) provides AI model inference services.
+
+## Data Source
+
+Model data is fetched from the Aion Labs API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Pricing follows the provider's published rates
diff --git a/providers/auriko/README.md b/providers/auriko/README.md
new file mode 100644
index 00000000..d0d46dd5
--- /dev/null
+++ b/providers/auriko/README.md
@@ -0,0 +1,12 @@
+# Auriko
+
+[Auriko](https://auriko.com) provides AI model inference services.
+
+## Data Source
+
+Model data is fetched from the Auriko API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Pricing follows the provider's published rates
diff --git a/providers/baichuan/README.md b/providers/baichuan/README.md
new file mode 100644
index 00000000..0ab56006
--- /dev/null
+++ b/providers/baichuan/README.md
@@ -0,0 +1,13 @@
+# Baichuan AI
+
+[Baichuan AI](https://platform.baichuan-ai.com) is a Chinese AI model producer, developer of the Baichuan series of large language models.
+
+## Data Source
+
+Model data is fetched from the Baichuan AI API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Pricing is in CNY
+- Baichuan models include both general-purpose and specialized variants
diff --git a/providers/cloudferro-sherlock/README.md b/providers/cloudferro-sherlock/README.md
new file mode 100644
index 00000000..efc94f84
--- /dev/null
+++ b/providers/cloudferro-sherlock/README.md
@@ -0,0 +1,13 @@
+# CloudFerro Sherlock
+
+[CloudFerro Sherlock](https://sherlock.cloudferro.com) provides AI model inference on European cloud infrastructure.
+
+## Data Source
+
+Model data is fetched from the CloudFerro Sherlock API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Pricing follows the provider's published rates
+- Hosted on European infrastructure (GDPR-friendly)
diff --git a/providers/iflytek/README.md b/providers/iflytek/README.md
new file mode 100644
index 00000000..baa4b6e7
--- /dev/null
+++ b/providers/iflytek/README.md
@@ -0,0 +1,13 @@
+# iFlytek SparkDesk
+
+[iFlytek SparkDesk](https://xinghuo.xfyun.cn) is a Chinese AI model platform by iFlytek (科大讯飞), providing the SparkDesk (星火) series of large language models.
+
+## Data Source
+
+Model data is fetched from the iFlytek SparkDesk API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Pricing is in CNY
+- SparkDesk models support both Chinese and English
diff --git a/providers/llmgateway/README.md b/providers/llmgateway/README.md
new file mode 100644
index 00000000..f04c7505
--- /dev/null
+++ b/providers/llmgateway/README.md
@@ -0,0 +1,13 @@
+# LLM Gateway
+
+[LLM Gateway](https://llmgateway.com) provides a unified API gateway for accessing multiple AI model providers.
+
+## Data Source
+
+Model data is fetched from the LLM Gateway API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Aggregates models from multiple upstream providers
+- Pricing follows the provider's published rates
diff --git a/providers/martian/README.md b/providers/martian/README.md
new file mode 100644
index 00000000..3a21898a
--- /dev/null
+++ b/providers/martian/README.md
@@ -0,0 +1,13 @@
+# Martian
+
+[Martian](https://withmartian.com) provides AI model inference services with a unified API.
+
+## Data Source
+
+Model data is fetched from the Martian API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Aggregates models from multiple upstream providers
+- Pricing follows the provider's published rates
diff --git a/providers/tencent-tokenhub/README.md b/providers/tencent-tokenhub/README.md
new file mode 100644
index 00000000..b32611e0
--- /dev/null
+++ b/providers/tencent-tokenhub/README.md
@@ -0,0 +1,13 @@
+# Tencent Cloud TokenHub
+
+[Tencent Cloud TokenHub](https://cloud.tencent.com/product/ti) is a Chinese AI model platform by Tencent, providing access to various large language models.
+
+## Data Source
+
+Model data is fetched from the Tencent Cloud TokenHub API endpoint.
+
+## Notes
+
+- Models are discovered dynamically from the API
+- Pricing is in CNY
+- Provides access to both Tencent's own models and third-party models
diff --git a/renovate.json b/renovate.json
new file mode 100644
index 00000000..93da19a7
--- /dev/null
+++ b/renovate.json
@@ -0,0 +1,20 @@
+{
+  "$schema": "https://docs.renovatebot.com/renovate-schema.json",
+  "extends": ["config:recommended"],
+  "schedule": ["before 5am on Monday"],
+  "labels": ["dependencies"],
+  "reviewers": ["liushuai"],
+  "prConcurrentLimit": 5,
+  "prHourlyLimit": 2,
+  "packageRules": [
+    {
+      "matchUpdateTypes": ["minor", "patch"],
+      "automerge": true,
+      "automergeType": "squash"
+    },
+    {
+      "matchUpdateTypes": ["major"],
+      "automerge": false
+    }
+  ]
+}
diff --git a/schema.json b/schema.json
new file mode 100644
index 00000000..477fe74d
--- /dev/null
+++ b/schema.json
@@ -0,0 +1,281 @@
+{
+  "$schema": "https://json-schema.org/draft/2020-12/schema",
+  "$id": "https://raw.githubusercontent.com/i-need-token/ai-models/main/schema.json",
+  "title": "AI Models Catalog",
+  "description": "Schema for the AI Models Catalog YAML data files",
+  "definitions": {
+    "TokenPricing": {
+      "type": "object",
+      "description": "Per-million-token pricing (most common)",
+      "properties": {
+        "input": {
+          "type": "number",
+          "minimum": 0,
+          "description": "Price per 1M input tokens (USD or CNY)"
+        },
+        "output": {
+          "type": "number",
+          "minimum": 0,
+          "description": "Price per 1M output tokens (USD or CNY)"
+        },
+        "cache_write": {
+          "type": "number",
+          "minimum": 0,
+          "description": "Price per 1M cached write tokens"
+        },
+        "cache_read": {
+          "type": "number",
+          "minimum": 0,
+          "description": "Price per 1M cached read tokens"
+        }
+      },
+      "required": ["input", "output"]
+    },
+    "VideoPricing": {
+      "type": "object",
+      "description": "Per-second video pricing",
+      "properties": {
+        "unit": {
+          "type": "string",
+          "const": "per_second",
+          "description": "Pricing unit"
+        },
+        "price": {
+          "type": "number",
+          "minimum": 0,
+          "description": "Price per second"
+        }
+      },
+      "required": ["unit", "price"]
+    },
+    "UnitPricing": {
+      "type": "object",
+      "description": "Per-unit pricing (per image, per request, etc.)",
+      "properties": {
+        "unit": {
+          "type": "string",
+          "enum": ["per_image", "per_request"],
+          "description": "Pricing unit"
+        },
+        "price": {
+          "type": "number",
+          "minimum": 0,
+          "description": "Price per unit"
+        }
+      },
+      "required": ["unit", "price"]
+    },
+    "FreePricing": {
+      "type": "object",
+      "description": "Free pricing (no cost)",
+      "properties": {
+        "unit": {
+          "type": "string",
+          "const": "free",
+          "description": "Pricing unit"
+        }
+      },
+      "required": ["unit"]
+    },
+    "Pricing": {
+      "oneOf": [
+        { "$ref": "#/definitions/TokenPricing" },
+        { "$ref": "#/definitions/VideoPricing" },
+        { "$ref": "#/definitions/UnitPricing" },
+        { "$ref": "#/definitions/FreePricing" }
+      ]
+    },
+    "Modality": {
+      "type": "string",
+      "enum": ["text", "image", "video", "audio", "pdf"],
+      "description": "Input or output modality"
+    },
+    "Snapshot": {
+      "type": "object",
+      "description": "A dated version of a model (inherits parent fields)",
+      "properties": {
+        "id": {
+          "type": "string",
+          "description": "Snapshot ID (typically includes date, e.g. gpt-4o-2024-08-06)"
+        },
+        "name": {
+          "type": "string",
+          "description": "Display name override"
+        },
+        "reasoning": {
+          "type": "boolean",
+          "description": "Supports reasoning/thinking mode"
+        },
+        "temperature": {
+          "type": "boolean",
+          "description": "Supports temperature parameter"
+        },
+        "tool_call": {
+          "type": "boolean",
+          "description": "Supports tool/function calling"
+        },
+        "attachment": {
+          "type": "boolean",
+          "description": "Supports file attachments"
+        },
+        "structured_output": {
+          "type": "boolean",
+          "description": "Supports structured/JSON output"
+        },
+        "open_weights": {
+          "type": "boolean",
+          "description": "Open-weight model"
+        },
+        "deprecated": {
+          "type": "boolean",
+          "description": "Deprecated but still accessible"
+        },
+        "limit": {
+          "type": "object",
+          "properties": {
+            "context": {
+              "type": "integer",
+              "minimum": 1,
+              "description": "Maximum context window in tokens"
+            },
+            "output": {
+              "type": "integer",
+              "minimum": 1,
+              "description": "Maximum output tokens"
+            }
+          }
+        },
+        "pricing": {
+          "$ref": "#/definitions/Pricing"
+        },
+        "modalities": {
+          "type": "object",
+          "properties": {
+            "input": {
+              "type": "array",
+              "items": { "$ref": "#/definitions/Modality" }
+            },
+            "output": {
+              "type": "array",
+              "items": { "$ref": "#/definitions/Modality" }
+            }
+          }
+        },
+        "knowledge": {
+          "type": "string",
+          "description": "Training data cutoff (e.g. 2023-10)"
+        },
+        "release_date": {
+          "type": "string",
+          "description": "Model release date (YYYY-MM-DD or YYYY-MM)"
+        },
+        "last_updated": {
+          "type": "string",
+          "description": "Last data update (YYYY-MM-DD or YYYY-MM)"
+        }
+      },
+      "required": ["id", "last_updated"]
+    }
+  },
+  "type": "object",
+  "description": "A single AI model definition",
+  "properties": {
+    "id": {
+      "type": "string",
+      "description": "Stable model ID (no date suffix)",
+      "pattern": "^[a-z0-9][a-z0-9._-]*[a-z0-9]$"
+    },
+    "name": {
+      "type": "string",
+      "description": "Display name"
+    },
+    "family": {
+      "type": "string",
+      "description": "Model family (broad lineage)"
+    },
+    "reasoning": {
+      "type": "boolean",
+      "default": false,
+      "description": "Supports reasoning/thinking mode"
+    },
+    "temperature": {
+      "type": "boolean",
+      "default": true,
+      "description": "Supports temperature parameter"
+    },
+    "tool_call": {
+      "type": "boolean",
+      "default": false,
+      "description": "Supports tool/function calling"
+    },
+    "attachment": {
+      "type": "boolean",
+      "default": false,
+      "description": "Supports file attachments"
+    },
+    "structured_output": {
+      "type": "boolean",
+      "default": false,
+      "description": "Supports structured/JSON output"
+    },
+    "open_weights": {
+      "type": "boolean",
+      "default": false,
+      "description": "Open-weight model"
+    },
+    "deprecated": {
+      "type": "boolean",
+      "default": false,
+      "description": "Deprecated but still accessible"
+    },
+    "limit": {
+      "type": "object",
+      "properties": {
+        "context": {
+          "type": "integer",
+          "minimum": 1,
+          "description": "Maximum context window in tokens"
+        },
+        "output": {
+          "type": "integer",
+          "minimum": 1,
+          "description": "Maximum output tokens"
+        }
+      }
+    },
+    "pricing": {
+      "$ref": "#/definitions/Pricing"
+    },
+    "modalities": {
+      "type": "object",
+      "properties": {
+        "input": {
+          "type": "array",
+          "items": { "$ref": "#/definitions/Modality" }
+        },
+        "output": {
+          "type": "array",
+          "items": { "$ref": "#/definitions/Modality" }
+        }
+      }
+    },
+    "knowledge": {
+      "type": "string",
+      "description": "Training data cutoff (e.g. 2023-10)"
+    },
+    "release_date": {
+      "type": "string",
+      "description": "Model release date (YYYY-MM-DD or YYYY-MM)"
+    },
+    "last_updated": {
+      "type": "string",
+      "description": "Last data update (YYYY-MM-DD or YYYY-MM)"
+    },
+    "snapshots": {
+      "type": "array",
+      "items": { "$ref": "#/definitions/Snapshot" },
+      "description": "Dated model versions"
+    }
+  },
+  "required": ["id", "name", "family", "pricing", "modalities", "last_updated"]
+}
diff --git a/scripts/compile.ts b/scripts/compile.ts
new file mode 100644
index 00000000..1d0972da
--- /dev/null
+++ b/scripts/compile.ts
@@ -0,0 +1,132 @@
+import fs from "node:fs";
+import path from "node:path";
+import { fileURLToPath } from "node:url";
+import YAML from "yaml";
+import { ModelSchema } from "../types/schemas";
+
+const __dirname = path.dirname(fileURLToPath(import.meta.url));
+const PROJECT_ROOT = path.resolve(__dirname, "..");
+
+interface CompiledModel {
+  id: string;
+  name: string;
+  family?: string;
+  provider: string;
+  reasoning?: boolean | undefined;
+  tool_call?: boolean | undefined;
+  structured_output?: boolean | undefined;
+  open_weights?: boolean | undefined;
+  deprecated?: boolean | undefined;
+  pricing?: Record<string, unknown> | undefined;
+  limit?: Record<string, unknown> | undefined;
+  modalities?: Record<string, unknown> | undefined;
+  release_date?: string | undefined;
+  last_updated?: string | undefined;
+}
+
+interface CompiledCatalog {
+  generated_at: string;
+  stats: {
+    providers: number;
+    models: number;
+    unique_model_ids: number;
+    families: number;
+  };
+  providers: Record<string, { name: string; model_count: number }>;
+  models: CompiledModel[];
+}
+
+function compile(): CompiledCatalog {
+  const providersDir = path.join(PROJECT_ROOT, "providers");
+  const providerDirs = fs
+    .readdirSync(providersDir, { withFileTypes: true })
+    .filter((d) => d.isDirectory())
+    .map((d) => d.name)
+    .filter((name) => fs.existsSync(path.join(providersDir, name, "models")));
+
+  const models: CompiledModel[] = [];
+  const providers: Record<string, { name: string; model_count: number }> = {};
+  const uniqueIds = new Set<string>();
+  const families = new Set<string>();
+
+  for (const providerId of providerDirs) {
+    const modelsDir = path.join(providersDir, providerId, "models");
+    const files = fs.readdirSync(modelsDir).filter((f) => f.endsWith(".yaml"));
+
+    // Read provider name from provider.yaml
+    let providerName = providerId;
+    const providerYamlPath = path.join(providersDir, providerId, "provider.yaml");
+    if (fs.existsSync(providerYamlPath)) {
+      try {
+        const providerRaw = fs.readFileSync(providerYamlPath, "utf-8");
+        const providerData = YAML.parse(providerRaw);
+        if (providerData?.name) providerName = providerData.name;
+      } catch {
+        // ignore
+      }
+    }
+
+    providers[providerId] = { name: providerName, model_count: files.length };
+
+    for (const file of files) {
+      const raw = fs.readFileSync(path.join(modelsDir, file), "utf-8");
+      const data = YAML.parse(raw);
+      const result = ModelSchema.safeParse(data);
+      if (!result.success) continue;
+
+      const model = result.data;
+      uniqueIds.add(model.id);
+      if (model.family) families.add(model.family);
+
+      models.push({
+        id: model.id,
+        name: model.name,
+        family: model.family,
+        provider: providerId,
+        reasoning: model.reasoning,
+        tool_call: model.tool_call,
+        structured_output: model.structured_output,
+        open_weights: model.open_weights,
+        deprecated: model.deprecated,
+        pricing: model.pricing as Record<string, unknown> | undefined,
+        limit: model.limit as Record<string, unknown> | undefined,
+        modalities: model.modalities as Record<string, unknown> | undefined,
+        release_date: model.release_date,
+        last_updated: model.last_updated,
+      });
+    }
+  }
+
+  return {
+    generated_at: new Date().toISOString(),
+    stats: {
+      providers: providerDirs.length,
+      models: models.length,
+      unique_model_ids: uniqueIds.size,
+      families: families.size,
+    },
+    providers,
+    models,
+  };
+}
+
+function main(): void {
+  const catalog = compile();
+
+  const distDir = path.join(PROJECT_ROOT, "dist");
+  if (!fs.existsSync(distDir)) fs.mkdirSync(distDir, { recursive: true });
+
+  const outPath = path.join(distDir, "models.json");
+  fs.writeFileSync(outPath, JSON.stringify(catalog, null, 2));
+
+  console.log(
+    `✅ Compiled ${catalog.models.length} models from ${catalog.stats.providers} providers`,
+  );
+  console.log(
+    `   ${catalog.stats.unique_model_ids} unique IDs, ${catalog.stats.families} families`,
+  );
+  console.log(`   Written to ${outPath}`);
+  console.log(`   Size: ${(fs.statSync(outPath).size / 1024 / 1024).toFixed(1)} MB`);
+}
+
+main();
diff --git a/scripts/export-csv.ts b/scripts/export-csv.ts
new file mode 100644
index 00000000..b87f4c14
--- /dev/null
+++ b/scripts/export-csv.ts
@@ -0,0 +1,120 @@
+import fs from "node:fs";
+import path from "node:path";
+import YAML from "yaml";
+import { ModelSchema } from "../types/schemas";
+
+const providersDir = "providers";
+
+interface FlatModel {
+  id: string;
+  name: string;
+  provider: string;
+  family: string;
+  deprecated: boolean;
+  reasoning: boolean;
+  tool_call: boolean;
+  structured_output: boolean;
+  open_weights: boolean;
+  context_window: number | undefined;
+  max_output: number | undefined;
+  input_modalities: string;
+  output_modalities: string;
+  pricing_type: string;
+  input_price: number | undefined;
+  output_price: number | undefined;
+  image_input_price: number | undefined;
+  image_output_price: number | undefined;
+  cached_input_price: number | undefined;
+}
+
+const models: FlatModel[] = [];
+
+for (const provider of fs.readdirSync(providersDir)) {
+  const mDir = path.join(providersDir, provider, "models");
+  if (!fs.existsSync(mDir)) continue;
+  for (const f of fs.readdirSync(mDir).filter((f) => f.endsWith(".yaml"))) {
+    const raw = fs.readFileSync(path.join(mDir, f), "utf-8");
+    const data = YAML.parse(raw);
+    const r = ModelSchema.safeParse(data);
+    if (!r.success) continue;
+    const m = r.data;
+
+    const pr = m.pricing as Record<string, unknown> | undefined;
+    let pricingType = "unknown";
+    let inputPrice: number | undefined;
+    let outputPrice: number | undefined;
+    let imageInputPrice: number | undefined;
+    let imageOutputPrice: number | undefined;
+    let cachedInputPrice: number | undefined;
+
+    if (pr) {
+      pricingType = (pr["type"] as string) ?? "token";
+      if (pricingType === "token") {
+        inputPrice = pr["input"] as number | undefined;
+        outputPrice = pr["output"] as number | undefined;
+        imageInputPrice = pr["image_input"] as number | undefined;
+        imageOutputPrice = pr["image_output"] as number | undefined;
+        cachedInputPrice = pr["cached_input"] as number | undefined;
+      }
+    }
+
+    models.push({
+      id: m.id,
+      name: m.name ?? m.id,
+      provider,
+      family: m.family ?? "",
+      deprecated: m.deprecated ?? false,
+      reasoning: m.reasoning ?? false,
+      tool_call: m.tool_call ?? false,
+      structured_output: m.structured_output ?? false,
+      open_weights: m.open_weights ?? false,
+      context_window: m.limit?.context,
+      max_output: m.limit?.output,
+      input_modalities: (m.modalities?.input ?? []).join(";"),
+      output_modalities: (m.modalities?.output ?? []).join(";"),
+      pricing_type: pricingType,
+      input_price: inputPrice,
+      output_price: outputPrice,
+      image_input_price: imageInputPrice,
+      image_output_price: imageOutputPrice,
+      cached_input_price: cachedInputPrice,
+    });
+  }
+}
+
+function escapeCsv(val: unknown): string {
+  const s = String(val ?? "");
+  if (s.includes(",") || s.includes('"') || s.includes("\n")) {
+    return `"${s.replace(/"/g, '""')}"`;
+  }
+  return s;
+}
+
+const header = [
+  "id",
+  "name",
+  "provider",
+  "family",
+  "deprecated",
+  "reasoning",
+  "tool_call",
+  "structured_output",
+  "open_weights",
+  "context_window",
+  "max_output",
+  "input_modalities",
+  "output_modalities",
+  "pricing_type",
+  "input_price",
+  "output_price",
+  "image_input_price",
+  "image_output_price",
+  "cached_input_price",
+];
+
+const rows = models.map((m) => header.map((k) => escapeCsv(m[k as keyof FlatModel])).join(","));
+
+const csv = [header.join(","), ...rows].join("\n");
+
+fs.writeFileSync("models.csv", csv);
+console.log(`Wrote ${models.length} models to models.csv`);
diff --git a/scripts/scrape-all.ts b/scripts/scrape-all.ts
new file mode 100644
index 00000000..48fe052e
--- /dev/null
+++ b/scripts/scrape-all.ts
@@ -0,0 +1,58 @@
+/**
+ * Run all provider scrape scripts and write updated model YAML files.
+ *
+ * Usage: npx tsx scripts/scrape-all.ts
+ *
+ * Each provider's scrape.ts exports a `scrape()` function that returns
+ * a ScrapeResult. This script calls each one and writes the results
+ * to providers/<id>/models/<model-id>.yaml.
+ */
+import fs from "node:fs";
+import path from "node:path";
+import YAML from "yaml";
+import { defineModel } from "./lib/utils";
+import type { ScrapeResult } from "./lib/types";
+
+const providersDir = "providers";
+
+async function main() {
+  const providerDirs = fs
+    .readdirSync(providersDir)
+    .filter((d) => fs.statSync(path.join(providersDir, d)).isDirectory());
+
+  let totalUpdated = 0;
+  let totalFailed = 0;
+
+  for (const provider of providerDirs) {
+    const scrapePath = path.join(providersDir, provider, "scrape.ts");
+    if (!fs.existsSync(scrapePath)) continue;
+
+    console.log(`Scraping ${provider}...`);
+    try {
+      const mod = await import(`../providers/${provider}/scrape.ts`);
+      const result: ScrapeResult = await mod.scrape();
+
+      const mDir = path.join(providersDir, provider, "models");
+      fs.mkdirSync(mDir, { recursive: true });
+
+      for (const model of result.models) {
+        const validated = defineModel(model);
+        const filePath = path.join(mDir, `${validated.id}.yaml`);
+        fs.writeFileSync(filePath, YAML.stringify(validated));
+        totalUpdated++;
+      }
+
+      console.log(`  ✓ ${provider}: ${result.models.length} models`);
+    } catch (err) {
+      console.error(`  ✗ ${provider}: ${err}`);
+      totalFailed++;
+    }
+  }
+
+  console.log(`\nDone: ${totalUpdated} models updated, ${totalFailed} providers failed`);
+  if (totalFailed > 0) {
+    process.exit(1);
+  }
+}
+
+main();
diff --git a/scripts/social-preview.ts b/scripts/social-preview.ts
new file mode 100644
index 00000000..562db303
--- /dev/null
+++ b/scripts/social-preview.ts
@@ -0,0 +1,112 @@
+#!/usr/bin/env node
+/**
+ * Generate a social preview image (1280×640) for GitHub repo.
+ * Outputs an SVG that can be converted to PNG via any browser or tool.
+ *
+ * Usage:
+ *   npx tsx scripts/social-preview.ts > social-preview.svg
+ */
+
+import fs from "node:fs";
+import path from "node:path";
+
+const providersDir = path.join(import.meta.dirname, "..", "providers");
+
+let providerCount = 0;
+let modelCount = 0;
+
+for (const p of fs.readdirSync(providersDir)) {
+  const mDir = path.join(providersDir, p, "models");
+  if (!fs.existsSync(mDir)) continue;
+  providerCount++;
+  for (const _f of fs.readdirSync(mDir).filter((f) => f.endsWith(".yaml"))) {
+    modelCount++;
+  }
+}
+
+const svg = `<svg xmlns="http://www.w3.org/2000/svg" width="1280" height="640" viewBox="0 0 1280 640">
+  <defs>
+    <linearGradient id="bg" x1="0%" y1="0%" x2="100%" y2="100%">
+      <stop offset="0%" style="stop-color:#0d1117"/>
+      <stop offset="50%" style="stop-color:#161b22"/>
+      <stop offset="100%" style="stop-color:#0d1117"/>
+    </linearGradient>
+    <linearGradient id="accent" x1="0%" y1="0%" x2="100%" y2="0%">
+      <stop offset="0%" style="stop-color:#58a6ff"/>
+      <stop offset="50%" style="stop-color:#bc8cff"/>
+      <stop offset="100%" style="stop-color:#f778ba"/>
+    </linearGradient>
+    <linearGradient id="card" x1="0%" y1="0%" x2="0%" y2="100%">
+      <stop offset="0%" style="stop-color:#1c2333"/>
+      <stop offset="100%" style="stop-color:#161b22"/>
+    </linearGradient>
+  </defs>
+
+  <!-- Background -->
+  <rect width="1280" height="640" fill="url(#bg)"/>
+
+  <!-- Top accent bar -->
+  <rect x="0" y="0" width="1280" height="5" fill="url(#accent)"/>
+
+  <!-- Emoji icon -->
+  <text x="640" y="90" text-anchor="middle" fill="#ffffff" font-size="48">🤖</text>
+
+  <!-- Title -->
+  <text x="640" y="140" text-anchor="middle" fill="#ffffff" font-family="system-ui, -apple-system, sans-serif" font-size="52" font-weight="700">AI Models Catalog</text>
+
+  <!-- Subtitle -->
+  <text x="640" y="175" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="22">The most comprehensive structured catalog of AI models on GitHub</text>
+
+  <!-- Stats cards row -->
+  <rect x="60" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="180" y="268" text-anchor="middle" fill="#58a6ff" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">${modelCount.toLocaleString()}</text>
+  <text x="180" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Models</text>
+
+  <rect x="320" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="440" y="268" text-anchor="middle" fill="#bc8cff" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">${providerCount}</text>
+  <text x="440" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Providers</text>
+
+  <rect x="580" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="700" y="268" text-anchor="middle" fill="#f778ba" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">2,350</text>
+  <text x="700" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Tool Calling</text>
+
+  <rect x="840" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="960" y="268" text-anchor="middle" fill="#7ee787" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">1,306</text>
+  <text x="960" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Reasoning</text>
+
+  <rect x="1100" y="220" width="120" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="1160" y="268" text-anchor="middle" fill="#ffa657" font-family="system-ui, -apple-system, sans-serif" font-size="36" font-weight="700">81</text>
+  <text x="1160" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="14">Free</text>
+
+  <!-- Capability pills -->
+  <rect x="180" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#58a6ff" stroke-width="1"/>
+  <text x="260" y="392" text-anchor="middle" fill="#58a6ff" font-family="system-ui, -apple-system, sans-serif" font-size="14">Pricing</text>
+
+  <rect x="360" y="370" width="180" height="32" rx="16" fill="#1c2333" stroke="#bc8cff" stroke-width="1"/>
+  <text x="450" y="392" text-anchor="middle" fill="#bc8cff" font-family="system-ui, -apple-system, sans-serif" font-size="14">Context Windows</text>
+
+  <rect x="560" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#f778ba" stroke-width="1"/>
+  <text x="640" y="392" text-anchor="middle" fill="#f778ba" font-family="system-ui, -apple-system, sans-serif" font-size="14">Modalities</text>
+
+  <rect x="740" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#7ee787" stroke-width="1"/>
+  <text x="820" y="392" text-anchor="middle" fill="#7ee787" font-family="system-ui, -apple-system, sans-serif" font-size="14">Open Weights</text>
+
+  <rect x="920" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#ffa657" stroke-width="1"/>
+  <text x="1000" y="392" text-anchor="middle" fill="#ffa657" font-family="system-ui, -apple-system, sans-serif" font-size="14">Cached Pricing</text>
+
+  <!-- First-party data badge -->
+  <rect x="440" y="430" width="400" height="36" rx="18" fill="#238636" stroke-opacity="0"/>
+  <text x="640" y="454" text-anchor="middle" fill="#ffffff" font-family="system-ui, -apple-system, sans-serif" font-size="16" font-weight="600">✓ First-Party Data Only · Zod Validation</text>
+
+  <!-- Access methods -->
+  <text x="640" y="520" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="18">npm · CDN · CSV · GitHub Action · Hugging Face</text>
+
+  <!-- Install command -->
+  <rect x="390" y="545" width="500" height="40" rx="8" fill="#0d1117" stroke="#30363d" stroke-width="1"/>
+  <text x="640" y="572" text-anchor="middle" fill="#58a6ff" font-family="monospace" font-size="16">$ npm install ai-models</text>
+
+  <!-- Bottom accent bar -->
+  <rect x="0" y="635" width="1280" height="5" fill="url(#accent)"/>
+</svg>`;
+
+process.stdout.write(svg);
diff --git a/scripts/stats.ts b/scripts/stats.ts
new file mode 100644
index 00000000..ec294a7e
--- /dev/null
+++ b/scripts/stats.ts
@@ -0,0 +1,141 @@
+import fs from "node:fs";
+import path from "node:path";
+import { fileURLToPath } from "node:url";
+import YAML from "yaml";
+import { ModelSchema } from "../types/schemas";
+
+const __dirname = path.dirname(fileURLToPath(import.meta.url));
+const PROJECT_ROOT = path.resolve(__dirname, "..");
+
+interface Stats {
+  providers: number;
+  modelFiles: number;
+  uniqueModelIds: Set<string>;
+  families: Set<string>;
+  reasoning: number;
+  toolCall: number;
+  structuredOutput: number;
+  openWeights: number;
+  free: number;
+  vision: number;
+  imageOutput: number;
+  audioInput: number;
+  audioOutput: number;
+  videoInput: number;
+}
+
+function computeStats(): Stats {
+  const providersDir = path.join(PROJECT_ROOT, "providers");
+  const providerDirs = fs
+    .readdirSync(providersDir, { withFileTypes: true })
+    .filter((d) => d.isDirectory())
+    .map((d) => d.name)
+    .filter((name) => fs.existsSync(path.join(providersDir, name, "models")));
+
+  const stats: Stats = {
+    providers: providerDirs.length,
+    modelFiles: 0,
+    uniqueModelIds: new Set(),
+    families: new Set(),
+    reasoning: 0,
+    toolCall: 0,
+    structuredOutput: 0,
+    openWeights: 0,
+    free: 0,
+    vision: 0,
+    imageOutput: 0,
+    audioInput: 0,
+    audioOutput: 0,
+    videoInput: 0,
+  };
+
+  for (const providerId of providerDirs) {
+    const modelsDir = path.join(providersDir, providerId, "models");
+    const files = fs.readdirSync(modelsDir).filter((f) => f.endsWith(".yaml"));
+
+    for (const file of files) {
+      stats.modelFiles++;
+      const raw = fs.readFileSync(path.join(modelsDir, file), "utf-8");
+      const data = YAML.parse(raw);
+      const result = ModelSchema.safeParse(data);
+      if (!result.success) continue;
+
+      const model = result.data;
+      stats.uniqueModelIds.add(model.id);
+      if (model.family) stats.families.add(model.family);
+      if (model.reasoning) stats.reasoning++;
+      if (model.tool_call) stats.toolCall++;
+      if (model.structured_output) stats.structuredOutput++;
+      if (model.open_weights) stats.openWeights++;
+
+      // Check pricing for free models
+      if (model.pricing) {
+        const p = model.pricing as Record<string, unknown>;
+        if (p["unit"] === "free") stats.free++;
+      }
+
+      // Check modalities
+      if (model.modalities) {
+        const input = model.modalities.input ?? [];
+        const output = model.modalities.output ?? [];
+        if (input.includes("image")) stats.vision++;
+        if (output.includes("image")) stats.imageOutput++;
+        if (input.includes("audio")) stats.audioInput++;
+        if (output.includes("audio")) stats.audioOutput++;
+        if (input.includes("video")) stats.videoInput++;
+      }
+    }
+  }
+
+  return stats;
+}
+
+function main(): void {
+  const stats = computeStats();
+
+  const format = process.argv[2] ?? "table";
+
+  if (format === "json") {
+    console.log(
+      JSON.stringify(
+        {
+          providers: stats.providers,
+          model_files: stats.modelFiles,
+          unique_model_ids: stats.uniqueModelIds.size,
+          families: stats.families.size,
+          reasoning: stats.reasoning,
+          tool_call: stats.toolCall,
+          structured_output: stats.structuredOutput,
+          open_weights: stats.openWeights,
+          free: stats.free,
+          vision: stats.vision,
+          image_output: stats.imageOutput,
+          audio_input: stats.audioInput,
+          audio_output: stats.audioOutput,
+          video_input: stats.videoInput,
+        },
+        null,
+        2,
+      ),
+    );
+    return;
+  }
+
+  console.log("📊 AI Models Catalog Stats\n");
+  console.log(`Providers:             ${stats.providers}`);
+  console.log(`Model files:           ${stats.modelFiles}`);
+  console.log(`Unique model IDs:      ${stats.uniqueModelIds.size}`);
+  console.log(`Model families:        ${stats.families.size}`);
+  console.log(`Reasoning models:      ${stats.reasoning}`);
+  console.log(`Tool-calling models:   ${stats.toolCall}`);
+  console.log(`Structured output:     ${stats.structuredOutput}`);
+  console.log(`Open-weight models:    ${stats.openWeights}`);
+  console.log(`Free models:           ${stats.free}`);
+  console.log(`Vision (image input):  ${stats.vision}`);
+  console.log(`Image output:          ${stats.imageOutput}`);
+  console.log(`Audio input:           ${stats.audioInput}`);
+  console.log(`Audio output:          ${stats.audioOutput}`);
+  console.log(`Video input:           ${stats.videoInput}`);
+}
+
+main();
diff --git a/site/404.html b/site/404.html
new file mode 100644
index 00000000..f42be64e
--- /dev/null
+++ b/site/404.html
@@ -0,0 +1,83 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>Page Not Found — AI Models Catalog</title>
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text-secondary: #8b949e;
+        --accent: #58a6ff;
+      }
+      @media (prefers-color-scheme: light) {
+        :root {
+          --bg: #ffffff;
+          --surface: #f6f8fa;
+          --border: #d0d7de;
+          --text: #1f2328;
+          --text-secondary: #656d76;
+          --accent: #0969da;
+        }
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Helvetica, Arial, sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        display: flex;
+        justify-content: center;
+        align-items: center;
+        min-height: 100vh;
+        margin: 0;
+        padding: 20px;
+      }
+      .container {
+        text-align: center;
+        max-width: 480px;
+      }
+      h1 {
+        font-size: 72px;
+        margin: 0;
+        color: var(--accent);
+      }
+      h2 {
+        font-size: 20px;
+        margin: 8px 0 16px;
+        font-weight: 400;
+        color: var(--text-secondary);
+      }
+      p {
+        color: var(--text-secondary);
+        line-height: 1.6;
+        margin: 0 0 24px;
+      }
+      a {
+        color: var(--accent);
+        text-decoration: none;
+        padding: 10px 24px;
+        border: 1px solid var(--accent);
+        border-radius: 8px;
+        display: inline-block;
+        transition: all 0.2s;
+      }
+      a:hover {
+        background: var(--accent);
+        color: #fff;
+      }
+    </style>
+  </head>
+  <body>
+    <div class="container">
+      <h1>404</h1>
+      <h2>Model not found</h2>
+      <p>
+        This page doesn't exist in the AI Models Catalog. Maybe the model was deprecated, or the URL
+        is incorrect.
+      </p>
+      <a href="/">← Back to Catalog</a>
+    </div>
+  </body>
+</html>
diff --git a/site/ai-model-benchmarks.html b/site/ai-model-benchmarks.html
new file mode 100644
index 00000000..7cbf1be8
--- /dev/null
+++ b/site/ai-model-benchmarks.html
@@ -0,0 +1,653 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      AI Model Benchmarks Comparison 2025 — MMLU, MATH, HumanEval, SWE-bench | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare AI models across key benchmarks: MMLU, MATH-500, HumanEval, SWE-bench, GPQA, Chatbot Arena. 4,587 models from 95 providers with pricing and capabilities."
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/ai-model-benchmarks.html"
+    />
+    <meta property="og:title" content="AI Model Benchmarks Comparison 2025" />
+    <meta
+      property="og:description"
+      content="Compare AI models across MMLU, MATH-500, HumanEval, SWE-bench, GPQA, and Chatbot Arena benchmarks."
+    />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="577" />
+    <meta property="og:type" content="article" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Model Benchmarks Comparison 2025",
+        "description": "Compare AI models across key benchmarks",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "url": "https://i-need-token.github.io/ai-models/ai-model-benchmarks.html"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #fff;
+        --text: #1a1a2e;
+        --text2: #555;
+        --accent: #e94560;
+        --card: #f8f9fa;
+        --border: #e0e0e0;
+        --hero: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #0f0c29;
+          --text: #e0e0e0;
+          --text2: #aaa;
+          --accent: #e94560;
+          --card: #1a1a2e;
+          --border: #333;
+          --hero: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
+        color: var(--text);
+        background: var(--bg);
+        line-height: 1.7;
+      }
+      .hero {
+        background: var(--hero);
+        color: #fff;
+        padding: 60px 20px;
+        text-align: center;
+      }
+      .hero h1 {
+        font-size: 2.2em;
+        margin-bottom: 12px;
+      }
+      .hero p {
+        font-size: 1.1em;
+        opacity: 0.9;
+        max-width: 700px;
+        margin: 0 auto;
+      }
+      .container {
+        max-width: 900px;
+        margin: 0 auto;
+        padding: 30px 20px;
+      }
+      h2 {
+        color: var(--accent);
+        margin: 40px 0 16px;
+        font-size: 1.5em;
+        border-bottom: 2px solid var(--accent);
+        padding-bottom: 8px;
+      }
+      h3 {
+        margin: 24px 0 12px;
+        font-size: 1.2em;
+      }
+      p {
+        margin: 12px 0;
+        color: var(--text2);
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 0.9em;
+      }
+      th,
+      td {
+        padding: 10px 12px;
+        text-align: left;
+        border-bottom: 1px solid var(--border);
+      }
+      th {
+        background: var(--card);
+        font-weight: 600;
+      }
+      tr:hover {
+        background: var(--card);
+      }
+      .insight {
+        background: var(--card);
+        border-left: 4px solid var(--accent);
+        padding: 16px 20px;
+        margin: 20px 0;
+        border-radius: 0 8px 8px 0;
+      }
+      .insight strong {
+        color: var(--accent);
+      }
+      .related-pages {
+        margin: 40px 0;
+        padding: 20px 0;
+        border-top: 1px solid var(--border);
+      }
+      .related-pages a {
+        display: inline-block;
+        margin: 4px 8px 4px 0;
+        padding: 6px 14px;
+        background: var(--card);
+        border: 1px solid var(--border);
+        border-radius: 20px;
+        text-decoration: none;
+        color: var(--text);
+        font-size: 0.85em;
+      }
+      .related-pages a:hover {
+        border-color: var(--accent);
+        color: var(--accent);
+      }
+      footer {
+        text-align: center;
+        padding: 30px;
+        color: var(--text2);
+        font-size: 0.85em;
+        border-top: 1px solid var(--border);
+        margin-top: 40px;
+      }
+      footer a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      @media (max-width: 768px) {
+        .hero h1 {
+          font-size: 1.6em;
+        }
+        table {
+          font-size: 0.8em;
+        }
+        th,
+        td {
+          padding: 6px 8px;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <div class="hero">
+      <h1>📊 AI Model Benchmarks Comparison 2025</h1>
+      <p>
+        How do top AI models compare on MMLU, MATH-500, HumanEval, SWE-bench, and Chatbot Arena? A
+        comprehensive benchmark analysis of 4,587 models across 95 providers.
+      </p>
+    </div>
+    <div class="container">
+      <h2>1. General Knowledge — MMLU &amp; MMLU-Pro</h2>
+      <p>
+        MMLU (Massive Multitask Language Understanding) tests knowledge across 57 academic subjects.
+        MMLU-Pro is a harder variant requiring deeper reasoning.
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>MMLU</th>
+            <th>MMLU-Pro</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>GPT-4.1</td>
+            <td>~90%</td>
+            <td>~78%</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+          </tr>
+          <tr>
+            <td>Claude Opus 4</td>
+            <td>~90%</td>
+            <td>~78%</td>
+            <td>Anthropic</td>
+            <td>$15.00</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>~90%</td>
+            <td>~78%</td>
+            <td>Google</td>
+            <td>$1.25</td>
+          </tr>
+          <tr>
+            <td>Claude Sonnet 4</td>
+            <td>~88%</td>
+            <td>~76%</td>
+            <td>Anthropic</td>
+            <td>$3.00</td>
+          </tr>
+          <tr>
+            <td>Grok 3</td>
+            <td>~87%</td>
+            <td>~75%</td>
+            <td>xAI</td>
+            <td>$3.00</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1</td>
+            <td>~85%</td>
+            <td>~72%</td>
+            <td>DeepSeek</td>
+            <td>Free</td>
+          </tr>
+          <tr>
+            <td>Qwen3-235B</td>
+            <td>~85%</td>
+            <td>~72%</td>
+            <td>Alibaba</td>
+            <td>Free</td>
+          </tr>
+          <tr>
+            <td>Llama 4 Maverick</td>
+            <td>~82%</td>
+            <td>~68%</td>
+            <td>Meta</td>
+            <td>Free</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> MMLU is near-saturated for frontier models. Use MMLU-Pro or
+        GPQA for more discriminating comparisons.
+      </div>
+
+      <h2>2. Mathematics — MATH-500 &amp; AIME</h2>
+      <p>
+        MATH-500 tests competition-level mathematics. AIME 2024 is an even harder math competition
+        benchmark.
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>MATH-500</th>
+            <th>AIME 2024</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>o3</td>
+            <td>~96%</td>
+            <td>~83%</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+          </tr>
+          <tr>
+            <td>o4-mini</td>
+            <td>~93%</td>
+            <td>~75%</td>
+            <td>OpenAI</td>
+            <td>$1.10</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1</td>
+            <td>~92%</td>
+            <td>~72%</td>
+            <td>DeepSeek</td>
+            <td>Free</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>~91%</td>
+            <td>~70%</td>
+            <td>Google</td>
+            <td>$1.25</td>
+          </tr>
+          <tr>
+            <td>Qwen3-235B</td>
+            <td>~90%</td>
+            <td>~68%</td>
+            <td>Alibaba</td>
+            <td>Free</td>
+          </tr>
+          <tr>
+            <td>Claude Sonnet 4</td>
+            <td>~88%</td>
+            <td>~65%</td>
+            <td>Anthropic</td>
+            <td>$3.00</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> Reasoning models (o3, DeepSeek R1) dominate math benchmarks.
+        For cost-sensitive math tasks, DeepSeek R1 is free and performs near o3.
+      </div>
+
+      <h2>3. Coding — HumanEval &amp; SWE-bench</h2>
+      <p>
+        HumanEval tests Python code generation. SWE-bench tests real GitHub issue resolution — more
+        realistic for production use.
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>HumanEval</th>
+            <th>SWE-bench Verified</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Claude Sonnet 4</td>
+            <td>~93%</td>
+            <td>~72%</td>
+            <td>Anthropic</td>
+            <td>$3.00</td>
+          </tr>
+          <tr>
+            <td>o3</td>
+            <td>~92%</td>
+            <td>~70%</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+          </tr>
+          <tr>
+            <td>GPT-4.1</td>
+            <td>~91%</td>
+            <td>~65%</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>~90%</td>
+            <td>~63%</td>
+            <td>Google</td>
+            <td>$1.25</td>
+          </tr>
+          <tr>
+            <td>DeepSeek V3</td>
+            <td>~88%</td>
+            <td>~55%</td>
+            <td>DeepSeek</td>
+            <td>$0.07</td>
+          </tr>
+          <tr>
+            <td>Codestral</td>
+            <td>~86%</td>
+            <td>N/A</td>
+            <td>Mistral</td>
+            <td>$0.30</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> SWE-bench is more realistic than HumanEval. Claude Sonnet 4
+        leads on SWE-bench. For budget coding, DeepSeek V3 at $0.07/M offers remarkable value.
+      </div>
+
+      <h2>4. Science &amp; Reasoning — GPQA</h2>
+      <p>
+        GPQA (Graduate-Level Google-Proof Q&amp;A) tests expert-level scientific reasoning. Even
+        PhDs with internet access struggle.
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>GPQA Diamond</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>o3</td>
+            <td>~80%</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>~78%</td>
+            <td>Google</td>
+            <td>$1.25</td>
+          </tr>
+          <tr>
+            <td>Claude Opus 4</td>
+            <td>~75%</td>
+            <td>Anthropic</td>
+            <td>$15.00</td>
+          </tr>
+          <tr>
+            <td>o4-mini</td>
+            <td>~73%</td>
+            <td>OpenAI</td>
+            <td>$1.10</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1</td>
+            <td>~71%</td>
+            <td>DeepSeek</td>
+            <td>Free</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>5. Tool Calling — BFCL v3</h2>
+      <p>
+        BFCL (Berkeley Function Calling Leaderboard) tests function calling accuracy — critical for
+        AI agents.
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>BFCL v3</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>GPT-4.1</td>
+            <td>~88%</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+          </tr>
+          <tr>
+            <td>Claude Sonnet 4</td>
+            <td>~86%</td>
+            <td>Anthropic</td>
+            <td>$3.00</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>~85%</td>
+            <td>Google</td>
+            <td>$1.25</td>
+          </tr>
+          <tr>
+            <td>Grok 3</td>
+            <td>~83%</td>
+            <td>xAI</td>
+            <td>$3.00</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Flash</td>
+            <td>~82%</td>
+            <td>Google</td>
+            <td>Free</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> 2,350 models in our catalog support tool calling. GPT-4.1
+        leads on BFCL, but Gemini 2.5 Flash offers strong performance for free.
+      </div>
+
+      <h2>6. Human Preference — Chatbot Arena</h2>
+      <p>
+        LMSYS Chatbot Arena uses blind human comparisons. This is the most practical benchmark for
+        chat quality.
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Arena Score</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>GPT-4.1</td>
+            <td>~1380</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+          </tr>
+          <tr>
+            <td>Claude Sonnet 4</td>
+            <td>~1370</td>
+            <td>Anthropic</td>
+            <td>$3.00</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>~1360</td>
+            <td>Google</td>
+            <td>$1.25</td>
+          </tr>
+          <tr>
+            <td>Grok 3</td>
+            <td>~1350</td>
+            <td>xAI</td>
+            <td>$3.00</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1</td>
+            <td>~1330</td>
+            <td>DeepSeek</td>
+            <td>Free</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> Chatbot Arena correlates best with real-world chat quality.
+        The top 5 models are very close — pricing and features should drive your decision.
+      </div>
+
+      <h2>7. Best Value by Benchmark</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Benchmark</th>
+            <th>Best Free</th>
+            <th>Best Paid</th>
+            <th>Best Overall</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>MMLU</td>
+            <td>DeepSeek R1 / Qwen3</td>
+            <td>Gemini 2.5 Pro ($1.25)</td>
+            <td>GPT-4.1</td>
+          </tr>
+          <tr>
+            <td>MATH</td>
+            <td>DeepSeek R1</td>
+            <td>o4-mini ($1.10)</td>
+            <td>o3</td>
+          </tr>
+          <tr>
+            <td>Coding</td>
+            <td>DeepSeek V3 ($0.07)</td>
+            <td>Gemini 2.5 Pro ($1.25)</td>
+            <td>Claude Sonnet 4</td>
+          </tr>
+          <tr>
+            <td>GPQA</td>
+            <td>DeepSeek R1</td>
+            <td>Gemini 2.5 Pro ($1.25)</td>
+            <td>o3</td>
+          </tr>
+          <tr>
+            <td>Tool Calling</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Gemini 2.5 Pro ($1.25)</td>
+            <td>GPT-4.1</td>
+          </tr>
+          <tr>
+            <td>Chat</td>
+            <td>DeepSeek R1</td>
+            <td>Gemini 2.5 Pro ($1.25)</td>
+            <td>GPT-4.1</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>8. Benchmark Limitations</h2>
+      <div class="insight">
+        <strong>Data contamination:</strong> Models may have seen benchmark data during training.
+        Prefer LiveCodeBench over HumanEval for coding.
+      </div>
+      <div class="insight">
+        <strong>Task narrowness:</strong> Benchmarks test specific skills. Real-world performance
+        may differ significantly.
+      </div>
+      <div class="insight">
+        <strong>Cost blindness:</strong> Benchmarks ignore pricing, latency, and availability.
+        Always combine with our
+        <a href="llm-pricing.html" style="color: var(--accent)">pricing data</a>.
+      </div>
+      <div class="insight">
+        <strong>Staleness:</strong> Saturated benchmarks (GSM8K, HellaSwag) are uninformative. Focus
+        on harder benchmarks like GPQA and SWE-bench.
+      </div>
+
+      <div class="related-pages">
+        <strong>Explore More:</strong>
+        <a href="best-ai-models.html">Best AI Models</a>
+        <a href="free-ai-models.html">Free AI Models</a>
+        <a href="llm-pricing.html">LLM Pricing</a>
+        <a href="reasoning-models-comparison.html">Reasoning Models</a>
+        <a href="tool-calling-models-comparison.html">Tool Calling</a>
+        <a href="best-ai-models-for-coding.html">Coding Models</a>
+        <a href="cheapest-ai-models.html">Cheapest Models</a>
+        <a href="ai-model-pricing-calculator.html">Price Calculator</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="index.html">Interactive Catalog</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+      </div>
+    </div>
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models across 95 providers. Updated continuously.
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/ai-model-comparison-chart.html b/site/ai-model-comparison-chart.html
new file mode 100644
index 00000000..af581e62
--- /dev/null
+++ b/site/ai-model-comparison-chart.html
@@ -0,0 +1,760 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      AI Model Comparison Chart 2025 — Pricing, Context, Capabilities | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare 4,587 AI models side by side: pricing, context windows, tool calling, reasoning, vision, structured output. Interactive chart with 95 providers."
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/ai-model-comparison-chart.html"
+    />
+    <meta property="og:title" content="AI Model Comparison Chart 2025" />
+    <meta
+      property="og:description"
+      content="Side-by-side comparison of AI models: pricing, context windows, capabilities across 95 providers."
+    />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="577" />
+    <meta property="og:type" content="article" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Model Comparison Chart 2025",
+        "description": "Side-by-side comparison of AI models",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "url": "https://i-need-token.github.io/ai-models/ai-model-comparison-chart.html"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #fff;
+        --text: #1a1a2e;
+        --text2: #555;
+        --accent: #e94560;
+        --card: #f8f9fa;
+        --border: #e0e0e0;
+        --hero: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #0f0c29;
+          --text: #e0e0e0;
+          --text2: #aaa;
+          --accent: #e94560;
+          --card: #1a1a2e;
+          --border: #333;
+          --hero: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
+        color: var(--text);
+        background: var(--bg);
+        line-height: 1.7;
+      }
+      .hero {
+        background: var(--hero);
+        color: #fff;
+        padding: 60px 20px;
+        text-align: center;
+      }
+      .hero h1 {
+        font-size: 2.2em;
+        margin-bottom: 12px;
+      }
+      .hero p {
+        font-size: 1.1em;
+        opacity: 0.9;
+        max-width: 700px;
+        margin: 0 auto;
+      }
+      .container {
+        max-width: 1000px;
+        margin: 0 auto;
+        padding: 30px 20px;
+      }
+      h2 {
+        color: var(--accent);
+        margin: 40px 0 16px;
+        font-size: 1.5em;
+        border-bottom: 2px solid var(--accent);
+        padding-bottom: 8px;
+      }
+      p {
+        margin: 12px 0;
+        color: var(--text2);
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 0.85em;
+      }
+      th,
+      td {
+        padding: 8px 10px;
+        text-align: left;
+        border-bottom: 1px solid var(--border);
+      }
+      th {
+        background: var(--card);
+        font-weight: 600;
+        position: sticky;
+        top: 0;
+      }
+      tr:hover {
+        background: var(--card);
+      }
+      .yes {
+        color: #2e7d32;
+        font-weight: 600;
+      }
+      .no {
+        color: #999;
+      }
+      .insight {
+        background: var(--card);
+        border-left: 4px solid var(--accent);
+        padding: 16px 20px;
+        margin: 20px 0;
+        border-radius: 0 8px 8px 0;
+      }
+      .insight strong {
+        color: var(--accent);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #e94560, #c23152);
+        color: #fff;
+        padding: 12px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 20px 0;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .related-pages {
+        margin: 40px 0;
+        padding: 20px 0;
+        border-top: 1px solid var(--border);
+      }
+      .related-pages a {
+        display: inline-block;
+        margin: 4px 8px 4px 0;
+        padding: 6px 14px;
+        background: var(--card);
+        border: 1px solid var(--border);
+        border-radius: 20px;
+        text-decoration: none;
+        color: var(--text);
+        font-size: 0.85em;
+      }
+      .related-pages a:hover {
+        border-color: var(--accent);
+        color: var(--accent);
+      }
+      footer {
+        text-align: center;
+        padding: 30px;
+        color: var(--text2);
+        font-size: 0.85em;
+        border-top: 1px solid var(--border);
+        margin-top: 40px;
+      }
+      footer a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      @media (max-width: 768px) {
+        .hero h1 {
+          font-size: 1.6em;
+        }
+        table {
+          font-size: 0.75em;
+        }
+        th,
+        td {
+          padding: 5px 6px;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <div class="hero">
+      <h1>📊 AI Model Comparison Chart 2025</h1>
+      <p>
+        Side-by-side comparison of AI models: pricing, context windows, tool calling, reasoning,
+        vision, and structured output. Data from 95 providers, 4,587 models.
+      </p>
+    </div>
+    <div class="container">
+      <h2>1. Flagship Models Comparison</h2>
+      <p>The top models from each major provider, compared across all key dimensions.</p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+            <th>Output $/M</th>
+            <th>Context</th>
+            <th>Tool Call</th>
+            <th>Reasoning</th>
+            <th>Vision</th>
+            <th>Struct. Output</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>GPT-4.1</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+            <td>$8.00</td>
+            <td>1,047K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>o3</td>
+            <td>OpenAI</td>
+            <td>$2.00</td>
+            <td>$8.00</td>
+            <td>200K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>o4-mini</td>
+            <td>OpenAI</td>
+            <td>$1.10</td>
+            <td>$4.40</td>
+            <td>200K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Claude Opus 4</td>
+            <td>Anthropic</td>
+            <td>$15.00</td>
+            <td>$75.00</td>
+            <td>200K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Claude Sonnet 4</td>
+            <td>Anthropic</td>
+            <td>$3.00</td>
+            <td>$15.00</td>
+            <td>200K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Claude Haiku 3.5</td>
+            <td>Anthropic</td>
+            <td>$0.80</td>
+            <td>$4.00</td>
+            <td>200K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>Google</td>
+            <td>$1.25</td>
+            <td>$10.00</td>
+            <td>1,048K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Flash</td>
+            <td>Google</td>
+            <td>Free</td>
+            <td>Free</td>
+            <td>1,048K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Grok 3</td>
+            <td>xAI</td>
+            <td>$3.00</td>
+            <td>$15.00</td>
+            <td>131K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Grok 3 Mini</td>
+            <td>xAI</td>
+            <td>$0.30</td>
+            <td>$0.50</td>
+            <td>131K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1</td>
+            <td>DeepSeek</td>
+            <td>Free</td>
+            <td>Free</td>
+            <td>164K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>DeepSeek V3</td>
+            <td>DeepSeek</td>
+            <td>$0.07</td>
+            <td>$0.27</td>
+            <td>164K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Mistral Large</td>
+            <td>Mistral</td>
+            <td>$2.00</td>
+            <td>$6.00</td>
+            <td>128K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Codestral</td>
+            <td>Mistral</td>
+            <td>$0.30</td>
+            <td>$0.90</td>
+            <td>256K</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Qwen3-235B</td>
+            <td>Alibaba</td>
+            <td>Free</td>
+            <td>Free</td>
+            <td>128K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Command R+</td>
+            <td>Cohere</td>
+            <td>$2.50</td>
+            <td>$10.00</td>
+            <td>128K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Llama 4 Maverick</td>
+            <td>Meta</td>
+            <td>Free</td>
+            <td>Free</td>
+            <td>1,048K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Nova Pro</td>
+            <td>Amazon</td>
+            <td>$0.80</td>
+            <td>$3.20</td>
+            <td>300K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>2. Best Value Models (Under $1/M Input)</h2>
+      <p>Models that offer strong capabilities at budget-friendly prices.</p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+            <th>Output $/M</th>
+            <th>Context</th>
+            <th>Tool Call</th>
+            <th>Reasoning</th>
+            <th>Vision</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Gemini 2.5 Flash</td>
+            <td>Google</td>
+            <td>Free</td>
+            <td>Free</td>
+            <td>1,048K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1</td>
+            <td>DeepSeek</td>
+            <td>Free</td>
+            <td>Free</td>
+            <td>164K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Qwen3-235B</td>
+            <td>Alibaba</td>
+            <td>Free</td>
+            <td>Free</td>
+            <td>128K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>DeepSeek V3</td>
+            <td>DeepSeek</td>
+            <td>$0.07</td>
+            <td>$0.27</td>
+            <td>164K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Grok 3 Mini</td>
+            <td>xAI</td>
+            <td>$0.30</td>
+            <td>$0.50</td>
+            <td>131K</td>
+            <td class="yes">✅</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Codestral</td>
+            <td>Mistral</td>
+            <td>$0.30</td>
+            <td>$0.90</td>
+            <td>256K</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+            <td class="no">❌</td>
+          </tr>
+          <tr>
+            <td>Claude Haiku 3.5</td>
+            <td>Anthropic</td>
+            <td>$0.80</td>
+            <td>$4.00</td>
+            <td>200K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Nova Pro</td>
+            <td>Amazon</td>
+            <td>$0.80</td>
+            <td>$3.20</td>
+            <td>300K</td>
+            <td class="yes">✅</td>
+            <td class="no">❌</td>
+            <td class="yes">✅</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>3. Context Window Comparison</h2>
+      <p>Models with the largest context windows for processing long documents.</p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Provider</th>
+            <th>Context Window</th>
+            <th>Input $/M</th>
+            <th>Tool Call</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Gemini 2.5 Pro</td>
+            <td>Google</td>
+            <td>1,048,576</td>
+            <td>$1.25</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Gemini 2.5 Flash</td>
+            <td>Google</td>
+            <td>1,048,576</td>
+            <td>Free</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>GPT-4.1</td>
+            <td>OpenAI</td>
+            <td>1,047,576</td>
+            <td>$2.00</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Llama 4 Maverick</td>
+            <td>Meta</td>
+            <td>1,048,576</td>
+            <td>Free</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Nova Pro</td>
+            <td>Amazon</td>
+            <td>300,000</td>
+            <td>$0.80</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>Claude Opus/Sonnet 4</td>
+            <td>Anthropic</td>
+            <td>200,000</td>
+            <td>$3-15</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>o3 / o4-mini</td>
+            <td>OpenAI</td>
+            <td>200,000</td>
+            <td>$1.10-2</td>
+            <td class="yes">✅</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1/V3</td>
+            <td>DeepSeek</td>
+            <td>163,840</td>
+            <td>Free</td>
+            <td class="yes">✅</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>4. Capability Matrix</h2>
+      <p>How many models support each capability across our catalog.</p>
+      <table>
+        <thead>
+          <tr>
+            <th>Capability</th>
+            <th>Models</th>
+            <th>Free Models</th>
+            <th>Cheapest Paid</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Tool Calling</td>
+            <td>2,350</td>
+            <td>54</td>
+            <td>ling-2.6-flash ($0.01/$0.03)</td>
+          </tr>
+          <tr>
+            <td>Reasoning</td>
+            <td>1,306</td>
+            <td>18</td>
+            <td>qwen3.5-0.8b ($0.01/$0.05)</td>
+          </tr>
+          <tr>
+            <td>Vision</td>
+            <td>1,487</td>
+            <td>35</td>
+            <td>ling-2.6-flash ($0.01/$0.03)</td>
+          </tr>
+          <tr>
+            <td>Structured Output</td>
+            <td>829</td>
+            <td>24</td>
+            <td>ling-2.6-flash ($0.01/$0.03)</td>
+          </tr>
+          <tr>
+            <td>Open Weights</td>
+            <td>527</td>
+            <td>81</td>
+            <td>Free</td>
+          </tr>
+          <tr>
+            <td>Image Output</td>
+            <td>28</td>
+            <td>5</td>
+            <td>Various</td>
+          </tr>
+          <tr>
+            <td>Audio Input</td>
+            <td>118</td>
+            <td>12</td>
+            <td>Various</td>
+          </tr>
+          <tr>
+            <td>Audio Output</td>
+            <td>34</td>
+            <td>8</td>
+            <td>Various</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>5. Best Model by Use Case</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Use Case</th>
+            <th>Best Model</th>
+            <th>Why</th>
+            <th>Cost</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>AI Agents</td>
+            <td>GPT-4.1</td>
+            <td>#1 tool calling, parallel calls</td>
+            <td>$2/$8</td>
+          </tr>
+          <tr>
+            <td>Coding</td>
+            <td>Claude Sonnet 4</td>
+            <td>#1 SWE-bench, 64K output</td>
+            <td>$3/$15</td>
+          </tr>
+          <tr>
+            <td>Reasoning</td>
+            <td>o3</td>
+            <td>#1 MATH, GPQA</td>
+            <td>$2/$8</td>
+          </tr>
+          <tr>
+            <td>Long Documents</td>
+            <td>Gemini 2.5 Pro</td>
+            <td>1M context, best price</td>
+            <td>$1.25/$10</td>
+          </tr>
+          <tr>
+            <td>Chat</td>
+            <td>GPT-4.1</td>
+            <td>#1 Chatbot Arena</td>
+            <td>$2/$8</td>
+          </tr>
+          <tr>
+            <td>Budget</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Free with 1M context</td>
+            <td>Free</td>
+          </tr>
+          <tr>
+            <td>Open Source</td>
+            <td>Qwen3-235B</td>
+            <td>Best open-weight model</td>
+            <td>Free</td>
+          </tr>
+          <tr>
+            <td>Vision</td>
+            <td>Gemini 2.5 Pro</td>
+            <td>Best MMMU, image+video</td>
+            <td>$1.25/$10</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <div class="insight">
+        <strong>Explore all 4,587 models:</strong> Use our
+        <a href="index.html" style="color: var(--accent)">interactive catalog</a> to filter, sort,
+        compare, and calculate costs for any combination of models.
+      </div>
+
+      <div class="related-pages">
+        <strong>Explore More:</strong>
+        <a href="best-ai-models.html">Best AI Models</a>
+        <a href="free-ai-models.html">Free AI Models</a>
+        <a href="llm-pricing.html">LLM Pricing</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="openai-alternatives.html">OpenAI Alternatives</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="context-window-comparison.html">Context Windows</a>
+        <a href="cheapest-ai-models.html">Cheapest Models</a>
+        <a href="ai-model-pricing-calculator.html">Price Calculator</a>
+        <a href="index.html">Interactive Catalog</a>
+      </div>
+    </div>
+    <p><a href="small-language-models.html">Small Language Models</a></p>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models across 95 providers. Updated continuously.
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/ai-model-github-action.html b/site/ai-model-github-action.html
new file mode 100644
index 00000000..68999b2c
--- /dev/null
+++ b/site/ai-model-github-action.html
@@ -0,0 +1,401 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>AI Model GitHub Action — Automate Model Data in CI/CD | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="GitHub Action for AI model data. Auto-update model lists, validate pricing, check availability in your CI/CD pipeline. Free and open source."
+    />
+    <meta
+      name="keywords"
+      content="AI model GitHub Action, LLM CI/CD, model data automation, AI model API GitHub Action, LLM pricing automation"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/ai-model-github-action.html"
+    />
+    <meta property="og:title" content="AI Model GitHub Action — Automate Model Data in CI/CD" />
+    <meta
+      property="og:description"
+      content="GitHub Action for AI model data. Auto-update model lists, validate pricing, check availability in your pipeline."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Model GitHub Action — Automate Model Data in CI/CD",
+        "description": "GitHub Action for AI model data. Auto-update model lists, validate pricing, check availability in your pipeline.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21",
+        "url": "https://i-need-token.github.io/ai-models/ai-model-github-action.html"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #ffffff;
+        --bg-secondary: #f6f8fa;
+        --text: #1f2328;
+        --text-secondary: #656d76;
+        --border: #d0d7de;
+        --accent: #0969da;
+        --accent-light: #ddf4ff;
+        --card-bg: #ffffff;
+        --card-border: #d0d7de;
+        --success: #1a7f37;
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #0d1117;
+          --bg-secondary: #161b22;
+          --text: #e6edf3;
+          --text-secondary: #8b949e;
+          --border: #30363d;
+          --accent: #58a6ff;
+          --accent-light: #1f2d3d;
+          --card-bg: #161b22;
+          --card-border: #30363d;
+          --success: #3fb950;
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Helvetica, Arial, sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        line-height: 1.6;
+      }
+      .container {
+        max-width: 900px;
+        margin: 0 auto;
+        padding: 20px;
+      }
+      h1 {
+        font-size: 2em;
+        margin-bottom: 8px;
+      }
+      h2 {
+        font-size: 1.4em;
+        margin: 28px 0 12px;
+      }
+      h3 {
+        font-size: 1.15em;
+        margin: 20px 0 8px;
+      }
+      p {
+        margin: 8px 0;
+        color: var(--text-secondary);
+      }
+      a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      a:hover {
+        text-decoration: underline;
+      }
+      pre {
+        background: var(--bg-secondary);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 16px;
+        overflow-x: auto;
+        margin: 12px 0;
+        font-size: 0.9em;
+        line-height: 1.5;
+      }
+      code {
+        font-family: "SFMono-Regular", Consolas, "Liberation Mono", Menlo, monospace;
+        font-size: 0.9em;
+      }
+      .feature-grid {
+        display: grid;
+        grid-template-columns: repeat(auto-fit, minmax(250px, 1fr));
+        gap: 16px;
+        margin: 16px 0;
+      }
+      .feature-card {
+        background: var(--card-bg);
+        border: 1px solid var(--card-border);
+        border-radius: 8px;
+        padding: 16px;
+      }
+      .feature-card h3 {
+        margin-top: 0;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 12px 0;
+      }
+      th,
+      td {
+        padding: 8px 12px;
+        border: 1px solid var(--border);
+        text-align: left;
+      }
+      th {
+        background: var(--bg-secondary);
+        font-weight: 600;
+      }
+      .related-pages {
+        margin: 40px 0;
+        padding: 20px;
+        background: var(--bg-secondary);
+        border-radius: 8px;
+      }
+      .related-pages a {
+        display: inline-block;
+        margin: 4px 8px 4px 0;
+        padding: 4px 12px;
+        background: var(--card-bg);
+        border: 1px solid var(--card-border);
+        border-radius: 4px;
+        font-size: 0.9em;
+      }
+      footer {
+        margin-top: 40px;
+        padding: 20px 0;
+        border-top: 1px solid var(--border);
+        text-align: center;
+        color: var(--text-secondary);
+        font-size: 0.85em;
+      }
+      @media (max-width: 768px) {
+        .container {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.5em;
+        }
+        .feature-grid {
+          grid-template-columns: 1fr;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <div class="container">
+      <h1>⚡ AI Model GitHub Action</h1>
+      <p>
+        Automate AI model data in your CI/CD pipeline. Free, open source, and always up-to-date.
+      </p>
+
+      <h2>Quick Start</h2>
+      <pre><code>- name: Get AI Model Data
+  uses: i-need-token/ai-models@v0.2.0
+  with:
+    format: json
+    output: models.json</code></pre>
+
+      <h2>Features</h2>
+      <div class="feature-grid">
+        <div class="feature-card">
+          <h3>📊 Model Data</h3>
+          <p>
+            Get structured model data with pricing, context windows, and capabilities for 4,587+
+            models across 95 providers.
+          </p>
+        </div>
+        <div class="feature-card">
+          <h3>🔍 Filter & Search</h3>
+          <p>
+            Filter by provider, capability (tool calling, reasoning, vision), pricing tier, or
+            context window size.
+          </p>
+        </div>
+        <div class="feature-card">
+          <h3>💰 Price Tracking</h3>
+          <p>Monitor pricing changes across providers. Get alerts when model prices change.</p>
+        </div>
+        <div class="feature-card">
+          <h3>📋 Format Options</h3>
+          <p>Output as JSON, YAML, CSV, or Markdown table. Use in scripts, docs, or dashboards.</p>
+        </div>
+      </div>
+
+      <h2>Action Inputs</h2>
+      <table>
+        <tr>
+          <th>Input</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+        <tr>
+          <td><code>format</code></td>
+          <td>Output format: json, yaml, csv, markdown</td>
+          <td><code>json</code></td>
+        </tr>
+        <tr>
+          <td><code>output</code></td>
+          <td>Output file path</td>
+          <td><code>models.json</code></td>
+        </tr>
+        <tr>
+          <td><code>provider</code></td>
+          <td>Filter by provider name</td>
+          <td>(all)</td>
+        </tr>
+        <tr>
+          <td><code>capability</code></td>
+          <td>Filter by capability: tool_call, reasoning, vision, structured_output</td>
+          <td>(all)</td>
+        </tr>
+        <tr>
+          <td><code>free-only</code></td>
+          <td>Only include free models</td>
+          <td><code>false</code></td>
+        </tr>
+        <tr>
+          <td><code>max-price</code></td>
+          <td>Maximum input price per M tokens</td>
+          <td>(no limit)</td>
+        </tr>
+        <tr>
+          <td><code>min-context</code></td>
+          <td>Minimum context window size</td>
+          <td>0</td>
+        </tr>
+      </table>
+
+      <h2>Usage Examples</h2>
+
+      <h3>Get Free Models with Tool Calling</h3>
+      <pre><code>- name: Get free tool-calling models
+  uses: i-need-token/ai-models@v0.2.0
+  with:
+    format: json
+    output: free-tc-models.json
+    capability: tool_call
+    free-only: true</code></pre>
+
+      <h3>Get Cheapest Models Under $0.50/M</h3>
+      <pre><code>- name: Get budget models
+  uses: i-need-token/ai-models@v0.2.0
+  with:
+    format: csv
+    output: budget-models.csv
+    max-price: 0.50</code></pre>
+
+      <h3>Generate Model Comparison Table</h3>
+      <pre><code>- name: Generate comparison table
+  uses: i-need-token/ai-models@v0.2.0
+  with:
+    format: markdown
+    output: model-comparison.md
+    provider: openai
+    capability: reasoning</code></pre>
+
+      <h3>Weekly Price Monitoring</h3>
+      <pre><code>name: Price Monitor
+on:
+  schedule:
+    - cron: '0 6 * * 1'  # Every Monday 6:00 UTC
+jobs:
+  check-prices:
+    runs-on: ubuntu-latest
+    steps:
+      - uses: i-need-token/ai-models@v0.2.0
+        with:
+          format: csv
+          output: current-prices.csv
+      - name: Compare with last week
+        run: |
+          diff last-week-prices.csv current-prices.csv || echo "Prices changed!"
+      - name: Save for next week
+        run: cp current-prices.csv last-week-prices.csv</code></pre>
+
+      <h2>Output Formats</h2>
+
+      <h3>JSON</h3>
+      <pre><code>{
+  "generated_at": "2025-05-21T12:00:00Z",
+  "stats": { "models": 4587, "providers": 95 },
+  "models": [
+    {
+      "id": "gpt-4o",
+      "provider": "openai",
+      "pricing": { "input": 2.5, "output": 10 },
+      "limit": { "context": 128000 },
+      "tool_call": true,
+      "reasoning": false
+    }
+  ]
+}</code></pre>
+
+      <h3>CSV</h3>
+      <pre><code>id,provider,input_price,output_price,context_window,tool_call,reasoning
+gpt-4o,openai,2.5,10,128000,true,false</code></pre>
+
+      <h2>Why Use This Action?</h2>
+      <ul style="margin: 12px 0; padding-left: 24px">
+        <li style="margin: 8px 0">✅ Always up-to-date — data refreshed from provider APIs</li>
+        <li style="margin: 8px 0">✅ First-party data only — no third-party aggregators</li>
+        <li style="margin: 8px 0">✅ Structured & validated — TypeScript types + Zod schemas</li>
+        <li style="margin: 8px 0">✅ Zero configuration — works out of the box</li>
+        <li style="margin: 8px 0">✅ Free & open source — MIT license</li>
+      </ul>
+
+      <p>
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub →</a> ·
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog →</a>
+      </p>
+
+      <div class="related-pages">
+        <strong>Related:</strong>
+        <a href="best-ai-models.html">Best AI Models</a>
+        <a href="free-ai-models.html">Free AI Models</a>
+        <a href="cheapest-ai-models.html">Cheapest AI Models</a>
+        <a href="tool-calling-models-comparison.html">Tool Calling Models</a>
+        <a href="reasoning-models-comparison.html">Reasoning Models</a>
+        <a href="ai-model-picker.html">AI Model Picker</a>
+        <a href="best-ai-models-for-coding.html">Best for Coding</a>
+        <a href="best-ai-models-for-agents.html">Best for Agents</a>
+        <a href="best-ai-models-for-vision.html">Vision Models</a>
+        <a href="small-language-models.html">Small Language Models</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        <a href="context-window-comparison.html">Context Windows</a>
+        <a href="llm-pricing.html">LLM Pricing</a>
+        <a href="ai-model-pricing-calculator.html">Pricing Calculator</a>
+        <a href="openai-alternatives.html">OpenAI Alternatives</a>
+        <a href="open-source-ai-models.html">Open Source Models</a>
+        <a href="state-of-ai-models.html">State of AI Models</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="ai-models-by-provider.html">By Provider</a>
+        <a href="multimodal-ai-models.html">Multimodal Models</a>
+        <a href="structured-output-models-comparison.html">Structured Output</a>
+        <a href="best-ai-models-for-image-generation.html">Image Generation</a>
+      </div>
+
+      <footer>
+        <p>
+          Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> —
+          4,587 models across 95 providers. First-party data only.
+        </p>
+        <p>
+          <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> ·
+          <a href="https://github.com/i-need-token/ai-models">GitHub</a>
+        </p>
+      </footer>
+    </div>
+  </body>
+</html>
diff --git a/site/ai-model-picker.html b/site/ai-model-picker.html
new file mode 100644
index 00000000..f873a6aa
--- /dev/null
+++ b/site/ai-model-picker.html
@@ -0,0 +1,785 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      AI Model Picker — Find the Best Model for Your Use Case (2025) | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Answer 4 simple questions to find the best AI model for your use case. Compares 4,587+ models across 95 providers by price, capabilities, and context window."
+    />
+    <meta
+      name="keywords"
+      content="AI model picker, best AI model, LLM selector, model recommendation, which AI model to use, AI model comparison"
+    />
+    <link rel="canonical" href="https://i-need-token.github.io/ai-models/ai-model-picker.html" />
+    <meta property="og:title" content="AI Model Picker — Find the Best Model for Your Use Case" />
+    <meta
+      property="og:description"
+      content="Answer 4 questions to find the best AI model. Compares 4,587+ models by price, capabilities, and context window."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Model Picker — Find the Best Model for Your Use Case",
+        "description": "Answer 4 questions to find the best AI model. Compares 4,587+ models by price, capabilities, and context window.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21",
+        "url": "https://i-need-token.github.io/ai-models/ai-model-picker.html"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #ffffff;
+        --bg-secondary: #f6f8fa;
+        --text: #1f2328;
+        --text-secondary: #656d76;
+        --border: #d0d7de;
+        --accent: #0969da;
+        --accent-light: #ddf4ff;
+        --card-bg: #ffffff;
+        --card-border: #d0d7de;
+        --success: #1a7f37;
+        --warning: #9a6700;
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #0d1117;
+          --bg-secondary: #161b22;
+          --text: #e6edf3;
+          --text-secondary: #8b949e;
+          --border: #30363d;
+          --accent: #58a6ff;
+          --accent-light: #1f2d3d;
+          --card-bg: #161b22;
+          --card-border: #30363d;
+          --success: #3fb950;
+          --warning: #d29922;
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Helvetica, Arial, sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        line-height: 1.6;
+      }
+      .container {
+        max-width: 800px;
+        margin: 0 auto;
+        padding: 20px;
+      }
+      h1 {
+        font-size: 2em;
+        margin-bottom: 8px;
+      }
+      h2 {
+        font-size: 1.4em;
+        margin: 24px 0 12px;
+      }
+      p {
+        margin: 8px 0;
+        color: var(--text-secondary);
+      }
+      a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      a:hover {
+        text-decoration: underline;
+      }
+      .wizard {
+        margin: 24px 0;
+      }
+      .step {
+        display: none;
+        margin: 20px 0;
+      }
+      .step.active {
+        display: block;
+      }
+      .step-title {
+        font-size: 1.3em;
+        font-weight: 600;
+        margin-bottom: 16px;
+      }
+      .options {
+        display: grid;
+        grid-template-columns: repeat(auto-fit, minmax(200px, 1fr));
+        gap: 12px;
+        margin: 16px 0;
+      }
+      .option {
+        background: var(--card-bg);
+        border: 2px solid var(--card-border);
+        border-radius: 12px;
+        padding: 16px;
+        cursor: pointer;
+        transition: all 0.2s;
+      }
+      .option:hover {
+        border-color: var(--accent);
+        transform: translateY(-2px);
+      }
+      .option.selected {
+        border-color: var(--accent);
+        background: var(--accent-light);
+      }
+      .option-icon {
+        font-size: 2em;
+        margin-bottom: 8px;
+      }
+      .option-title {
+        font-weight: 600;
+        margin-bottom: 4px;
+      }
+      .option-desc {
+        font-size: 0.85em;
+        color: var(--text-secondary);
+      }
+      .btn {
+        display: inline-block;
+        background: var(--accent);
+        color: #fff;
+        padding: 12px 24px;
+        border-radius: 8px;
+        font-weight: 600;
+        border: none;
+        cursor: pointer;
+        font-size: 1em;
+      }
+      .btn:hover {
+        opacity: 0.9;
+      }
+      .btn:disabled {
+        opacity: 0.5;
+        cursor: not-allowed;
+      }
+      .btn-secondary {
+        background: var(--bg-secondary);
+        color: var(--text);
+        border: 1px solid var(--border);
+      }
+      .progress {
+        display: flex;
+        gap: 8px;
+        margin: 20px 0;
+      }
+      .progress-dot {
+        width: 12px;
+        height: 12px;
+        border-radius: 50%;
+        background: var(--border);
+      }
+      .progress-dot.active {
+        background: var(--accent);
+      }
+      .progress-dot.done {
+        background: var(--success);
+      }
+      .results {
+        display: none;
+        margin: 24px 0;
+      }
+      .results.active {
+        display: block;
+      }
+      .result-card {
+        background: var(--card-bg);
+        border: 1px solid var(--card-border);
+        border-radius: 12px;
+        padding: 20px;
+        margin: 12px 0;
+      }
+      .result-card.best {
+        border-color: var(--success);
+        border-width: 2px;
+      }
+      .result-rank {
+        display: inline-block;
+        background: var(--accent);
+        color: #fff;
+        width: 28px;
+        height: 28px;
+        border-radius: 50%;
+        text-align: center;
+        line-height: 28px;
+        font-weight: 700;
+        font-size: 0.85em;
+        margin-right: 8px;
+      }
+      .result-card.best .result-rank {
+        background: var(--success);
+      }
+      .result-name {
+        font-weight: 700;
+        font-size: 1.1em;
+      }
+      .result-meta {
+        display: flex;
+        gap: 16px;
+        margin: 8px 0;
+        flex-wrap: wrap;
+      }
+      .result-meta span {
+        font-size: 0.9em;
+        color: var(--text-secondary);
+      }
+      .result-price {
+        color: var(--success);
+        font-weight: 600;
+      }
+      .result-reason {
+        font-size: 0.9em;
+        color: var(--text-secondary);
+        margin-top: 8px;
+        font-style: italic;
+      }
+      .badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 12px;
+        font-size: 0.75em;
+        font-weight: 600;
+        margin-left: 4px;
+      }
+      .badge-tc {
+        background: #fff8c5;
+        color: #7c6600;
+      }
+      .badge-reason {
+        background: #f0fff4;
+        color: #1a7f37;
+      }
+      .badge-free {
+        background: #ddf4ff;
+        color: #0969da;
+      }
+      @media (prefers-color-scheme: dark) {
+        .badge-tc {
+          background: #3d2e00;
+          color: #d29922;
+        }
+        .badge-reason {
+          background: #0d2818;
+          color: #3fb950;
+        }
+        .badge-free {
+          background: #1f2d3d;
+          color: #58a6ff;
+        }
+      }
+      .related-pages {
+        margin: 40px 0;
+        padding: 20px;
+        background: var(--bg-secondary);
+        border-radius: 8px;
+      }
+      .related-pages a {
+        display: inline-block;
+        margin: 4px 8px 4px 0;
+        padding: 4px 12px;
+        background: var(--card-bg);
+        border: 1px solid var(--card-border);
+        border-radius: 4px;
+        font-size: 0.9em;
+      }
+      footer {
+        margin-top: 40px;
+        padding: 20px 0;
+        border-top: 1px solid var(--border);
+        text-align: center;
+        color: var(--text-secondary);
+        font-size: 0.85em;
+      }
+      .loading {
+        text-align: center;
+        padding: 40px;
+      }
+      .spinner {
+        display: inline-block;
+        width: 40px;
+        height: 40px;
+        border: 4px solid var(--border);
+        border-top-color: var(--accent);
+        border-radius: 50%;
+        animation: spin 1s linear infinite;
+      }
+      @keyframes spin {
+        to {
+          transform: rotate(360deg);
+        }
+      }
+      @media (max-width: 768px) {
+        .container {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.5em;
+        }
+        .options {
+          grid-template-columns: 1fr;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <div class="container">
+      <h1>🎯 AI Model Picker</h1>
+      <p>
+        Answer 4 questions to find the best AI model for your use case. Data from
+        <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587+ models
+        across 95 providers.
+      </p>
+
+      <div class="progress" id="progress">
+        <div class="progress-dot active" id="dot-1"></div>
+        <div class="progress-dot" id="dot-2"></div>
+        <div class="progress-dot" id="dot-3"></div>
+        <div class="progress-dot" id="dot-4"></div>
+      </div>
+
+      <div class="wizard" id="wizard">
+        <!-- Step 1: Use Case -->
+        <div class="step active" id="step-1">
+          <div class="step-title">What are you building?</div>
+          <div class="options" id="usecase-options">
+            <div class="option" data-value="agents" onclick="selectOption(1, this)">
+              <div class="option-icon">🤖</div>
+              <div class="option-title">AI Agents</div>
+              <div class="option-desc">Tool calling, autonomous workflows</div>
+            </div>
+            <div class="option" data-value="coding" onclick="selectOption(1, this)">
+              <div class="option-icon">💻</div>
+              <div class="option-title">Code Generation</div>
+              <div class="option-desc">Code completion, review, debugging</div>
+            </div>
+            <div class="option" data-value="chat" onclick="selectOption(1, this)">
+              <div class="option-icon">💬</div>
+              <div class="option-title">Chat / RAG</div>
+              <div class="option-desc">Conversational AI, document QA</div>
+            </div>
+            <div class="option" data-value="reasoning" onclick="selectOption(1, this)">
+              <div class="option-icon">🧮</div>
+              <div class="option-title">Math & Reasoning</div>
+              <div class="option-desc">Step-by-step problem solving</div>
+            </div>
+            <div class="option" data-value="vision" onclick="selectOption(1, this)">
+              <div class="option-icon">👁️</div>
+              <div class="option-title">Vision / Multimodal</div>
+              <div class="option-desc">Image understanding, OCR</div>
+            </div>
+            <div class="option" data-value="production" onclick="selectOption(1, this)">
+              <div class="option-icon">🏭</div>
+              <div class="option-title">High-Volume Production</div>
+              <div class="option-desc">Lowest cost per token at scale</div>
+            </div>
+          </div>
+        </div>
+
+        <!-- Step 2: Budget -->
+        <div class="step" id="step-2">
+          <div class="step-title">What's your budget per million tokens?</div>
+          <div class="options" id="budget-options">
+            <div class="option" data-value="free" onclick="selectOption(2, this)">
+              <div class="option-icon">🆓</div>
+              <div class="option-title">Free</div>
+              <div class="option-desc">$0 — prototyping & testing</div>
+            </div>
+            <div class="option" data-value="budget" onclick="selectOption(2, this)">
+              <div class="option-icon">💰</div>
+              <div class="option-title">Under $0.10/M</div>
+              <div class="option-desc">Budget-friendly production</div>
+            </div>
+            <div class="option" data-value="mid" onclick="selectOption(2, this)">
+              <div class="option-icon">⚖️</div>
+              <div class="option-title">Under $1/M</div>
+              <div class="option-desc">Balanced cost & quality</div>
+            </div>
+            <div class="option" data-value="premium" onclick="selectOption(2, this)">
+              <div class="option-icon">💎</div>
+              <div class="option-title">Premium</div>
+              <div class="option-desc">Best quality regardless of cost</div>
+            </div>
+          </div>
+        </div>
+
+        <!-- Step 3: Context Window -->
+        <div class="step" id="step-3">
+          <div class="step-title">How much context do you need?</div>
+          <div class="options" id="context-options">
+            <div class="option" data-value="small" onclick="selectOption(3, this)">
+              <div class="option-icon">📝</div>
+              <div class="option-title">Under 32K</div>
+              <div class="option-desc">Short prompts, simple tasks</div>
+            </div>
+            <div class="option" data-value="medium" onclick="selectOption(3, this)">
+              <div class="option-icon">📄</div>
+              <div class="option-title">32K – 128K</div>
+              <div class="option-desc">Documents, code files</div>
+            </div>
+            <div class="option" data-value="large" onclick="selectOption(3, this)">
+              <div class="option-icon">📚</div>
+              <div class="option-title">128K – 512K</div>
+              <div class="option-desc">Large codebases, long documents</div>
+            </div>
+            <div class="option" data-value="huge" onclick="selectOption(3, this)">
+              <div class="option-icon">🗄️</div>
+              <div class="option-title">512K+</div>
+              <div class="option-desc">Entire repos, massive datasets</div>
+            </div>
+          </div>
+        </div>
+
+        <!-- Step 4: Priority -->
+        <div class="step" id="step-4">
+          <div class="step-title">What matters most?</div>
+          <div class="options" id="priority-options">
+            <div class="option" data-value="cost" onclick="selectOption(4, this)">
+              <div class="option-icon">💸</div>
+              <div class="option-title">Lowest Cost</div>
+              <div class="option-desc">Minimize spending per token</div>
+            </div>
+            <div class="option" data-value="quality" onclick="selectOption(4, this)">
+              <div class="option-icon">🏆</div>
+              <div class="option-title">Best Quality</div>
+              <div class="option-desc">Highest accuracy & reasoning</div>
+            </div>
+            <div class="option" data-value="speed" onclick="selectOption(4, this)">
+              <div class="option-icon">⚡</div>
+              <div class="option-title">Lowest Latency</div>
+              <div class="option-desc">Fastest response time</div>
+            </div>
+            <div class="option" data-value="privacy" onclick="selectOption(4, this)">
+              <div class="option-icon">🔒</div>
+              <div class="option-title">Privacy / On-Device</div>
+              <div class="option-desc">Data never leaves your device</div>
+            </div>
+          </div>
+        </div>
+      </div>
+
+      <!-- Results -->
+      <div class="results" id="results">
+        <h2>🎯 Recommended Models</h2>
+        <p id="results-summary"></p>
+        <div id="results-list"></div>
+        <div style="margin-top: 20px">
+          <a class="btn" href="https://i-need-token.github.io/ai-models/"
+            >🔍 Explore All 4,587 Models →</a
+          >
+          <button class="btn btn-secondary" onclick="resetWizard()" style="margin-left: 8px">
+            🔄 Start Over
+          </button>
+        </div>
+      </div>
+
+      <div class="loading" id="loading" style="display: none">
+        <div class="spinner"></div>
+        <p style="margin-top: 12px">Finding the best models for you...</p>
+      </div>
+
+      <div class="related-pages">
+        <strong>Related:</strong>
+        <a href="best-ai-models.html">Best AI Models</a>
+        <a href="free-ai-models.html">Free AI Models</a>
+        <a href="cheapest-ai-models.html">Cheapest AI Models</a>
+        <a href="tool-calling-models-comparison.html">Tool Calling Models</a>
+        <a href="reasoning-models-comparison.html">Reasoning Models</a>
+        <a href="best-ai-models-for-coding.html">Best for Coding</a>
+        <a href="best-ai-models-for-agents.html">Best for Agents</a>
+        <a href="best-ai-models-for-vision.html">Vision Models</a>
+        <a href="small-language-models.html">Small Language Models</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        <a href="context-window-comparison.html">Context Windows</a>
+        <a href="llm-pricing.html">LLM Pricing</a>
+        <a href="ai-model-pricing-calculator.html">Pricing Calculator</a>
+        <a href="openai-alternatives.html">OpenAI Alternatives</a>
+        <a href="open-source-ai-models.html">Open Source Models</a>
+        <a href="state-of-ai-models.html">State of AI Models</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="ai-models-by-provider.html">By Provider</a>
+        <a href="multimodal-ai-models.html">Multimodal Models</a>
+        <a href="structured-output-models-comparison.html">Structured Output</a>
+        <a href="best-ai-models-for-image-generation.html">Image Generation</a>
+      </div>
+
+      <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+      <footer>
+        <p>
+          Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> —
+          4,587 models across 95 providers. First-party data only.
+        </p>
+        <p>
+          <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> ·
+          <a href="https://github.com/i-need-token/ai-models">GitHub</a>
+        </p>
+      </footer>
+    </div>
+
+    <script>
+      let answers = { usecase: null, budget: null, context: null, priority: null };
+      let allModels = [];
+      const AGG = new Set([
+        "openrouter",
+        "requesty",
+        "auriko",
+        "llmgateway",
+        "cortecs",
+        "aihubmix",
+        "orcarouter",
+        "fastrouter",
+        "302ai",
+        "martian",
+        "nanogpt",
+        "jiekou",
+        "venice",
+        "meganova",
+      ]);
+
+      // Load models
+      fetch("models.json")
+        .then((r) => r.json())
+        .then((data) => {
+          allModels = data.models || [];
+        })
+        .catch(() => {});
+
+      function selectOption(step, el) {
+        // Remove previous selection
+        el.parentElement.querySelectorAll(".option").forEach((o) => o.classList.remove("selected"));
+        el.classList.add("selected");
+
+        const value = el.dataset.value;
+        const keys = ["usecase", "budget", "context", "priority"];
+        answers[keys[step - 1]] = value;
+
+        // Update progress
+        for (let i = 1; i <= 4; i++) {
+          const dot = document.getElementById("dot-" + i);
+          dot.className = "progress-dot";
+          if (i < step) dot.classList.add("done");
+          if (i === step) dot.classList.add("active");
+        }
+
+        // Auto-advance after 500ms
+        setTimeout(() => {
+          if (step < 4) {
+            document.getElementById("step-" + step).classList.remove("active");
+            document.getElementById("step-" + (step + 1)).classList.add("active");
+            document.getElementById("dot-" + step).classList.remove("active");
+            document.getElementById("dot-" + step).classList.add("done");
+            document.getElementById("dot-" + (step + 1)).classList.add("active");
+          } else {
+            showResults();
+          }
+        }, 500);
+      }
+
+      function showResults() {
+        document.getElementById("wizard").style.display = "none";
+        document.getElementById("loading").style.display = "block";
+
+        setTimeout(() => {
+          const results = recommendModels();
+          renderResults(results);
+          document.getElementById("loading").style.display = "none";
+          document.getElementById("results").classList.add("active");
+        }, 800);
+      }
+
+      function recommendModels() {
+        let candidates = allModels.filter((m) => !AGG.has(m.provider));
+
+        // Filter by budget
+        if (answers.budget === "free") {
+          candidates = candidates.filter((m) => m.pricing && m.pricing.unit === "free");
+        } else if (answers.budget === "budget") {
+          candidates = candidates.filter(
+            (m) => m.pricing && m.pricing.unit !== "free" && m.pricing.input <= 0.1,
+          );
+        } else if (answers.budget === "mid") {
+          candidates = candidates.filter(
+            (m) => m.pricing && m.pricing.unit !== "free" && m.pricing.input <= 1,
+          );
+        }
+        // premium: no filter
+
+        // Filter by context
+        if (answers.context === "small") {
+          candidates = candidates.filter(
+            (m) => m.limit && m.limit.context > 0 && m.limit.context < 32768,
+          );
+        } else if (answers.context === "medium") {
+          candidates = candidates.filter(
+            (m) => m.limit && m.limit.context >= 32768 && m.limit.context < 131072,
+          );
+        } else if (answers.context === "large") {
+          candidates = candidates.filter(
+            (m) => m.limit && m.limit.context >= 131072 && m.limit.context < 524288,
+          );
+        } else if (answers.context === "huge") {
+          candidates = candidates.filter((m) => m.limit && m.limit.context >= 524288);
+        }
+
+        // Score by use case
+        candidates = candidates.map((m) => {
+          let score = 0;
+          if (answers.usecase === "agents") {
+            if (m.tool_call) score += 10;
+            if (m.reasoning) score += 5;
+            if (m.pricing && m.pricing.unit !== "free") score -= Math.min(m.pricing.input * 2, 5);
+          } else if (answers.usecase === "coding") {
+            if (m.tool_call) score += 8;
+            if (m.reasoning) score += 5;
+            if (m.structured_output) score += 3;
+          } else if (answers.usecase === "chat") {
+            if (m.limit && m.limit.context >= 131072) score += 5;
+            if (m.tool_call) score += 3;
+          } else if (answers.usecase === "reasoning") {
+            if (m.reasoning) score += 10;
+            if (m.tool_call) score += 3;
+          } else if (answers.usecase === "vision") {
+            const mods = m.modalities || [];
+            const hasVision = mods.some(
+              (mod) => mod.type === "image" && mod.modalities && mod.modalities.includes("input"),
+            );
+            if (hasVision) score += 10;
+            if (m.tool_call) score += 3;
+          } else if (answers.usecase === "production") {
+            if (m.pricing && m.pricing.unit !== "free") score -= Math.min(m.pricing.input * 5, 10);
+            if (m.tool_call) score += 5;
+          }
+
+          // Priority scoring
+          if (answers.priority === "cost") {
+            if (m.pricing && m.pricing.unit === "free") score += 10;
+            else if (m.pricing && m.pricing.input <= 0.1) score += 8;
+            else if (m.pricing && m.pricing.input <= 0.5) score += 4;
+          } else if (answers.priority === "quality") {
+            if (m.reasoning) score += 5;
+            if (m.tool_call) score += 3;
+          } else if (answers.priority === "speed") {
+            if (m.pricing && m.pricing.unit !== "free" && m.pricing.input <= 0.5) score += 5;
+          } else if (answers.priority === "privacy") {
+            if (m.open_weights) score += 10;
+          }
+
+          return { ...m, score };
+        });
+
+        // Sort by score descending
+        candidates.sort((a, b) => b.score - a.score);
+
+        return candidates.slice(0, 5);
+      }
+
+      function renderResults(results) {
+        const usecaseNames = {
+          agents: "AI Agents",
+          coding: "Code Generation",
+          chat: "Chat / RAG",
+          reasoning: "Math & Reasoning",
+          vision: "Vision / Multimodal",
+          production: "High-Volume Production",
+        };
+        const budgetNames = {
+          free: "Free",
+          budget: "Under $0.10/M",
+          mid: "Under $1/M",
+          premium: "Premium",
+        };
+
+        document.getElementById("results-summary").textContent =
+          `Top ${results.length} models for ${usecaseNames[answers.usecase] || answers.usecase} with ${budgetNames[answers.budget] || answers.budget} budget:`;
+
+        const list = document.getElementById("results-list");
+        list.innerHTML = "";
+
+        results.forEach((m, i) => {
+          const isBest = i === 0;
+          const price =
+            m.pricing && m.pricing.unit === "free"
+              ? "Free"
+              : m.pricing
+                ? `$${m.pricing.input}/$${m.pricing.output} per M`
+                : "N/A";
+          const ctx =
+            m.limit && m.limit.context
+              ? m.limit.context >= 1000
+                ? `${Math.round(m.limit.context / 1000)}K`
+                : m.limit.context
+              : "N/A";
+
+          const badges = [];
+          if (m.tool_call) badges.push('<span class="badge badge-tc">Tool Calling</span>');
+          if (m.reasoning) badges.push('<span class="badge badge-reason">Reasoning</span>');
+          if (m.pricing && m.pricing.unit === "free")
+            badges.push('<span class="badge badge-free">Free</span>');
+
+          const reasons = [];
+          if (answers.usecase === "agents" && m.tool_call)
+            reasons.push("Supports tool calling for agent workflows");
+          if (answers.usecase === "coding" && m.tool_call)
+            reasons.push("Tool calling for code execution");
+          if (answers.usecase === "reasoning" && m.reasoning)
+            reasons.push("Built-in reasoning capability");
+          if (answers.usecase === "vision") reasons.push("Supports image input");
+          if (answers.priority === "cost" && m.pricing && m.pricing.unit === "free")
+            reasons.push("Completely free to use");
+          if (answers.priority === "cost" && m.pricing && m.pricing.input <= 0.1)
+            reasons.push("Very low cost per token");
+          if (m.limit && m.limit.context >= 131072) reasons.push(`${ctx} context window`);
+
+          const card = document.createElement("div");
+          card.className = "result-card" + (isBest ? " best" : "");
+          card.innerHTML = `
+            <div><span class="result-rank">${i + 1}</span><span class="result-name">${m.id}</span> ${badges.join(" ")}</div>
+            <div class="result-meta">
+              <span>Provider: ${m.provider}</span>
+              <span class="result-price">${price}</span>
+              <span>Context: ${ctx}</span>
+            </div>
+            ${reasons.length ? `<div class="result-reason">${reasons[0]}</div>` : ""}
+          `;
+          list.appendChild(card);
+        });
+      }
+
+      function resetWizard() {
+        answers = { usecase: null, budget: null, context: null, priority: null };
+        document.getElementById("results").classList.remove("active");
+        document.getElementById("wizard").style.display = "block";
+        document.querySelectorAll(".step").forEach((s) => s.classList.remove("active"));
+        document.getElementById("step-1").classList.add("active");
+        document.querySelectorAll(".option").forEach((o) => o.classList.remove("selected"));
+        document.querySelectorAll(".progress-dot").forEach((d, i) => {
+          d.className = "progress-dot";
+          if (i === 0) d.classList.add("active");
+        });
+      }
+    </script>
+  </body>
+</html>
diff --git a/site/ai-model-pricing-calculator.html b/site/ai-model-pricing-calculator.html
new file mode 100644
index 00000000..38b5a0fa
--- /dev/null
+++ b/site/ai-model-pricing-calculator.html
@@ -0,0 +1,915 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>AI Model Pricing Calculator — LLM Cost Calculator (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Calculate your AI/LLM costs. Compare pricing for GPT-4o, Claude, Gemini, DeepSeek and 4,587+ models. Monthly cost estimator with token usage calculator."
+    />
+    <meta
+      name="keywords"
+      content="AI pricing calculator, LLM cost calculator, AI model pricing, GPT-4 cost, Claude pricing, Gemini pricing, token cost calculator, API cost estimator"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+    />
+    <meta property="og:title" content="AI Model Pricing Calculator — LLM Cost Calculator (2025)" />
+    <meta
+      property="og:description"
+      content="Calculate your AI/LLM costs. Compare pricing for 4,587+ models."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="AI Model Pricing Calculator — LLM Cost Calculator (2025)" />
+    <meta
+      name="twitter:description"
+      content="Calculate your AI/LLM costs. Compare pricing for 4,587+ models."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .calc-box {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 12px;
+        padding: 24px;
+        margin: 20px 0;
+      }
+      .calc-box label {
+        display: block;
+        color: var(--text2);
+        font-size: 13px;
+        margin-bottom: 4px;
+        margin-top: 12px;
+      }
+      .calc-box select,
+      .calc-box input {
+        width: 100%;
+        padding: 8px 12px;
+        background: var(--bg);
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        color: var(--text);
+        font-size: 14px;
+      }
+      .calc-box select:focus,
+      .calc-box input:focus {
+        outline: none;
+        border-color: var(--accent);
+      }
+      .result {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin-top: 16px;
+        text-align: center;
+      }
+      .result .cost {
+        font-size: 2rem;
+        font-weight: 700;
+        color: var(--green);
+      }
+      .compare-grid {
+        display: grid;
+        grid-template-columns: repeat(auto-fill, minmax(200px, 1fr));
+        gap: 12px;
+        margin: 16px 0;
+      }
+      .compare-card {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px;
+      }
+      .compare-card .name {
+        font-weight: 600;
+      }
+      .compare-card .price {
+        color: var(--green);
+        font-size: 1.2rem;
+        font-weight: 700;
+      }
+      .compare-card .detail {
+        color: var(--text2);
+        font-size: 12px;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Model Pricing Calculator — LLM Cost Calculator (2025)",
+        "description": "Calculate your AI/LLM costs. Compare pricing for GPT-4o, Claude, Gemini, DeepSeek and 4,587+ models.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>💰 AI Model Pricing Calculator (2025)</h1>
+    <p>
+      Calculate your monthly AI costs. Compare pricing for <b>4,587+ models</b> across
+      <b>95 providers</b>. Real-time cost estimation based on your token usage.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>4,587+</b><small>Models</small></div>
+      <div class="stat"><b>95</b><small>Providers</small></div>
+      <div class="stat"><b>81</b><small>Free Models</small></div>
+      <div class="stat"><b>1,374</b><small>With Cache Pricing</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <h2>🧮 Cost Calculator</h2>
+    <div class="calc-box">
+      <label for="model">Select Model</label>
+      <select id="model" onchange="calculate()">
+        <option value="">-- Choose a model --</option>
+        <option value="2.5,10" data-name="gpt-4o" data-ctx="128000">
+          gpt-4o (openai) — $2.5/$10 per 1M tokens
+        </option>
+        <option value="0.15,0.6" data-name="gpt-4o-mini" data-ctx="128000">
+          gpt-4o-mini (openai) — $0.15/$0.6 per 1M tokens
+        </option>
+        <option value="2,8" data-name="gpt-4.1" data-ctx="1047576">
+          gpt-4.1 (openai) — $2/$8 per 1M tokens
+        </option>
+        <option value="0.4,1.6" data-name="gpt-4.1-mini" data-ctx="1047576">
+          gpt-4.1-mini (openai) — $0.4/$1.6 per 1M tokens
+        </option>
+        <option value="10,40" data-name="o3" data-ctx="200000">
+          o3 (openai) — $10/$40 per 1M tokens
+        </option>
+        <option value="1.1,4.4" data-name="o4-mini" data-ctx="200000">
+          o4-mini (openai) — $1.1/$4.4 per 1M tokens
+        </option>
+        <option value="1.25,10" data-name="gemini-2.5-pro" data-ctx="1000000">
+          gemini-2.5-pro (google) — $1.25/$10 per 1M tokens
+        </option>
+        <option value="0.3,2.5" data-name="gemini-2.5-flash" data-ctx="1000000">
+          gemini-2.5-flash (google) — $0.3/$2.5 per 1M tokens
+        </option>
+        <option value="0.1,0.4" data-name="gemini-2.0-flash" data-ctx="1048576">
+          gemini-2.0-flash (google) — $0.1/$0.4 per 1M tokens
+        </option>
+        <option value="0.14,0.28" data-name="deepseek-chat" data-ctx="1000000">
+          deepseek-chat (deepseek) — $0.14/$0.28 per 1M tokens
+        </option>
+        <option value="1.35,5.4" data-name="deepseek-r1" data-ctx="65536">
+          deepseek-r1 (deepseek) — $1.35/$5.4 per 1M tokens
+        </option>
+        <option value="0.25,0.87" data-name="llama-4-maverick" data-ctx="1048576">
+          llama-4-maverick (meta) — $0.25/$0.87 per 1M tokens
+        </option>
+        <option value="0.25,0.7" data-name="llama-4-scout" data-ctx="1048576">
+          llama-4-scout (meta) — $0.25/$0.7 per 1M tokens
+        </option>
+        <option value="2,8" data-name="qwen3-235b-a22b" data-ctx="0">
+          qwen3-235b-a22b (alibaba) — $2/$8 per 1M tokens
+        </option>
+      </select>
+
+      <label for="inputTokens">Monthly Input Tokens (millions)</label>
+      <input type="number" id="inputTokens" value="1" min="0" step="0.1" oninput="calculate()" />
+
+      <label for="outputTokens">Monthly Output Tokens (millions)</label>
+      <input type="number" id="outputTokens" value="0.5" min="0" step="0.1" oninput="calculate()" />
+
+      <div class="result" id="result" style="display: none">
+        <div>Monthly Cost</div>
+        <div class="cost" id="cost">$0.00</div>
+        <div id="breakdown" style="color: var(--text2); font-size: 13px; margin-top: 8px"></div>
+      </div>
+    </div>
+
+    <script>
+      function calculate() {
+        var sel = document.getElementById("model");
+        var opt = sel.options[sel.selectedIndex];
+        if (!opt.value) {
+          document.getElementById("result").style.display = "none";
+          return;
+        }
+        var parts = opt.value.split(",");
+        var inputPrice = parseFloat(parts[0]);
+        var outputPrice = parseFloat(parts[1]);
+        var inputM = parseFloat(document.getElementById("inputTokens").value) || 0;
+        var outputM = parseFloat(document.getElementById("outputTokens").value) || 0;
+        var inputCost = inputM * inputPrice;
+        var outputCost = outputM * outputPrice;
+        var total = inputCost + outputCost;
+        document.getElementById("cost").textContent = "$" + total.toFixed(2);
+        document.getElementById("breakdown").textContent =
+          "Input: $" + inputCost.toFixed(2) + " + Output: $" + outputCost.toFixed(2);
+        document.getElementById("result").style.display = "block";
+      }
+    </script>
+
+    <h2>📊 Quick Cost Comparison</h2>
+    <p>Monthly cost for 1M input + 0.5M output tokens across popular models.</p>
+    <div class="compare-grid">
+      <div class="compare-card">
+        <div class="name">gpt-4o</div>
+        <div class="price">$7.50/mo</div>
+        <div class="detail">$2.5 in / $10 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">gpt-4o-mini</div>
+        <div class="price">$0.45/mo</div>
+        <div class="detail">$0.15 in / $0.6 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">gpt-4.1</div>
+        <div class="price">$6.00/mo</div>
+        <div class="detail">$2 in / $8 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">gpt-4.1-mini</div>
+        <div class="price">$1.20/mo</div>
+        <div class="detail">$0.4 in / $1.6 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">o3</div>
+        <div class="price">$30.00/mo</div>
+        <div class="detail">$10 in / $40 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">o4-mini</div>
+        <div class="price">$3.30/mo</div>
+        <div class="detail">$1.1 in / $4.4 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">gemini-2.5-pro</div>
+        <div class="price">$6.25/mo</div>
+        <div class="detail">$1.25 in / $10 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">gemini-2.5-flash</div>
+        <div class="price">$1.55/mo</div>
+        <div class="detail">$0.3 in / $2.5 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">gemini-2.0-flash</div>
+        <div class="price">$0.30/mo</div>
+        <div class="detail">$0.1 in / $0.4 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">deepseek-chat</div>
+        <div class="price">$0.28/mo</div>
+        <div class="detail">$0.14 in / $0.28 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">deepseek-r1</div>
+        <div class="price">$4.05/mo</div>
+        <div class="detail">$1.35 in / $5.4 out per 1M</div>
+      </div>
+      <div class="compare-card">
+        <div class="name">llama-4-maverick</div>
+        <div class="price">$0.69/mo</div>
+        <div class="detail">$0.25 in / $0.87 out per 1M</div>
+      </div>
+    </div>
+
+    <h2>💵 Cheapest Models Overall</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-image-1-mini</b></td>
+        <td>aimlapi</td>
+        <td>$0.007</td>
+        <td>$0.676</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>klusterai</td>
+        <td>$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-image-1-model</b></td>
+        <td>aimlapi</td>
+        <td>$0.012</td>
+        <td>$0.175</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct-turbo</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>🔧 Cheapest with Tool Calling</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+    </table>
+
+    <h2>🧠 Cheapest with Reasoning</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.14</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>deepinfra</td>
+        <td>$0.039</td>
+        <td>$0.19</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-9b-v2</b></td>
+        <td>deepinfra</td>
+        <td>$0.04</td>
+        <td>$0.16</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>novitaai</td>
+        <td>$0.04</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nemotron-3-nano-30b-a3b</b></td>
+        <td>deepinfra</td>
+        <td>$0.05</td>
+        <td>$0.2</td>
+        <td>262K</td>
+      </tr>
+    </table>
+
+    <h2>👁️ Cheapest with Vision</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>paddlepaddle--paddleocr-vl</b></td>
+        <td>novitaai</td>
+        <td>$0.02</td>
+        <td>$0.02</td>
+        <td>16K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr-2</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>reka-edge-2</b></td>
+        <td>reka</td>
+        <td>$0.03</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--autoglm-phone-9b-multilingual</b></td>
+        <td>novitaai</td>
+        <td>$0.035</td>
+        <td>$0.138</td>
+        <td>65K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.0375</td>
+        <td>$0.15</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>google-gemma-3-4b</b></td>
+        <td>amazon-bedrock</td>
+        <td>$0.04</td>
+        <td>$0.08</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>💡 How to Reduce Your AI Costs</h2>
+    <ul>
+      <li>
+        <b>Use smaller models for simple tasks</b> — GPT-4o Mini is 60x cheaper than GPT-4o for
+        basic tasks
+      </li>
+      <li>
+        <b>Enable prompt caching</b> — 1,374 models offer cache pricing (typically 50% off cached
+        input tokens)
+      </li>
+      <li>
+        <b>Choose open-weight models</b> — 527 models you can self-host for fixed infrastructure
+        costs
+      </li>
+      <li>
+        <b>Try free models for prototyping</b> — 81 models at zero cost before committing to paid
+        APIs
+      </li>
+      <li>
+        <b>Compare across providers</b> — same model (e.g., Llama 4) may cost differently on Groq
+        vs. Together vs. Fireworks
+      </li>
+      <li>
+        <b>Use the interactive catalog</b> —
+        <a href="https://i-need-token.github.io/ai-models/"
+          >filter by capability and sort by price</a
+        >
+      </li>
+    </ul>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All pricing data is sourced from <b>first-party provider APIs</b>. Prices are per million
+      tokens (1M = 1,000,000 tokens). Aggregator providers are excluded from ranking tables to avoid
+      duplicate models. Cache pricing is shown separately where available.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+          >Best AI Models for Coding</a
+        >
+        — code-focused comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+          >Best AI Models for Agents</a
+        >
+        — agentic model comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/ai-models-by-provider.html b/site/ai-models-by-provider.html
new file mode 100644
index 00000000..c834ae3c
--- /dev/null
+++ b/site/ai-models-by-provider.html
@@ -0,0 +1,4584 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>AI Models by Provider — All 95 Providers Listed (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Browse AI models by provider. All 95 providers listed with model counts, pricing, and capabilities. OpenAI, Anthropic, Google, Meta, DeepSeek, Mistral, and more."
+    />
+    <meta
+      name="keywords"
+      content="AI models by provider, OpenAI models list, Anthropic models, Google Gemini models, Llama models, DeepSeek models, Mistral models, AI provider comparison"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+    />
+    <meta property="og:title" content="AI Models by Provider — All 95 Providers Listed (2025)" />
+    <meta
+      property="og:description"
+      content="Browse AI models by provider. All 95 providers listed with model counts, pricing, and capabilities."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="AI Models by Provider — All 95 Providers Listed (2025)" />
+    <meta
+      name="twitter:description"
+      content="Browse AI models by provider. All 95 providers listed with model counts, pricing, and capabilities."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      h3 {
+        font-size: 1.1rem;
+        margin-top: 24px;
+        color: var(--orange);
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .nav {
+        display: flex;
+        gap: 8px;
+        flex-wrap: wrap;
+        margin: 16px 0;
+      }
+      .nav a {
+        color: var(--accent);
+        text-decoration: none;
+        padding: 4px 10px;
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        font-size: 12px;
+      }
+      .nav a:hover {
+        border-color: var(--accent);
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .provider-section {
+        margin: 24px 0;
+      }
+      .provider-header {
+        display: flex;
+        align-items: center;
+        gap: 12px;
+        margin-bottom: 8px;
+      }
+      .provider-count {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 12px;
+        padding: 2px 10px;
+        font-size: 12px;
+        color: var(--text2);
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Models by Provider — All 95 Providers Listed (2025)",
+        "description": "Browse AI models by provider. All 95 providers listed with model counts, pricing, and capabilities.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>🏢 AI Models by Provider — All 95 Providers Listed</h1>
+    <p>
+      Browse <b>4,587</b> AI models across <b>95</b> providers. First-party data with real pricing,
+      context windows, and capabilities.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>95</b><small>Providers</small></div>
+      <div class="stat"><b>4,587</b><small>Models</small></div>
+      <div class="stat"><b>81</b><small>Free Models</small></div>
+      <div class="stat"><b>527</b><small>Open Weights</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="nav">
+      <a href="#openai">OpenAI</a>
+      <a href="#anthropic">Anthropic</a>
+      <a href="#google">Google</a>
+      <a href="#meta">Meta</a>
+      <a href="#deepseek">DeepSeek</a>
+      <a href="#mistral">Mistral</a>
+      <a href="#xai">xAI</a>
+      <a href="#amazon-bedrock">AWS Bedrock</a>
+      <a href="#groq">Groq</a>
+      <a href="#togetherai">Together AI</a>
+      <a href="#fireworks">Fireworks</a>
+      <a href="#cerebras">Cerebras</a>
+    </div>
+
+    <h2>📊 Provider Overview</h2>
+    <p>All 95 providers sorted by number of models. Click a provider to see their models.</p>
+    <table>
+      <tr>
+        <th>Provider</th>
+        <th>Models</th>
+        <th>Cheapest Input $/1M</th>
+        <th>Max Context</th>
+        <th>Tool Call</th>
+        <th>Free</th>
+      </tr>
+      <tr>
+        <td>
+          <a href="#nanogpt"><b>nanogpt</b></a> (aggregator)
+        </td>
+        <td>547</td>
+        <td>Aggregator</td>
+        <td>?</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#aihubmix"><b>aihubmix</b></a> (aggregator)
+        </td>
+        <td>476</td>
+        <td>Aggregator</td>
+        <td>?</td>
+        <td>132</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#openrouter"><b>openrouter</b></a> (aggregator)
+        </td>
+        <td>356</td>
+        <td>Aggregator</td>
+        <td>10M</td>
+        <td>263</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#martian"><b>martian</b></a> (aggregator)
+        </td>
+        <td>304</td>
+        <td>Aggregator</td>
+        <td>?</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#requesty"><b>requesty</b></a> (aggregator)
+        </td>
+        <td>277</td>
+        <td>Aggregator</td>
+        <td>1M</td>
+        <td>251</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#302ai"><b>302ai</b></a> (aggregator)
+        </td>
+        <td>268</td>
+        <td>Aggregator</td>
+        <td>2M</td>
+        <td>190</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#auriko"><b>auriko</b></a> (aggregator)
+        </td>
+        <td>181</td>
+        <td>Aggregator</td>
+        <td>1M</td>
+        <td>154</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#llmgateway"><b>llmgateway</b></a> (aggregator)
+        </td>
+        <td>163</td>
+        <td>Aggregator</td>
+        <td>?</td>
+        <td>158</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#aimlapi"><b>aimlapi</b></a>
+        </td>
+        <td>147</td>
+        <td>$0.007</td>
+        <td>2M</td>
+        <td>21</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#fastrouter"><b>fastrouter</b></a> (aggregator)
+        </td>
+        <td>120</td>
+        <td>Aggregator</td>
+        <td>2M</td>
+        <td>94</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#orcarouter"><b>orcarouter</b></a> (aggregator)
+        </td>
+        <td>120</td>
+        <td>Aggregator</td>
+        <td>1M</td>
+        <td>102</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#cortecs"><b>cortecs</b></a> (aggregator)
+        </td>
+        <td>105</td>
+        <td>Aggregator</td>
+        <td>?</td>
+        <td>97</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#novitaai"><b>novitaai</b></a>
+        </td>
+        <td>104</td>
+        <td>$0.02</td>
+        <td>1M</td>
+        <td>72</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#vultr"><b>vultr</b></a>
+        </td>
+        <td>98</td>
+        <td>$0.55</td>
+        <td>1M</td>
+        <td>11</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#deepinfra"><b>deepinfra</b></a>
+        </td>
+        <td>88</td>
+        <td>$0.01</td>
+        <td>1M</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#venice"><b>venice</b></a> (aggregator)
+        </td>
+        <td>75</td>
+        <td>Aggregator</td>
+        <td>2M</td>
+        <td>64</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#jiekou"><b>jiekou</b></a> (aggregator)
+        </td>
+        <td>73</td>
+        <td>Aggregator</td>
+        <td>2M</td>
+        <td>73</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#meganova"><b>meganova</b></a> (aggregator)
+        </td>
+        <td>63</td>
+        <td>Aggregator</td>
+        <td>1M</td>
+        <td>60</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#alibaba"><b>alibaba</b></a>
+        </td>
+        <td>62</td>
+        <td>$0.15</td>
+        <td>1M</td>
+        <td>62</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#ppio"><b>ppio</b></a>
+        </td>
+        <td>60</td>
+        <td>$0.2145</td>
+        <td>1M</td>
+        <td>46</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#amazon-bedrock"><b>amazon-bedrock</b></a>
+        </td>
+        <td>57</td>
+        <td>$0.035</td>
+        <td>1M</td>
+        <td>37</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#google-vertex"><b>google-vertex</b></a>
+        </td>
+        <td>38</td>
+        <td>$0.07</td>
+        <td>1M</td>
+        <td>32</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#siliconflow-cn"><b>siliconflow-cn</b></a>
+        </td>
+        <td>37</td>
+        <td>$0.5</td>
+        <td>262K</td>
+        <td>2</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#stepfun"><b>stepfun</b></a>
+        </td>
+        <td>31</td>
+        <td>$0.7</td>
+        <td>256K</td>
+        <td>0</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#cloudflare"><b>cloudflare</b></a>
+        </td>
+        <td>30</td>
+        <td>$0.017</td>
+        <td>327K</td>
+        <td>15</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#databricks"><b>databricks</b></a>
+        </td>
+        <td>29</td>
+        <td>$0.05</td>
+        <td>200K</td>
+        <td>4</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#gmicloud"><b>gmicloud</b></a>
+        </td>
+        <td>29</td>
+        <td>$0.07</td>
+        <td>1M</td>
+        <td>11</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#openai"><b>openai</b></a>
+        </td>
+        <td>28</td>
+        <td>$0.02</td>
+        <td>1M</td>
+        <td>18</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#siliconflow"><b>siliconflow</b></a>
+        </td>
+        <td>27</td>
+        <td>$0.04</td>
+        <td>1M</td>
+        <td>24</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#togetherai"><b>togetherai</b></a>
+        </td>
+        <td>24</td>
+        <td>$0.03</td>
+        <td>262K</td>
+        <td>22</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#nebius"><b>nebius</b></a>
+        </td>
+        <td>23</td>
+        <td>$0.02</td>
+        <td>1M</td>
+        <td>21</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#google"><b>google</b></a>
+        </td>
+        <td>21</td>
+        <td>$0.075</td>
+        <td>2M</td>
+        <td>8</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#minimax"><b>minimax</b></a>
+        </td>
+        <td>21</td>
+        <td>$2.1</td>
+        <td>204K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#voyage"><b>voyage</b></a>
+        </td>
+        <td>21</td>
+        <td>$0.02</td>
+        <td>?</td>
+        <td>0</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#digitalocean"><b>digitalocean</b></a>
+        </td>
+        <td>20</td>
+        <td>$0.05</td>
+        <td>1M</td>
+        <td>14</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#inferencenet"><b>inferencenet</b></a>
+        </td>
+        <td>20</td>
+        <td>$0.01</td>
+        <td>131K</td>
+        <td>15</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#zhipuai"><b>zhipuai</b></a>
+        </td>
+        <td>20</td>
+        <td>$0.1</td>
+        <td>1M</td>
+        <td>20</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#tencent-tokenhub"><b>tencent-tokenhub</b></a>
+        </td>
+        <td>19</td>
+        <td>$1</td>
+        <td>1M</td>
+        <td>16</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#mistral"><b>mistral</b></a>
+        </td>
+        <td>16</td>
+        <td>$0.04</td>
+        <td>256K</td>
+        <td>12</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#moonshotai"><b>moonshotai</b></a>
+        </td>
+        <td>16</td>
+        <td>$2</td>
+        <td>262K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#neuralwatt"><b>neuralwatt</b></a>
+        </td>
+        <td>14</td>
+        <td>$0.03</td>
+        <td>?</td>
+        <td>14</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#tencent"><b>tencent</b></a>
+        </td>
+        <td>14</td>
+        <td>$0.5</td>
+        <td>250K</td>
+        <td>3</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#scaleway"><b>scaleway</b></a>
+        </td>
+        <td>13</td>
+        <td>$0.15</td>
+        <td>131K</td>
+        <td>6</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#chutes"><b>chutes</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.08</td>
+        <td>262K</td>
+        <td>12</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#clarifai"><b>clarifai</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.09</td>
+        <td>1M</td>
+        <td>9</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#cloudferro-sherlock"><b>cloudferro-sherlock</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.26</td>
+        <td>1M</td>
+        <td>5</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#groq"><b>groq</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td>8</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#klusterai"><b>klusterai</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.008</td>
+        <td>1M</td>
+        <td>4</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#meta"><b>meta</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.1</td>
+        <td>10M</td>
+        <td>9</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#microsoft"><b>microsoft</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.075</td>
+        <td>128K</td>
+        <td>6</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#ovhcloud"><b>ovhcloud</b></a>
+        </td>
+        <td>12</td>
+        <td>$0.05</td>
+        <td>262K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#anthropic"><b>anthropic</b></a>
+        </td>
+        <td>11</td>
+        <td>$1</td>
+        <td>1M</td>
+        <td>11</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#baichuan"><b>baichuan</b></a>
+        </td>
+        <td>11</td>
+        <td>$0.98</td>
+        <td>131K</td>
+        <td>0</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#cerebras"><b>cerebras</b></a>
+        </td>
+        <td>11</td>
+        <td>$0.1</td>
+        <td>131K</td>
+        <td>9</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#hpc-ai"><b>hpc-ai</b></a>
+        </td>
+        <td>11</td>
+        <td>$0.14</td>
+        <td>1M</td>
+        <td>11</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#hyperbolic"><b>hyperbolic</b></a>
+        </td>
+        <td>11</td>
+        <td>$0.1</td>
+        <td>163K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#fireworks"><b>fireworks</b></a>
+        </td>
+        <td>10</td>
+        <td>$0.07</td>
+        <td>1M</td>
+        <td>10</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#baseten"><b>baseten</b></a>
+        </td>
+        <td>9</td>
+        <td>$0.1</td>
+        <td>1M</td>
+        <td>9</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#baidu"><b>baidu</b></a>
+        </td>
+        <td>8</td>
+        <td>$0.126</td>
+        <td>1M</td>
+        <td>7</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#evroc"><b>evroc</b></a>
+        </td>
+        <td>8</td>
+        <td>$0.1</td>
+        <td>131K</td>
+        <td>3</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#friendli"><b>friendli</b></a>
+        </td>
+        <td>8</td>
+        <td>$0.1</td>
+        <td>262K</td>
+        <td>8</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#upstage"><b>upstage</b></a>
+        </td>
+        <td>8</td>
+        <td>$0.1</td>
+        <td>128K</td>
+        <td>3</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#amazon"><b>amazon</b></a>
+        </td>
+        <td>7</td>
+        <td>$0.035</td>
+        <td>1M</td>
+        <td>7</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#arcee"><b>arcee</b></a>
+        </td>
+        <td>7</td>
+        <td>$0.04</td>
+        <td>262K</td>
+        <td>6</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#berget"><b>berget</b></a>
+        </td>
+        <td>7</td>
+        <td>$0.2</td>
+        <td>?</td>
+        <td>7</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#morph"><b>morph</b></a>
+        </td>
+        <td>7</td>
+        <td>$0.2</td>
+        <td>1M</td>
+        <td>5</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#nousresearch"><b>nousresearch</b></a>
+        </td>
+        <td>7</td>
+        <td>$0.06</td>
+        <td>131K</td>
+        <td>7</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#sambanova"><b>sambanova</b></a>
+        </td>
+        <td>7</td>
+        <td>$0.22</td>
+        <td>196K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#dinference"><b>dinference</b></a>
+        </td>
+        <td>6</td>
+        <td>$0.07</td>
+        <td>204K</td>
+        <td>3</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#iflytek"><b>iflytek</b></a>
+        </td>
+        <td>6</td>
+        <td>$0.8</td>
+        <td>262K</td>
+        <td>0</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#submodel"><b>submodel</b></a>
+        </td>
+        <td>6</td>
+        <td>$0.1</td>
+        <td>262K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#textsynth"><b>textsynth</b></a>
+        </td>
+        <td>6</td>
+        <td>$0.2</td>
+        <td>131K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#writer"><b>writer</b></a>
+        </td>
+        <td>6</td>
+        <td>$0.6</td>
+        <td>1M</td>
+        <td>3</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#xai"><b>xai</b></a>
+        </td>
+        <td>6</td>
+        <td>$0.2</td>
+        <td>131K</td>
+        <td>6</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#01ai"><b>01ai</b></a>
+        </td>
+        <td>5</td>
+        <td>$1</td>
+        <td>32K</td>
+        <td>4</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#aion"><b>aion</b></a>
+        </td>
+        <td>5</td>
+        <td>$0.7</td>
+        <td>131K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#bytedance"><b>bytedance</b></a>
+        </td>
+        <td>5</td>
+        <td>$0.07</td>
+        <td>262K</td>
+        <td>4</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#inception"><b>inception</b></a>
+        </td>
+        <td>5</td>
+        <td>$0.25</td>
+        <td>128K</td>
+        <td>3</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#mixlayer"><b>mixlayer</b></a>
+        </td>
+        <td>5</td>
+        <td>$0.1</td>
+        <td>131K</td>
+        <td>5</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#privatemode"><b>privatemode</b></a>
+        </td>
+        <td>5</td>
+        <td>$0.43</td>
+        <td>131K</td>
+        <td>3</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#xiaomi"><b>xiaomi</b></a>
+        </td>
+        <td>5</td>
+        <td>$0.1</td>
+        <td>1M</td>
+        <td>5</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#deepseek"><b>deepseek</b></a>
+        </td>
+        <td>4</td>
+        <td>$0.14</td>
+        <td>1M</td>
+        <td>4</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#perplexity"><b>perplexity</b></a>
+        </td>
+        <td>4</td>
+        <td>$1</td>
+        <td>200K</td>
+        <td>4</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#inclusionai"><b>inclusionai</b></a>
+        </td>
+        <td>3</td>
+        <td>$0.01</td>
+        <td>262K</td>
+        <td>3</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#ai21"><b>ai21</b></a>
+        </td>
+        <td>2</td>
+        <td>$0.2</td>
+        <td>256K</td>
+        <td>0</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#reka"><b>reka</b></a>
+        </td>
+        <td>2</td>
+        <td>$0.03</td>
+        <td>131K</td>
+        <td>1</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>
+          <a href="#wafer"><b>wafer</b></a>
+        </td>
+        <td>2</td>
+        <td>$0.6</td>
+        <td>262K</td>
+        <td>2</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="openai">🏢 OpenAI</h2>
+    <p>GPT-4, GPT-4o, o1, o3 — the industry standard for LLMs. 28 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>text-embedding-3-small</b></td>
+        <td>$0.02</td>
+        <td>$0</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1-nano</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>text-embedding-ada-002</b></td>
+        <td>$0.1</td>
+        <td>$0</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>text-embedding-3-large</b></td>
+        <td>$0.13</td>
+        <td>$0</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1-mini</b></td>
+        <td>$0.4</td>
+        <td>$1.6</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-3.5-turbo</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>16K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>o3-mini</b></td>
+        <td>$1.1</td>
+        <td>$4.4</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o4-mini</b></td>
+        <td>$1.1</td>
+        <td>$4.4</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>codex-mini</b></td>
+        <td>$1.5</td>
+        <td>$6</td>
+        <td>192K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o1-mini</b></td>
+        <td>$1.5</td>
+        <td>$6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-audio</b></td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o</b></td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-3.5-turbo-16k</b></td>
+        <td>$3</td>
+        <td>$4</td>
+        <td>16K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-realtime</b></td>
+        <td>$5</td>
+        <td>$20</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4-turbo</b></td>
+        <td>$10</td>
+        <td>$30</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>o3</b></td>
+        <td>$10</td>
+        <td>$40</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o1-realtime</b></td>
+        <td>$15</td>
+        <td>$60</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o1</b></td>
+        <td>$15</td>
+        <td>$60</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4</b></td>
+        <td>$30</td>
+        <td>$60</td>
+        <td>8K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4-32k</b></td>
+        <td>$60</td>
+        <td>$120</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>o1-pro</b></td>
+        <td>$150</td>
+        <td>$600</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>dall-e-2</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>dall-e-3</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>tts-1-hd</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>tts-1</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>whisper-1</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="anthropic">🏢 Anthropic</h2>
+    <p>Claude — known for safety, reasoning, and long context. 11 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>claude-haiku-4-5</b></td>
+        <td>$1</td>
+        <td>$5</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-0</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-5</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-6</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-5</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-6</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-7</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-0</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-1</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-6-fast</b></td>
+        <td>$30</td>
+        <td>$150</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-7-fast</b></td>
+        <td>$30</td>
+        <td>$150</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="google">🏢 Google</h2>
+    <p>Gemini — multimodal models with massive context windows. 21 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash-lite</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash-lite</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>$0.15</td>
+        <td>$3.5</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-pro</b></td>
+        <td>$1.25</td>
+        <td>$5</td>
+        <td>2M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>chirp-3.0-HD</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-12b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-1b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-27b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-4b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3n-E2B-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3n-E4B-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-3.0-fast-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-3.0-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-4.0-fast-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-4.0-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>lyria-2.0</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>veo-2.0-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="meta">🏢 Meta</h2>
+    <p>Llama — open-weight models you can run anywhere. 12 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.2-1b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.2-3b</b></td>
+        <td>$0.15</td>
+        <td>$0.15</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.2-11b-vision</b></td>
+        <td>$0.16</td>
+        <td>$0.16</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout</b></td>
+        <td>$0.17</td>
+        <td>$0.66</td>
+        <td>10M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b</b></td>
+        <td>$0.22</td>
+        <td>$0.22</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick</b></td>
+        <td>$0.24</td>
+        <td>$0.97</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-8b</b></td>
+        <td>$0.3</td>
+        <td>$0.6</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-70b</b></td>
+        <td>$0.72</td>
+        <td>$0.72</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.2-90b-vision</b></td>
+        <td>$0.72</td>
+        <td>$0.72</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.3-70b</b></td>
+        <td>$0.72</td>
+        <td>$0.72</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-405b</b></td>
+        <td>$2.4</td>
+        <td>$2.4</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-70b</b></td>
+        <td>$2.65</td>
+        <td>$3.5</td>
+        <td>8K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="deepseek">🏢 DeepSeek</h2>
+    <p>High-performance reasoning at competitive prices. 4 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>deepseek-chat</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-reasoner</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$0.435</td>
+        <td>$0.87</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="mistral">🏢 Mistral</h2>
+    <p>European AI with open and commercial models. 16 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>ministral-3b</b></td>
+        <td>$0.04</td>
+        <td>$0.04</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>voxtral-mini</b></td>
+        <td>$0.04</td>
+        <td>$0.04</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>ministral-8b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>voxtral-small</b></td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-7b</b></td>
+        <td>$0.15</td>
+        <td>$0.2</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo</b></td>
+        <td>$0.15</td>
+        <td>$0.15</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-small</b></td>
+        <td>$0.2</td>
+        <td>$0.6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-medium</b></td>
+        <td>$0.4</td>
+        <td>$2</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mixtral-8x7b</b></td>
+        <td>$0.45</td>
+        <td>$0.7</td>
+        <td>32K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>magistral-small</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mixtral-8x22b</b></td>
+        <td>$0.8</td>
+        <td>$1.2</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-large</b></td>
+        <td>$2</td>
+        <td>$6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>pixtral-large</b></td>
+        <td>$2</td>
+        <td>$6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-large-2407</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>codestral</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>256K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>devstral</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="xai">🏢 xAI</h2>
+    <p>Grok — models with real-time knowledge. 6 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>xai-grok-4-fast</b></td>
+        <td>$0.2</td>
+        <td>$0.5</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>xai-grok-4.1</b></td>
+        <td>$0.2</td>
+        <td>$0.5</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>xai-grok-3-mini</b></td>
+        <td>$0.25</td>
+        <td>$1.27</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>xai-grok-4.2</b></td>
+        <td>$2</td>
+        <td>$6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>xai-grok-3</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>xai-grok-4</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="amazon-bedrock">🏢 AWS Bedrock</h2>
+    <p>Managed access to multiple foundation models. 57 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google-gemma-3-4b</b></td>
+        <td>$0.04</td>
+        <td>$0.08</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-voxtral-mini</b></td>
+        <td>$0.04</td>
+        <td>$0.04</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-lite</b></td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>300K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-2</b></td>
+        <td>$0.06</td>
+        <td>$0.23</td>
+        <td>4K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-3-30b</b></td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>4K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai-gpt-oss-20b</b></td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai-gpt-oss-safeguard-20b</b></td>
+        <td>$0.07</td>
+        <td>$0.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>zai-glm-4-7-flash</b></td>
+        <td>$0.07</td>
+        <td>$0.4</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google-gemma-3-12b</b></td>
+        <td>$0.09</td>
+        <td>$0.29</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-2-1b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-ministral-3b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-voxtral-small</b></td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-2-3b</b></td>
+        <td>$0.15</td>
+        <td>$0.15</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-ministral-8b</b></td>
+        <td>$0.15</td>
+        <td>$0.15</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-7b</b></td>
+        <td>$0.15</td>
+        <td>$0.2</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-3-super-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.65</td>
+        <td>4K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai-gpt-oss-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai-gpt-oss-safeguard-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-qwen3-32b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-qwen3-coder-30b-a3b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>writer-palmyra-vision-7b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-2-11b</b></td>
+        <td>$0.16</td>
+        <td>$0.16</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>$0.17</td>
+        <td>$0.66</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-ministral-14b</b></td>
+        <td>$0.2</td>
+        <td>$0.2</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-2-vl</b></td>
+        <td>$0.2</td>
+        <td>$0.6</td>
+        <td>4K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-1-8b</b></td>
+        <td>$0.22</td>
+        <td>$0.22</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google-gemma-3-27b</b></td>
+        <td>$0.23</td>
+        <td>$0.38</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>$0.24</td>
+        <td>$0.97</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-8b</b></td>
+        <td>$0.3</td>
+        <td>$0.6</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-1</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-2-lite</b></td>
+        <td>$0.33</td>
+        <td>$2.75</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-devstral</b></td>
+        <td>$0.4</td>
+        <td>$2</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mixtral-8x7b</b></td>
+        <td>$0.45</td>
+        <td>$0.7</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-magistral-small</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-large-3</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-qwen3-coder-next</b></td>
+        <td>$0.5</td>
+        <td>$1.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-qwen3-vl-235b-a22b</b></td>
+        <td>$0.53</td>
+        <td>$2.66</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2-thinking</b></td>
+        <td>$0.6</td>
+        <td>$2.5</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshot-kimi-k2-5</b></td>
+        <td>$0.6</td>
+        <td>$3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>zai-glm-4-7</b></td>
+        <td>$0.6</td>
+        <td>$2.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3-2</b></td>
+        <td>$0.62</td>
+        <td>$1.85</td>
+        <td>65K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-1-70b</b></td>
+        <td>$0.72</td>
+        <td>$0.72</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-2-90b</b></td>
+        <td>$0.72</td>
+        <td>$0.72</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-3-70b</b></td>
+        <td>$0.72</td>
+        <td>$0.72</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-pro</b></td>
+        <td>$0.8</td>
+        <td>$3.2</td>
+        <td>300K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-1-70b-latency-optimized</b></td>
+        <td>$0.9</td>
+        <td>$0.9</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-pro-latency-optimized</b></td>
+        <td>$1</td>
+        <td>$4</td>
+        <td>300K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-small</b></td>
+        <td>$1</td>
+        <td>$3</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>zai-glm-5</b></td>
+        <td>$1</td>
+        <td>$3.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>$1.35</td>
+        <td>$5.4</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-pixtral-large</b></td>
+        <td>$2</td>
+        <td>$6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-premier</b></td>
+        <td>$2.5</td>
+        <td>$12.5</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3-70b</b></td>
+        <td>$2.65</td>
+        <td>$3.5</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-large</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="groq">🏢 Groq</h2>
+    <p>Ultra-fast inference with LPU hardware. 12 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instant</b></td>
+        <td>$0.05</td>
+        <td>$0.08</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-safeguard-20b</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>$0.11</td>
+        <td>$0.34</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-32b</b></td>
+        <td>$0.29</td>
+        <td>$0.59</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-3.3-70b-versatile</b></td>
+        <td>$0.59</td>
+        <td>$0.79</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2-instruct-0905</b></td>
+        <td>$1</td>
+        <td>$3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>orpheus-ar-sa</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>orpheus-en</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>whisper-large-v3-turbo</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>whisper-large-v3</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="togetherai">🏢 Together AI</h2>
+    <p>Open-weight model hosting platform. 24 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>$0.03</td>
+        <td>$0.12</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>$0.05</td>
+        <td>$0.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-3n-E4B-it</b></td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.5-9B</b></td>
+        <td>$0.1</td>
+        <td>$0.15</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--Meta-Llama-3.1-8B-Instruct-Lite</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>essential-ai--Rnj-1-Instruct</b></td>
+        <td>$0.15</td>
+        <td>$0.15</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-235B-A22B-FP8-Throughput</b></td>
+        <td>$0.2</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMaxAI--MiniMax-M2.5</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMaxAI--MiniMax-M2.7</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen2.5-7B-Instruct-Turbo</b></td>
+        <td>$0.3</td>
+        <td>$0.3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31B-it</b></td>
+        <td>$0.39</td>
+        <td>$0.97</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-Coder-Next</b></td>
+        <td>$0.5</td>
+        <td>$1.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-Plus</b></td>
+        <td>$0.5</td>
+        <td>$3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshotai--Kimi-K2.5</b></td>
+        <td>$0.5</td>
+        <td>$2.8</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.5-397B-A17B</b></td>
+        <td>$0.6</td>
+        <td>$3.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3.1</b></td>
+        <td>$0.6</td>
+        <td>$1.7</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--Llama-3.3-70B-Instruct-Turbo</b></td>
+        <td>$0.88</td>
+        <td>$0.88</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>zai-org--GLM-5</b></td>
+        <td>$1</td>
+        <td>$3.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshotai--Kimi-K2.6</b></td>
+        <td>$1.2</td>
+        <td>$4.5</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>cogito-ai--Cogito-v2.1-671B</b></td>
+        <td>$1.25</td>
+        <td>$1.25</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--GLM-5.1</b></td>
+        <td>$1.4</td>
+        <td>$4.4</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-Coder-480B-A35B-Instruct</b></td>
+        <td>$2</td>
+        <td>$2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V4-Pro</b></td>
+        <td>$2.1</td>
+        <td>$4.4</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="fireworks">🏢 Fireworks</h2>
+    <p>Fast inference for open-source models. 10 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama4-scout-17b-16e-instruct</b></td>
+        <td>$0.18</td>
+        <td>$0.59</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2.5</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>196K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2.7</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>196K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-plus</b></td>
+        <td>$0.5</td>
+        <td>$3</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2.5</b></td>
+        <td>$0.6</td>
+        <td>$3</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2.6</b></td>
+        <td>$0.95</td>
+        <td>$4</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-5.1</b></td>
+        <td>$1.4</td>
+        <td>$4.4</td>
+        <td>202K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$1.74</td>
+        <td>$3.48</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="cerebras">🏢 Cerebras</h2>
+    <p>Wafer-scale inference at extreme speed. 11 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>llama3.1-8b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.35</td>
+        <td>$0.75</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-instruct</b></td>
+        <td>$0.6</td>
+        <td>$1.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>zai-glm-4.7</b></td>
+        <td>$2.25</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-8b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.3-70b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-2.5-32b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-2.5-coder-32b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-32b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="databricks">🏢 Databricks</h2>
+    <p>DBRX and enterprise AI models. 29 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-nano</b></td>
+        <td>$0.05</td>
+        <td>$0.4</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-oss-20b</b></td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemma-3-12b</b></td>
+        <td>$0.15</td>
+        <td>$0.5</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-oss-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-meta-llama-3-1-8b-instruct</b></td>
+        <td>$0.15</td>
+        <td>$0.45</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-qwen3-next-80b-a3b-instruct</b></td>
+        <td>$0.15</td>
+        <td>$1.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-4-nano</b></td>
+        <td>$0.2</td>
+        <td>$1.25</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-3-1-flash-lite</b></td>
+        <td>$0.25</td>
+        <td>$1.5</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-1-codex-mini</b></td>
+        <td>$0.25</td>
+        <td>$2</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-mini</b></td>
+        <td>$0.25</td>
+        <td>$2</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-2-5-flash</b></td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-llama-4-maverick</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-meta-llama-3-3-70b-instruct</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-3-flash</b></td>
+        <td>$0.63</td>
+        <td>$3.75</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-4-mini</b></td>
+        <td>$0.75</td>
+        <td>$4.5</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-haiku-4-5</b></td>
+        <td>$1</td>
+        <td>$5</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-2-5-pro</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-1-codex-max</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-1</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-2-codex</b></td>
+        <td>$1.75</td>
+        <td>$14</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-2</b></td>
+        <td>$1.75</td>
+        <td>$14</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-3-1-pro</b></td>
+        <td>$2.5</td>
+        <td>$15</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-4</b></td>
+        <td>$2.5</td>
+        <td>$15</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-sonnet-4-5</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-sonnet-4</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-opus-4-5</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gpt-5-5</b></td>
+        <td>$5</td>
+        <td>$30</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-opus-4-1</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="alibaba">🏢 Alibaba (Qwen)</h2>
+    <p>Qwen — multilingual models from Alibaba Cloud. 62 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>qwen-flash</b></td>
+        <td>$0.15</td>
+        <td>$1.5</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-flash-2026-02-23</b></td>
+        <td>$0.2</td>
+        <td>$2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-flash</b></td>
+        <td>$0.2</td>
+        <td>$2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-flash-character</b></td>
+        <td>$0.25</td>
+        <td>$1.5</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-turbo</b></td>
+        <td>$0.3</td>
+        <td>$0.6</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-0.6b</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-1.7b</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-4b</b></td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-omni-turbo</b></td>
+        <td>$0.4</td>
+        <td>$25</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-35b-a3b</b></td>
+        <td>$0.4</td>
+        <td>$3.2</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-long-2025-01-25</b></td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-long-latest</b></td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-long</b></td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-7b-instruct-1m</b></td>
+        <td>$0.5</td>
+        <td>$1</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-7b-instruct</b></td>
+        <td>$0.5</td>
+        <td>$1</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-8b</b></td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-mt-lite</b></td>
+        <td>$0.6</td>
+        <td>$1.6</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-omni-7b</b></td>
+        <td>$0.6</td>
+        <td>$38</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-27b</b></td>
+        <td>$0.6</td>
+        <td>$4.8</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-mt-flash</b></td>
+        <td>$0.7</td>
+        <td>$1.95</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-mt-turbo</b></td>
+        <td>$0.7</td>
+        <td>$1.95</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-instruct-2507</b></td>
+        <td>$0.75</td>
+        <td>$3</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b</b></td>
+        <td>$0.75</td>
+        <td>$3</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-plus-character</b></td>
+        <td>$0.8</td>
+        <td>$2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-plus</b></td>
+        <td>$0.8</td>
+        <td>$2</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-122b-a10b</b></td>
+        <td>$0.8</td>
+        <td>$6.4</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-plus-2026-02-15</b></td>
+        <td>$0.8</td>
+        <td>$4.8</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-plus</b></td>
+        <td>$0.8</td>
+        <td>$4.8</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-14b-instruct-1m</b></td>
+        <td>$1</td>
+        <td>$3</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-14b-instruct</b></td>
+        <td>$1</td>
+        <td>$3</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-14b</b></td>
+        <td>$1</td>
+        <td>$4</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-flash-2025-07-28</b></td>
+        <td>$1</td>
+        <td>$4</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-flash</b></td>
+        <td>$1</td>
+        <td>$4</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-next</b></td>
+        <td>$1</td>
+        <td>$4</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-next-80b-a3b-instruct</b></td>
+        <td>$1</td>
+        <td>$4</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-vl-3b-instruct</b></td>
+        <td>$1.2</td>
+        <td>$3.6</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-397b-a17b</b></td>
+        <td>$1.2</td>
+        <td>$7.2</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-flash-2026-04-16</b></td>
+        <td>$1.2</td>
+        <td>$7.2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-flash</b></td>
+        <td>$1.2</td>
+        <td>$7.2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-30b-a3b-instruct</b></td>
+        <td>$1.5</td>
+        <td>$6</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-mt-plus</b></td>
+        <td>$1.8</td>
+        <td>$5.4</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-32b-instruct</b></td>
+        <td>$2</td>
+        <td>$6</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-vl-7b-instruct</b></td>
+        <td>$2</td>
+        <td>$5</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b-instruct-2507</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-32b</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-plus-2026-04-02</b></td>
+        <td>$2</td>
+        <td>$12</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-plus</b></td>
+        <td>$2</td>
+        <td>$12</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-max</b></td>
+        <td>$2.4</td>
+        <td>$9.6</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-max-2026-01-23</b></td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-max</b></td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-plus-character-ja</b></td>
+        <td>$3.67</td>
+        <td>$10.275</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-72b-instruct</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-plus-2025-07-22</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-plus-2025-09-23</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-plus</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-coder-480b-a35b-instruct</b></td>
+        <td>$6</td>
+        <td>$24</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-max-2025-09-23</b></td>
+        <td>$6</td>
+        <td>$24</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-max-preview</b></td>
+        <td>$6</td>
+        <td>$24</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-vl-32b-instruct</b></td>
+        <td>$8</td>
+        <td>$24</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-max-preview</b></td>
+        <td>$9</td>
+        <td>$54</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen2.5-vl-72b-instruct</b></td>
+        <td>$16</td>
+        <td>$48</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="bytedance">🏢 ByteDance</h2>
+    <p>Doubao — models from the TikTok parent company. 5 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>seed-1.6-flash</b></td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>seed-2.0-mini</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>ui-tars-1.5-7b</b></td>
+        <td>$0.1</td>
+        <td>$0.2</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>seed-1.6</b></td>
+        <td>$0.25</td>
+        <td>$2</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>seed-2.0-lite</b></td>
+        <td>$0.25</td>
+        <td>$2</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="minimax">🏢 MiniMax</h2>
+    <p>Chinese AI startup with competitive models. 21 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>M2-her</b></td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td>64K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.1</b></td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td>204K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.5</b></td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td>204K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.7</b></td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td>204K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2</b></td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td>204K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.1-highspeed</b></td>
+        <td>$4.2</td>
+        <td>$16.8</td>
+        <td>204K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.5-highspeed</b></td>
+        <td>$4.2</td>
+        <td>$16.8</td>
+        <td>204K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.7-highspeed</b></td>
+        <td>$4.2</td>
+        <td>$16.8</td>
+        <td>204K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-Hailuo-02</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-Hailuo-2.3-Fast</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-Hailuo-2.3</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>image-01-live</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>image-01</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>music-2.6</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>music-cover</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>speech-02-hd</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>speech-02-turbo</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>speech-2.6-hd</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>speech-2.6-turbo</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>speech-2.8-hd</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>speech-2.8-turbo</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="moonshotai">🏢 Moonshot AI</h2>
+    <p>Kimi — long-context Chinese models. 16 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>moonshot-v1-8k-vision-preview</b></td>
+        <td>$2</td>
+        <td>$10</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshot-v1-8k</b></td>
+        <td>$2</td>
+        <td>$10</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2-0711-preview</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2-0905-preview</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>262K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2-thinking</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>262K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2.5</b></td>
+        <td>$4</td>
+        <td>$21</td>
+        <td>262K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-vl-a3b-thinking</b></td>
+        <td>$4</td>
+        <td>$21</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-vl-a3b</b></td>
+        <td>$4</td>
+        <td>$21</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshot-v1-32k-vision-preview</b></td>
+        <td>$5</td>
+        <td>$20</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshot-v1-32k</b></td>
+        <td>$5</td>
+        <td>$20</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2.6-long</b></td>
+        <td>$6.5</td>
+        <td>$27</td>
+        <td>262K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2.6</b></td>
+        <td>$6.5</td>
+        <td>$27</td>
+        <td>262K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2-thinking-turbo</b></td>
+        <td>$8</td>
+        <td>$58</td>
+        <td>262K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2-turbo-preview</b></td>
+        <td>$8</td>
+        <td>$58</td>
+        <td>262K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshot-v1-128k-vision-preview</b></td>
+        <td>$10</td>
+        <td>$30</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>moonshot-v1-128k</b></td>
+        <td>$10</td>
+        <td>$30</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="stepfun">🏢 StepFun</h2>
+    <p>Step — Chinese AI models with strong capabilities. 31 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>step-3.5-flash-2603</b></td>
+        <td>$0.7</td>
+        <td>$2.1</td>
+        <td>256K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-3.5-flash</b></td>
+        <td>$0.7</td>
+        <td>$2.1</td>
+        <td>256K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-2-mini</b></td>
+        <td>$1</td>
+        <td>$2</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-3</b></td>
+        <td>$1.5</td>
+        <td>$4</td>
+        <td>64K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1o-turbo-vision</b></td>
+        <td>$2.5</td>
+        <td>$8</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-r1-v-mini</b></td>
+        <td>$2.5</td>
+        <td>$8</td>
+        <td>100K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1-8k</b></td>
+        <td>$5</td>
+        <td>$20</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1v-8k</b></td>
+        <td>$5</td>
+        <td>$20</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-audio-2</b></td>
+        <td>$10</td>
+        <td>$70</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>stepaudio-2.5-chat</b></td>
+        <td>$10</td>
+        <td>$25</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>stepaudio-2.5-realtime</b></td>
+        <td>$10</td>
+        <td>$70</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1-32k</b></td>
+        <td>$15</td>
+        <td>$70</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1o-vision-32k</b></td>
+        <td>$15</td>
+        <td>$70</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1v-32k</b></td>
+        <td>$15</td>
+        <td>$70</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1o-audio</b></td>
+        <td>$25</td>
+        <td>$60</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-2-16k-exp</b></td>
+        <td>$38</td>
+        <td>$120</td>
+        <td>16K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-2-16k</b></td>
+        <td>$38</td>
+        <td>$120</td>
+        <td>16K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1x-edit</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1x-medium</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-2x-large</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-asr-1.1-stream</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-asr-1.1</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-asr</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-audio-r1.1</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-gui</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-image-edit-2</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-tts-2</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-tts-mini</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>stepaudio-2-asr-pro</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>stepaudio-2.5-asr</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>stepaudio-2.5-tts</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="baidu">🏢 Baidu</h2>
+    <p>ERNIE — models from China's search giant. 8 models available.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.126</td>
+        <td>$0.252</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.2</b></td>
+        <td>$0.252</td>
+        <td>$0.378</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2.5</b></td>
+        <td>$0.27</td>
+        <td>$1.08</td>
+        <td>196K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qianfan-ocr-fast</b></td>
+        <td>$0.6799999999999999</td>
+        <td>$2.81</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-5</b></td>
+        <td>$0.7</td>
+        <td>$2.24</td>
+        <td>202K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>glm-5.1</b></td>
+        <td>$0.98</td>
+        <td>$3.08</td>
+        <td>202K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$1.521</td>
+        <td>$3.042</td>
+        <td>716K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>cobuddy</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b> — not third-party aggregators. Pricing,
+      context windows, and capabilities are verified against official provider documentation.
+      Aggregator providers (OpenRouter, Requesty, etc.) are labeled as such — they provide access to
+      other providers' models.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/best-ai-models-for-agents.html b/site/best-ai-models-for-agents.html
new file mode 100644
index 00000000..f67af0e0
--- /dev/null
+++ b/site/best-ai-models-for-agents.html
@@ -0,0 +1,1003 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>Best AI Models for Agents — Top Agentic LLMs Compared (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Compare the best AI models for building agents in 2025. 1,080+ models with tool calling, reasoning, and structured output. Claude, GPT-4, Gemini, DeepSeek and more."
+    />
+    <meta
+      name="keywords"
+      content="best AI model for agents, agentic LLM, AI agent model, tool calling LLM, function calling model, AI agent framework, Claude agent, GPT-4 agent"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+    />
+    <meta
+      property="og:title"
+      content="Best AI Models for Agents — Top Agentic LLMs Compared (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare the best AI models for agents. 1,080+ models with tool calling, reasoning, and structured output."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="Best AI Models for Agents — Top Agentic LLMs Compared (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare the best AI models for agents. 1,080+ models with tool calling, reasoning, and structured output."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Best AI Models for Agents — Top Agentic LLMs Compared (2025)",
+        "description": "Compare the best AI models for building agents. 1,080+ models with tool calling, reasoning, and structured output.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>🤖 Best AI Models for Agents (2025)</h1>
+    <p>
+      Compare the top AI models for building autonomous agents. <b>1,080+</b> models with tool
+      calling — the key capability for agentic workflows.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>1,080</b><small>Agentic Models</small></div>
+      <div class="stat"><b>2,350</b><small>Tool Calling</small></div>
+      <div class="stat"><b>1,306</b><small>Reasoning</small></div>
+      <div class="stat"><b>829</b><small>Structured Output</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 What makes a model "agentic"?</strong> The three key capabilities are:
+      <b>Tool calling</b> (invoke APIs/functions), <b>Reasoning</b> (plan multi-step actions), and
+      <b>Structured output</b> (return parseable JSON). Models with all three are the most capable
+      agents.
+    </div>
+
+    <h2>🏆 Top Agentic Models — Full Stack (Tool Call + Reasoning + Structured Output)</h2>
+    <p>Models with all three agentic capabilities. Best for complex autonomous workflows.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>hermes-4-llama-3.1-8b</b></td>
+        <td>nousresearch</td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--glm-4.7-flash</b></td>
+        <td>novitaai</td>
+        <td>$0.07</td>
+        <td>$0.4</td>
+        <td>200K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-32B-TEE</b></td>
+        <td>chutes</td>
+        <td>$0.08</td>
+        <td>$0.24</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>Gemma-3-27b-it</b></td>
+        <td>nebius</td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>96K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen3-32B</b></td>
+        <td>nebius</td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>xiaomimimo--mimo-v2-flash</b></td>
+        <td>novitaai</td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-235B-A22B-Thinking-2507</b></td>
+        <td>chutes</td>
+        <td>$0.11</td>
+        <td>$0.6</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>baidu</td>
+        <td>$0.126</td>
+        <td>$0.252</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31B-turbo-TEE</b></td>
+        <td>chutes</td>
+        <td>$0.13</td>
+        <td>$0.38</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Hermes-4-70B</b></td>
+        <td>nebius</td>
+        <td>$0.13</td>
+        <td>$0.4</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it</b></td>
+        <td>novitaai</td>
+        <td>$0.13</td>
+        <td>$0.4</td>
+        <td>262K</td>
+      </tr>
+    </table>
+
+    <h2>🔧 Tool Calling + Reasoning</h2>
+    <p>
+      Models that can both call tools and reason about when/how to use them. Essential for
+      ReAct-style agents.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>$0.06</td>
+        <td>$0.4</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>hermes-4-llama-3.1-8b</b></td>
+        <td>nousresearch</td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>seed-1.6-flash</b></td>
+        <td>bytedance</td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ring-2.6-1t</b></td>
+        <td>inclusionai</td>
+        <td>$0.07</td>
+        <td>$0.62</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--glm-4.7-flash</b></td>
+        <td>novitaai</td>
+        <td>$0.07</td>
+        <td>$0.4</td>
+        <td>200K</td>
+      </tr>
+      <tr>
+        <td><b>microsoft-phi-4-mini-reasoning</b></td>
+        <td>microsoft</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-32B-TEE</b></td>
+        <td>chutes</td>
+        <td>$0.08</td>
+        <td>$0.24</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>clarifai</td>
+        <td>$0.09</td>
+        <td>$0.36</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>💰 Cheapest Tool Calling Models</h2>
+    <p>Most affordable models with tool calling for budget-conscious agent deployments.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>togetherai</td>
+        <td>$0.03</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon</td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon-bedrock</td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-12b-instruct--fp-8</b></td>
+        <td>inferencenet</td>
+        <td>$0.0375</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>🆓 Free Models with Tool Calling</h2>
+    <p>Zero-cost models for building and testing agents.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+        <th>Structured Output</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🔓 Open-Weight Models with Tool Calling</h2>
+    <p>Run agent models locally for full privacy and zero API costs at scale.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+        <th>Structured Output</th>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash-2026-02-23</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash-2026-04-16</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-1</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>📏 Large Context + Tool Calling</h2>
+    <p>
+      Models with 128K+ context and tool calling for agents that need to process large documents or
+      maintain long conversation history.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>262K</td>
+        <td>$0.01</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.01</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>131K</td>
+        <td>$0.015</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>131K</td>
+        <td>$0.017</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>128K</td>
+        <td>$0.03</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>togetherai</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon</td>
+        <td>128K</td>
+        <td>$0.035</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon-bedrock</td>
+        <td>128K</td>
+        <td>$0.035</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-12b-instruct--fp-8</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.0375</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.3-70B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>131K</td>
+        <td>$0.038</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b>. Agentic capability is defined by tool
+      calling (function calling), reasoning (chain-of-thought), and structured output (JSON mode).
+      Aggregator providers are excluded from ranking tables to avoid duplicate models.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+          >Best AI Models for Coding</a
+        >
+        — code-focused comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/best-ai-models-for-coding.html b/site/best-ai-models-for-coding.html
new file mode 100644
index 00000000..260ed526
--- /dev/null
+++ b/site/best-ai-models-for-coding.html
@@ -0,0 +1,880 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>Best AI Models for Coding — Top 20 Code LLMs Compared (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Compare the best AI models for coding in 2025. GPT-4, Claude, Gemini, DeepSeek, and more ranked by coding ability, pricing, and context windows."
+    />
+    <meta
+      name="keywords"
+      content="best AI model for coding, best LLM for programming, AI code assistant, coding LLM comparison, GPT-4 coding, Claude coding, DeepSeek coding, code generation AI"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+    />
+    <meta
+      property="og:title"
+      content="Best AI Models for Coding — Top 20 Code LLMs Compared (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare the best AI models for coding. GPT-4, Claude, Gemini, DeepSeek and more ranked by coding ability."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="Best AI Models for Coding — Top 20 Code LLMs Compared (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare the best AI models for coding. GPT-4, Claude, Gemini, DeepSeek and more ranked."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      .badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 4px;
+        font-size: 11px;
+        font-weight: 600;
+      }
+      .badge-free {
+        background: rgba(63, 185, 80, 0.15);
+        color: #3fb950;
+      }
+      .badge-cheap {
+        background: rgba(88, 166, 255, 0.15);
+        color: #58a6ff;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Best AI Models for Coding — Top 20 Code LLMs Compared (2025)",
+        "description": "Compare the best AI models for coding in 2025. GPT-4, Claude, Gemini, DeepSeek and more ranked.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>💻 Best AI Models for Coding (2025)</h1>
+    <p>
+      Compare the top AI models for code generation, debugging, and software development. Real
+      pricing, context windows, and capabilities from <b>first-party data</b>.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>189</b><small>Code Models</small></div>
+      <div class="stat"><b>2,350</b><small>Tool Calling</small></div>
+      <div class="stat"><b>1,306</b><small>Reasoning</small></div>
+      <div class="stat"><b>81</b><small>Free Models</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 What makes a good coding model?</strong> Tool calling for agentic workflows, large
+      context for codebases, reasoning for complex logic, and structured output for parsing. We rank
+      models by these capabilities.
+    </div>
+
+    <h2>🏆 Top Coding Models — Flagship Tier</h2>
+    <p>The most capable models for complex coding tasks. Higher price, highest quality.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1</b></td>
+        <td>openai</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o</b></td>
+        <td>openai</td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>deepinfra</td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>amazon-bedrock</td>
+        <td>$1.35</td>
+        <td>$5.4</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>💰 Best Value for Coding</h2>
+    <p>Great coding performance at lower prices. Perfect for high-volume code generation.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>deepinfra</td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3</b></td>
+        <td>deepinfra</td>
+        <td>$0.32</td>
+        <td>$0.89</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>amazon-bedrock</td>
+        <td>$1.35</td>
+        <td>$5.4</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🆓 Free Models for Coding</h2>
+    <p>Zero-cost models for learning, prototyping, and personal projects.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🔓 Open-Weight Models for Coding</h2>
+    <p>Download and run locally for full privacy and zero API costs at scale.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash-2026-02-23</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash-2026-04-16</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-1</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>📏 Large Context for Codebases</h2>
+    <p>
+      Models with 128K+ context for working with large codebases, multiple files, and long
+      conversations.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>262K</td>
+        <td>$0.01</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.01</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>131K</td>
+        <td>$0.015</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>131K</td>
+        <td>$0.017</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>128K</td>
+        <td>$0.03</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>togetherai</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon</td>
+        <td>128K</td>
+        <td>$0.035</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon-bedrock</td>
+        <td>128K</td>
+        <td>$0.035</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-12b-instruct--fp-8</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.0375</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.3-70B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>131K</td>
+        <td>$0.038</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🤖 Agentic Coding Models</h2>
+    <p>
+      Models with tool calling + reasoning — the key capabilities for AI coding agents (Cursor,
+      Copilot, Devin-style).
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>$0.06</td>
+        <td>$0.4</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>hermes-4-llama-3.1-8b</b></td>
+        <td>nousresearch</td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>seed-1.6-flash</b></td>
+        <td>bytedance</td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ring-2.6-1t</b></td>
+        <td>inclusionai</td>
+        <td>$0.07</td>
+        <td>$0.62</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--glm-4.7-flash</b></td>
+        <td>novitaai</td>
+        <td>$0.07</td>
+        <td>$0.4</td>
+        <td>200K</td>
+      </tr>
+      <tr>
+        <td><b>microsoft-phi-4-mini-reasoning</b></td>
+        <td>microsoft</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-32B-TEE</b></td>
+        <td>chutes</td>
+        <td>$0.08</td>
+        <td>$0.24</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>clarifai</td>
+        <td>$0.09</td>
+        <td>$0.36</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b>. Models are selected based on capabilities
+      relevant to coding: tool calling (for agentic workflows), reasoning (for complex logic), large
+      context (for codebases), and structured output (for parsing). Aggregator providers are
+      excluded from ranking tables.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/best-ai-models-for-image-generation.html b/site/best-ai-models-for-image-generation.html
new file mode 100644
index 00000000..7510aa26
--- /dev/null
+++ b/site/best-ai-models-for-image-generation.html
@@ -0,0 +1,784 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      Best AI Image Generation Models — DALL·E, Imagen, GPT-5 Image Compared (2025) | AI Models
+      Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare the best AI image generation models in 2025. DALL·E 3, Imagen 4, GPT-5 Image, Gemini, and more — pricing, resolution, and capabilities."
+    />
+    <meta
+      name="keywords"
+      content="best AI image generation model, DALL-E 3 pricing, Imagen 4, GPT-5 image generation, AI art models, text to image AI, image generation API comparison, AI image models 2025"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+    />
+    <meta
+      property="og:title"
+      content="Best AI Image Generation Models — DALL·E, Imagen, GPT-5 Image Compared (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare the best AI image generation models. DALL·E 3, Imagen 4, GPT-5 Image and more with pricing and capabilities."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="Best AI Image Generation Models — DALL·E, Imagen, GPT-5 Image Compared (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare the best AI image generation models with pricing and capabilities."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      .badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 4px;
+        font-size: 11px;
+        font-weight: 600;
+      }
+      .badge-free {
+        background: rgba(63, 185, 80, 0.15);
+        color: #3fb950;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Best AI Image Generation Models — DALL·E, Imagen, GPT-5 Image Compared (2025)",
+        "description": "Compare the best AI image generation models in 2025 with pricing and capabilities.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>🎨 Best AI Models for Image Generation (2025)</h1>
+    <p>
+      Compare the top AI models for image generation — DALL·E, Imagen, GPT-5 Image, Gemini, and
+      more. Real pricing and capabilities from <b>first-party data</b>.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>28</b><small>Image Gen Models</small></div>
+      <div class="stat"><b>9</b><small>Providers</small></div>
+      <div class="stat"><b>4,587</b><small>Total Models</small></div>
+      <div class="stat"><b>95</b><small>Providers</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 Two types of image generation models:</strong> Dedicated image models (DALL·E,
+      Imagen) generate images from text descriptions. Chat models with image output (GPT-5 Image,
+      Gemini) can both understand and generate images in conversation. Choose based on your use
+      case.
+    </div>
+
+    <h2>🖼️ Dedicated Image Generation Models</h2>
+    <p>
+      Purpose-built models for text-to-image generation. Best for art, design, and visual content
+      creation.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Type</th>
+        <th>Key Feature</th>
+      </tr>
+      <tr>
+        <td><b>imagen-4.0-generate</b></td>
+        <td>google</td>
+        <td>Text → Image</td>
+        <td>Latest Imagen, highest quality</td>
+      </tr>
+      <tr>
+        <td><b>imagen-4.0-fast-generate</b></td>
+        <td>google</td>
+        <td>Text → Image</td>
+        <td>Fast generation, lower cost</td>
+      </tr>
+      <tr>
+        <td><b>imagen-3.0-generate</b></td>
+        <td>google</td>
+        <td>Text → Image</td>
+        <td>Stable v3, production-ready</td>
+      </tr>
+      <tr>
+        <td><b>imagen-3.0-fast-generate</b></td>
+        <td>google</td>
+        <td>Text → Image</td>
+        <td>Fast v3 variant</td>
+      </tr>
+      <tr>
+        <td><b>dall-e-3</b></td>
+        <td>openai</td>
+        <td>Text → Image</td>
+        <td>Best prompt adherence, DALL·E quality</td>
+      </tr>
+      <tr>
+        <td><b>dall-e-2</b></td>
+        <td>openai</td>
+        <td>Text → Image</td>
+        <td>Lower cost, good for simple images</td>
+      </tr>
+      <tr>
+        <td><b>step-2x-large</b></td>
+        <td>stepfun</td>
+        <td>Text → Image</td>
+        <td>High-quality Chinese + English</td>
+      </tr>
+      <tr>
+        <td><b>step-1x-medium</b></td>
+        <td>stepfun</td>
+        <td>Text → Image</td>
+        <td>Mid-tier, good balance</td>
+      </tr>
+      <tr>
+        <td><b>step-1x-edit</b></td>
+        <td>stepfun</td>
+        <td>Image Edit</td>
+        <td>Edit existing images</td>
+      </tr>
+      <tr>
+        <td><b>step-image-edit-2</b></td>
+        <td>stepfun</td>
+        <td>Image Edit</td>
+        <td>Advanced editing v2</td>
+      </tr>
+      <tr>
+        <td><b>image-01</b></td>
+        <td>minimax</td>
+        <td>Text → Image</td>
+        <td>MiniMax image generation</td>
+      </tr>
+      <tr>
+        <td><b>image-01-live</b></td>
+        <td>minimax</td>
+        <td>Text → Image</td>
+        <td>Real-time generation</td>
+      </tr>
+    </table>
+
+    <h2>💬 Chat Models with Image Output</h2>
+    <p>
+      Multimodal chat models that can generate images within a conversation. Best for agents and
+      interactive applications.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gpt-5-image-mini</b></td>
+        <td>openrouter</td>
+        <td>$2.50</td>
+        <td>$2</td>
+        <td>400K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-image</b></td>
+        <td>fastrouter</td>
+        <td>$0.25</td>
+        <td>$1.50</td>
+        <td>65K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash-image</b></td>
+        <td>fastrouter</td>
+        <td>$0.30</td>
+        <td>$2.50</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-image</b></td>
+        <td>auriko</td>
+        <td>$0.50</td>
+        <td>$3</td>
+        <td>65K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash-image</b></td>
+        <td>auriko</td>
+        <td>$0.30</td>
+        <td>$0.04</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-2.0-omni</b></td>
+        <td>amazon</td>
+        <td>$0.20</td>
+        <td>$1.30</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-5-image</b></td>
+        <td>openrouter</td>
+        <td>$10</td>
+        <td>$10</td>
+        <td>400K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-5.4-image-2</b></td>
+        <td>openrouter</td>
+        <td>$8</td>
+        <td>$15</td>
+        <td>272K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-pro-image</b></td>
+        <td>fastrouter</td>
+        <td>$2</td>
+        <td>$12</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-pro-image</b></td>
+        <td>auriko</td>
+        <td>$2</td>
+        <td>$12</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>💰 Cheapest Image Generation Models</h2>
+    <p>Most affordable options for high-volume image generation.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-2.0-omni</b></td>
+        <td>amazon</td>
+        <td>$0.20</td>
+        <td>$1.30</td>
+        <td>64K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-image</b></td>
+        <td>fastrouter</td>
+        <td>$0.25</td>
+        <td>$1.50</td>
+        <td>65K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash-image</b></td>
+        <td>fastrouter</td>
+        <td>$0.30</td>
+        <td>$2.50</td>
+        <td>32K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash-image</b></td>
+        <td>auriko</td>
+        <td>$0.30</td>
+        <td>$0.04</td>
+        <td>32K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-image</b></td>
+        <td>auriko</td>
+        <td>$0.50</td>
+        <td>$3</td>
+        <td>65K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-5-image-mini</b></td>
+        <td>openrouter</td>
+        <td>$2.50</td>
+        <td>$2</td>
+        <td>400K</td>
+      </tr>
+    </table>
+
+    <h2>🤖 Image Models with Tool Calling</h2>
+    <p>
+      Models that support both image generation and function/tool calling — ideal for AI agents that
+      create images.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-2.0-omni</b></td>
+        <td>amazon</td>
+        <td>$0.20</td>
+        <td>$1.30</td>
+        <td>64K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-pro-image</b></td>
+        <td>llmgateway</td>
+        <td>$2</td>
+        <td>$12</td>
+        <td>—</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-image</b></td>
+        <td>llmgateway</td>
+        <td>$0.25</td>
+        <td>$1.50</td>
+        <td>—</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash-image</b></td>
+        <td>llmgateway</td>
+        <td>$0.30</td>
+        <td>$30</td>
+        <td>—</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>📏 Image Models with Large Context</h2>
+    <p>
+      Models with 64K+ context for detailed image descriptions, multi-image generation, and long
+      conversations.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+      </tr>
+      <tr>
+        <td><b>gpt-5-image</b></td>
+        <td>openrouter</td>
+        <td>400K</td>
+        <td>$10</td>
+        <td>$10</td>
+      </tr>
+      <tr>
+        <td><b>gpt-5-image-mini</b></td>
+        <td>openrouter</td>
+        <td>400K</td>
+        <td>$2.50</td>
+        <td>$2</td>
+      </tr>
+      <tr>
+        <td><b>gpt-5.4-image-2</b></td>
+        <td>openrouter</td>
+        <td>272K</td>
+        <td>$8</td>
+        <td>$15</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-pro-image</b></td>
+        <td>auriko</td>
+        <td>131K</td>
+        <td>$2</td>
+        <td>$12</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-image</b></td>
+        <td>fastrouter</td>
+        <td>65K</td>
+        <td>$0.25</td>
+        <td>$1.50</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-pro-image</b></td>
+        <td>fastrouter</td>
+        <td>65K</td>
+        <td>$2</td>
+        <td>$12</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-image</b></td>
+        <td>auriko</td>
+        <td>65K</td>
+        <td>$0.50</td>
+        <td>$3</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-2.0-omni</b></td>
+        <td>amazon</td>
+        <td>64K</td>
+        <td>$0.20</td>
+        <td>$1.30</td>
+      </tr>
+    </table>
+
+    <h2>🔑 Choosing the Right Model</h2>
+    <table>
+      <tr>
+        <th>Use Case</th>
+        <th>Recommended Model</th>
+        <th>Why</th>
+      </tr>
+      <tr>
+        <td><b>Art & creative</b></td>
+        <td>imagen-4.0-generate</td>
+        <td>Highest quality, Google's latest</td>
+      </tr>
+      <tr>
+        <td><b>Product images</b></td>
+        <td>dall-e-3</td>
+        <td>Best prompt adherence, consistent style</td>
+      </tr>
+      <tr>
+        <td><b>Chat + images</b></td>
+        <td>gpt-5-image-mini</td>
+        <td>Conversational image gen, 400K context</td>
+      </tr>
+      <tr>
+        <td><b>AI agents</b></td>
+        <td>amazon-nova-2.0-omni</td>
+        <td>Tool calling + reasoning + image output</td>
+      </tr>
+      <tr>
+        <td><b>High volume / cheap</b></td>
+        <td>gemini-2.5-flash-image</td>
+        <td>Lowest cost per image</td>
+      </tr>
+      <tr>
+        <td><b>Image editing</b></td>
+        <td>step-image-edit-2</td>
+        <td>Purpose-built for editing</td>
+      </tr>
+      <tr>
+        <td><b>Chinese content</b></td>
+        <td>step-2x-large</td>
+        <td>Best Chinese + English generation</td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b>. Models are identified by having
+      <code>image</code> in their <code>modalities.output</code> field. Dedicated image models
+      (DALL·E, Imagen) have no chat context. Chat models with image output support both text and
+      image generation in conversation. Aggregator providers are excluded from ranking tables.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+          >Best AI Models for Coding</a
+        >
+        — code generation models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+          >Best AI Models for Agents</a
+        >
+        — agentic models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/best-ai-models-for-vision.html b/site/best-ai-models-for-vision.html
new file mode 100644
index 00000000..5875952e
--- /dev/null
+++ b/site/best-ai-models-for-vision.html
@@ -0,0 +1,772 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      Best Vision AI Models — GPT-4o, Claude, Gemini Vision Compared (2025) | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare the best vision AI models in 2025. GPT-4o, Claude 4, Gemini, and 1,487 vision models with pricing, context windows, and capabilities."
+    />
+    <meta
+      name="keywords"
+      content="best vision AI model, multimodal LLM, GPT-4o vision pricing, Claude vision, Gemini vision, AI image understanding, vision language model, VLM comparison 2025"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+    />
+    <meta
+      property="og:title"
+      content="Best Vision AI Models — GPT-4o, Claude, Gemini Vision Compared (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare 1,487 vision AI models with pricing and capabilities. GPT-4o, Claude 4, Gemini and more."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="Best Vision AI Models — GPT-4o, Claude, Gemini Vision Compared (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare 1,487 vision AI models with pricing and capabilities."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      .badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 4px;
+        font-size: 11px;
+        font-weight: 600;
+      }
+      .badge-free {
+        background: rgba(63, 185, 80, 0.15);
+        color: #3fb950;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Best Vision AI Models — GPT-4o, Claude, Gemini Vision Compared (2025)",
+        "description": "Compare 1,487 vision AI models with pricing and capabilities.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>👁️ Best Vision AI Models (2025)</h1>
+    <p>
+      Compare the top vision AI models — GPT-4o, Claude 4, Gemini, and 1,487 models with image
+      understanding. Real pricing and capabilities from <b>first-party data</b>.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>1,487</b><small>Vision Models</small></div>
+      <div class="stat"><b>1,179</b><small>Vision + Tool Call</small></div>
+      <div class="stat"><b>1,026</b><small>Vision + Reasoning</small></div>
+      <div class="stat"><b>1,267</b><small>Vision + 128K+ Context</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <h2>🏆 Flagship Vision Models — Head to Head</h2>
+    <p>
+      The top-tier multimodal models from each major provider, compared on pricing, context, and
+      capabilities.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gpt-4o</b></td>
+        <td>openai</td>
+        <td>$2.50</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>o3</b></td>
+        <td>openai</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o4-mini</b></td>
+        <td>openai</td>
+        <td>$1.10</td>
+        <td>$4.40</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>google</td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>deepseek</td>
+        <td>$0.55</td>
+        <td>$2.19</td>
+        <td>128K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>grok-3</b></td>
+        <td>xai</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$0.14</td>
+        <td>$0.42</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama4-maverick</b></td>
+        <td>meta</td>
+        <td>$0.20</td>
+        <td>$0.80</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>💰 Cheapest Vision Models</h2>
+    <p>Most affordable models with image understanding — ideal for high-volume applications.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash-lite</b></td>
+        <td>google</td>
+        <td>$0.075</td>
+        <td>$0.30</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$0.14</td>
+        <td>$0.42</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama4-maverick</b></td>
+        <td>meta</td>
+        <td>$0.20</td>
+        <td>$0.80</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-chat</b></td>
+        <td>deepseek</td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🆓 Free Vision Models</h2>
+    <p>
+      Vision models available at zero cost — perfect for prototyping, learning, and small projects.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma3-4b</b></td>
+        <td>google</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama4-scout-17b-16e</b></td>
+        <td>meta</td>
+        <td>10M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b</b></td>
+        <td>alibaba</td>
+        <td>128K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🤖 Vision + Tool Calling Models</h2>
+    <p>
+      1,179 models that support both image understanding and function/tool calling — essential for
+      AI agents that process images.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash-lite</b></td>
+        <td>google</td>
+        <td>$0.075</td>
+        <td>$0.30</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$0.14</td>
+        <td>$0.42</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>grok-3-mini</b></td>
+        <td>xai</td>
+        <td>$0.30</td>
+        <td>$0.50</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>📏 Vision Models with Largest Context</h2>
+    <p>
+      1,267 models with 128K+ context for processing large documents, multiple images, and long
+      conversations.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>llama4-scout-17b-16e</b></td>
+        <td>meta</td>
+        <td>10M</td>
+        <td>—</td>
+        <td>—</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama4-maverick</b></td>
+        <td>meta</td>
+        <td>1M</td>
+        <td>$0.20</td>
+        <td>$0.80</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>200K</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o3</b></td>
+        <td>openai</td>
+        <td>200K</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🔑 Choosing the Right Vision Model</h2>
+    <table>
+      <tr>
+        <th>Use Case</th>
+        <th>Recommended Model</th>
+        <th>Why</th>
+      </tr>
+      <tr>
+        <td><b>Document OCR</b></td>
+        <td>gemini-2.5-pro</td>
+        <td>1M context, best document understanding</td>
+      </tr>
+      <tr>
+        <td><b>Image chatbot</b></td>
+        <td>gpt-4o-mini</td>
+        <td>Cheapest with tool calling, good quality</td>
+      </tr>
+      <tr>
+        <td><b>AI agents</b></td>
+        <td>claude-sonnet-4</td>
+        <td>Best tool calling + reasoning + vision</td>
+      </tr>
+      <tr>
+        <td><b>High volume / cheap</b></td>
+        <td>gemini-2.0-flash-lite</td>
+        <td>Lowest cost at $0.075/M input</td>
+      </tr>
+      <tr>
+        <td><b>Medical imaging</b></td>
+        <td>o3</td>
+        <td>Reasoning + vision for complex analysis</td>
+      </tr>
+      <tr>
+        <td><b>Video analysis</b></td>
+        <td>gemini-2.5-flash</td>
+        <td>1M context + video input + cheap</td>
+      </tr>
+      <tr>
+        <td><b>Prototyping</b></td>
+        <td>gemini-2.5-flash</td>
+        <td>Free tier, 1M context, all capabilities</td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b>. Models are identified by having
+      <code>image</code> in their <code>modalities.input</code> field. Aggregator providers are
+      excluded from ranking tables to avoid duplicate models. Pricing is per million tokens.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+          >Best AI Models for Coding</a
+        >
+        — code generation models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+          >Best AI Models for Agents</a
+        >
+        — agentic models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/best-ai-models.html b/site/best-ai-models.html
new file mode 100644
index 00000000..0ae3a243
--- /dev/null
+++ b/site/best-ai-models.html
@@ -0,0 +1,1126 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>Best AI Models in 2025 — Complete Comparison Guide | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Compare the best AI models of 2025: pricing, context windows, capabilities. 4587 models across 95 providers. Find the cheapest, fastest, and most capable models."
+    />
+    <meta
+      name="keywords"
+      content="best AI models, AI model comparison, cheapest AI model, free AI model, best model for coding, best model for agents, LLM comparison 2025"
+    />
+    <link rel="canonical" href="https://i-need-token.github.io/ai-models/best-ai-models.html" />
+    <meta property="og:title" content="Best AI Models in 2025 — Complete Comparison Guide" />
+    <meta
+      property="og:description"
+      content="Compare 4587 AI models across 95 providers. Find the cheapest, most capable, and best models for your use case."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/best-ai-models.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="Best AI Models in 2025 — Complete Comparison Guide" />
+    <meta
+      name="twitter:description"
+      content="Compare 4587 AI models across 95 providers. Find the cheapest, most capable, and best models."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      h3 {
+        font-size: 1.1rem;
+        margin-top: 24px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 12px;
+        font-size: 11px;
+        font-weight: 600;
+      }
+      .badge-free {
+        background: rgba(63, 185, 80, 0.15);
+        color: var(--green);
+      }
+      .badge-tool {
+        background: rgba(88, 166, 255, 0.15);
+        color: var(--accent);
+      }
+      .badge-reason {
+        background: rgba(188, 140, 255, 0.15);
+        color: #bc8cff;
+      }
+      .badge-vision {
+        background: rgba(240, 136, 62, 0.15);
+        color: var(--orange);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 0;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .nav {
+        display: flex;
+        gap: 16px;
+        flex-wrap: wrap;
+        margin: 16px 0;
+      }
+      .nav a {
+        color: var(--accent);
+        text-decoration: none;
+        padding: 4px 12px;
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        font-size: 13px;
+      }
+      .nav a:hover {
+        border-color: var(--accent);
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Best AI Models in 2025 — Complete Comparison Guide",
+        "description": "Compare 4587 AI models across 95 providers. Find the cheapest, most capable, and best models for your use case.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>Best AI Models in 2025</h1>
+    <p>
+      A comprehensive comparison of <b>4587</b> AI models across <b>95</b> providers. Find the best
+      model for your use case — whether you need the cheapest, the most capable, or the best for a
+      specific task.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>4,587</b><small>Models</small></div>
+      <div class="stat"><b>95</b><small>Providers</small></div>
+      <div class="stat"><b>81</b><small>Free</small></div>
+      <div class="stat"><b>2,350</b><small>Tool Calling</small></div>
+      <div class="stat"><b>1,306</b><small>Reasoning</small></div>
+      <div class="stat"><b>1,487</b><small>Vision</small></div>
+      <div class="stat"><b>527</b><small>Open Weights</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/"
+      >🔍 Try the Interactive Catalog</a
+    >
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="nav">
+      <a href="#cheapest">Cheapest Models</a>
+      <a href="#free">Free Models</a>
+      <a href="#coding">Best for Coding</a>
+      <a href="#agents">Best for Agents</a>
+      <a href="#reasoning">Best for Reasoning</a>
+      <a href="#vision">Best for Vision</a>
+      <a href="#context">Largest Context</a>
+      <a href="#open">Open Weights</a>
+    </div>
+
+    <h2 id="cheapest">💰 Cheapest AI Models</h2>
+    <p>The most affordable models per million tokens, excluding aggregator providers.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/M</th>
+        <th>Output $/M</th>
+        <th>Context</th>
+        <th>Capabilities</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-image-1-mini</b></td>
+        <td>aimlapi</td>
+        <td>$0.007</td>
+        <td>$0.676</td>
+        <td>?</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>klusterai</td>
+        <td>$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-reason">🧠 Reason</span>
+          <span class="badge badge-vision">👁️ Vision</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-image-1-model</b></td>
+        <td>aimlapi</td>
+        <td>$0.012</td>
+        <td>$0.175</td>
+        <td>?</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct-turbo</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-instruct-2407</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.04</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-reason">🧠 Reason</span>
+          <span class="badge badge-vision">👁️ Vision</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+    </table>
+
+    <h2 id="free">🆓 Free AI Models</h2>
+    <p>81 models available at zero cost. Perfect for testing, prototyping, and learning.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Capabilities</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-clip-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-vision">👁️ Vision</span></td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-pro-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-vision">👁️ Vision</span></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+          <span class="badge badge-vision">👁️ Vision</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+          <span class="badge badge-vision">👁️ Vision</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+          <span class="badge badge-vision">👁️ Vision</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+          <span class="badge badge-vision">👁️ Vision</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>codestral</b></td>
+        <td>mistral</td>
+        <td>256K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+          <span class="badge badge-vision">👁️ Vision</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-lite</b></td>
+        <td>tencent</td>
+        <td>250K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5--free</b></td>
+        <td>openrouter</td>
+        <td>204K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+    </table>
+
+    <h2 id="coding">💻 Best AI Models for Coding</h2>
+    <p>0 models optimized for code generation, completion, and understanding.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/M</th>
+        <th>Output $/M</th>
+        <th>Context</th>
+        <th>Capabilities</th>
+      </tr>
+    </table>
+
+    <h2 id="agents">🤖 Best AI Models for Agents</h2>
+    <p>
+      1080 models with both tool calling and reasoning — the key capabilities for building AI
+      agents.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/M</th>
+        <th>Output $/M</th>
+        <th>Context</th>
+        <th>Capabilities</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>40K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>$0.06</td>
+        <td>$0.4</td>
+        <td>131K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>128K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>hermes-4-llama-3.1-8b</b></td>
+        <td>nousresearch</td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+      <tr>
+        <td><b>seed-1.6-flash</b></td>
+        <td>bytedance</td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+        <td>
+          <span class="badge badge-tool">🔧 Tool</span>
+          <span class="badge badge-reason">🧠 Reason</span>
+        </td>
+      </tr>
+    </table>
+
+    <h2 id="reasoning">🧠 Best AI Models for Reasoning</h2>
+    <p>1306 models with advanced reasoning capabilities.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/M</th>
+        <th>Output $/M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.14</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>deepinfra</td>
+        <td>$0.039</td>
+        <td>$0.19</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-9b-v2</b></td>
+        <td>deepinfra</td>
+        <td>$0.04</td>
+        <td>$0.16</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>novitaai</td>
+        <td>$0.04</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nemotron-3-nano-30b-a3b</b></td>
+        <td>deepinfra</td>
+        <td>$0.05</td>
+        <td>$0.2</td>
+        <td>262K</td>
+      </tr>
+    </table>
+
+    <h2 id="vision">👁️ Best AI Models for Vision</h2>
+    <p>1487 models that can understand images and visual content.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/M</th>
+        <th>Output $/M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>paddlepaddle--paddleocr-vl</b></td>
+        <td>novitaai</td>
+        <td>$0.02</td>
+        <td>$0.02</td>
+        <td>16K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr-2</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>reka-edge-2</b></td>
+        <td>reka</td>
+        <td>$0.03</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--autoglm-phone-9b-multilingual</b></td>
+        <td>novitaai</td>
+        <td>$0.035</td>
+        <td>$0.138</td>
+        <td>65K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.0375</td>
+        <td>$0.15</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>google-gemma-3-4b</b></td>
+        <td>amazon-bedrock</td>
+        <td>$0.04</td>
+        <td>$0.08</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2 id="context">📏 Largest Context Windows</h2>
+    <p>Models with the largest context windows for processing long documents.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/M</th>
+        <th>Output $/M</th>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout</b></td>
+        <td>meta</td>
+        <td>10M</td>
+        <td>$0.17</td>
+        <td>$0.66</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-pro</b></td>
+        <td>google</td>
+        <td>2M</td>
+        <td>$1.25</td>
+        <td>$5</td>
+      </tr>
+      <tr>
+        <td><b>xai--grok-4-fast-non-reasoning</b></td>
+        <td>aimlapi</td>
+        <td>2M</td>
+        <td>$0.52</td>
+        <td>$1.3</td>
+      </tr>
+      <tr>
+        <td><b>xai--grok-4-fast-reasoning</b></td>
+        <td>aimlapi</td>
+        <td>2M</td>
+        <td>$0.52</td>
+        <td>$1.3</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.24</td>
+        <td>$0.97</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.17</td>
+        <td>$0.66</td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-1</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>baidu</td>
+        <td>1M</td>
+        <td>$0.126</td>
+        <td>$0.252</td>
+      </tr>
+    </table>
+
+    <h2 id="open">🔓 Open Weights Models</h2>
+    <p>527 models with downloadable weights you can run locally.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Capabilities</th>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash-2026-02-23</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash-2026-04-16</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-Text-01</b></td>
+        <td>302ai</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick</b></td>
+        <td>302ai</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout</b></td>
+        <td>302ai</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td><span class="badge badge-tool">🔧 Tool</span></td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b> — not third-party aggregators. Pricing,
+      context windows, and capabilities are verified against official provider documentation.
+      Aggregator providers (OpenRouter, Requesty, etc.) are excluded from ranking tables to avoid
+      duplicate models.
+    </p>
+    <p>Data is auto-scraped and validated with Zod schemas. Last updated: 2025-05-21.</p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare, and calculate costs
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/free-models.md"
+          >Free Models Guide</a
+        >
+        — all 81 free models
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/openai-alternatives.md"
+          >OpenAI Alternatives</a
+        >
+        — 70+ OpenAI-compatible providers
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/agentic-models.md"
+          >Agentic Models Guide</a
+        >
+        — models for AI agents
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/code-models.md"
+          >Code Models Guide</a
+        >
+        — models for code generation
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/pricing-comparison.md"
+          >Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <p><a href="small-language-models.html">Small Language Models</a></p>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/chatgpt-vs-claude-vs-gemini.html b/site/chatgpt-vs-claude-vs-gemini.html
new file mode 100644
index 00000000..03960473
--- /dev/null
+++ b/site/chatgpt-vs-claude-vs-gemini.html
@@ -0,0 +1,631 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>ChatGPT vs Claude vs Gemini — 2025 Comparison | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="ChatGPT vs Claude vs Gemini: pricing, context windows, capabilities, benchmarks, and API comparison. GPT-4.1 vs Claude Sonnet 4 vs Gemini 2.5 Pro head-to-head."
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/chatgpt-vs-claude-vs-gemini.html"
+    />
+    <meta property="og:title" content="ChatGPT vs Claude vs Gemini — 2025 Comparison" />
+    <meta
+      property="og:description"
+      content="Head-to-head comparison: pricing, context windows, capabilities, benchmarks."
+    />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="577" />
+    <meta property="og:type" content="article" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "ChatGPT vs Claude vs Gemini — 2025 Comparison",
+        "description": "Head-to-head comparison of GPT-4.1, Claude Sonnet 4, and Gemini 2.5 Pro",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "url": "https://i-need-token.github.io/ai-models/chatgpt-vs-claude-vs-gemini.html"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #fff;
+        --text: #1a1a2e;
+        --text2: #555;
+        --accent: #e94560;
+        --card: #f8f9fa;
+        --border: #e0e0e0;
+        --hero: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+        --openai: #10a37f;
+        --anthropic: #d4a574;
+        --google: #4285f4;
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #0f0c29;
+          --text: #e0e0e0;
+          --text2: #aaa;
+          --accent: #e94560;
+          --card: #1a1a2e;
+          --border: #333;
+          --hero: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
+        color: var(--text);
+        background: var(--bg);
+        line-height: 1.7;
+      }
+      .hero {
+        background: var(--hero);
+        color: #fff;
+        padding: 60px 20px;
+        text-align: center;
+      }
+      .hero h1 {
+        font-size: 2.2em;
+        margin-bottom: 12px;
+      }
+      .hero p {
+        font-size: 1.1em;
+        opacity: 0.9;
+        max-width: 700px;
+        margin: 0 auto;
+      }
+      .container {
+        max-width: 900px;
+        margin: 0 auto;
+        padding: 30px 20px;
+      }
+      h2 {
+        color: var(--accent);
+        margin: 40px 0 16px;
+        font-size: 1.5em;
+        border-bottom: 2px solid var(--accent);
+        padding-bottom: 8px;
+      }
+      p {
+        margin: 12px 0;
+        color: var(--text2);
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 0.9em;
+      }
+      th,
+      td {
+        padding: 10px 12px;
+        text-align: left;
+        border-bottom: 1px solid var(--border);
+      }
+      th {
+        background: var(--card);
+        font-weight: 600;
+      }
+      tr:hover {
+        background: var(--card);
+      }
+      .vs-grid {
+        display: grid;
+        grid-template-columns: 1fr 1fr 1fr;
+        gap: 16px;
+        margin: 20px 0;
+      }
+      .vs-card {
+        background: var(--card);
+        border-radius: 12px;
+        padding: 20px;
+        text-align: center;
+        border: 2px solid var(--border);
+      }
+      .vs-card h3 {
+        margin: 0 0 8px;
+        font-size: 1.1em;
+      }
+      .vs-card .price {
+        font-size: 1.8em;
+        font-weight: 700;
+        margin: 8px 0;
+      }
+      .vs-card .label {
+        font-size: 0.8em;
+        color: var(--text2);
+      }
+      .vs-card.openai {
+        border-color: var(--openai);
+      }
+      .vs-card.anthropic {
+        border-color: var(--anthropic);
+      }
+      .vs-card.google {
+        border-color: var(--google);
+      }
+      .winner {
+        background: #e8f5e9;
+        color: #2e7d32;
+        padding: 2px 8px;
+        border-radius: 4px;
+        font-size: 0.85em;
+        font-weight: 600;
+      }
+      .insight {
+        background: var(--card);
+        border-left: 4px solid var(--accent);
+        padding: 16px 20px;
+        margin: 20px 0;
+        border-radius: 0 8px 8px 0;
+      }
+      .insight strong {
+        color: var(--accent);
+      }
+      .related-pages {
+        margin: 40px 0;
+        padding: 20px 0;
+        border-top: 1px solid var(--border);
+      }
+      .related-pages a {
+        display: inline-block;
+        margin: 4px 8px 4px 0;
+        padding: 6px 14px;
+        background: var(--card);
+        border: 1px solid var(--border);
+        border-radius: 20px;
+        text-decoration: none;
+        color: var(--text);
+        font-size: 0.85em;
+      }
+      .related-pages a:hover {
+        border-color: var(--accent);
+        color: var(--accent);
+      }
+      footer {
+        text-align: center;
+        padding: 30px;
+        color: var(--text2);
+        font-size: 0.85em;
+        border-top: 1px solid var(--border);
+        margin-top: 40px;
+      }
+      footer a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      @media (max-width: 768px) {
+        .hero h1 {
+          font-size: 1.6em;
+        }
+        .vs-grid {
+          grid-template-columns: 1fr;
+        }
+        table {
+          font-size: 0.8em;
+        }
+        th,
+        td {
+          padding: 6px 8px;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <div class="hero">
+      <h1>⚡ ChatGPT vs Claude vs Gemini</h1>
+      <p>
+        The definitive 2025 comparison: pricing, context windows, capabilities, benchmarks, and API
+        features. GPT-4.1 vs Claude Sonnet 4 vs Gemini 2.5 Pro.
+      </p>
+    </div>
+    <div class="container">
+      <h2>1. Flagship Models at a Glance</h2>
+      <div class="vs-grid">
+        <div class="vs-card openai">
+          <h3 style="color: var(--openai)">OpenAI GPT-4.1</h3>
+          <div class="price">$2 / $8</div>
+          <div class="label">Input / Output per M tokens</div>
+          <div class="label">1,047,576 context</div>
+        </div>
+        <div class="vs-card anthropic">
+          <h3 style="color: var(--anthropic)">Anthropic Claude Sonnet 4</h3>
+          <div class="price">$3 / $15</div>
+          <div class="label">Input / Output per M tokens</div>
+          <div class="label">200,000 context</div>
+        </div>
+        <div class="vs-card google">
+          <h3 style="color: var(--google)">Google Gemini 2.5 Pro</h3>
+          <div class="price">$1.25 / $10</div>
+          <div class="label">Input / Output per M tokens</div>
+          <div class="label">1,048,576 context</div>
+        </div>
+      </div>
+
+      <h2>2. Pricing Comparison</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Feature</th>
+            <th>GPT-4.1</th>
+            <th>Claude Sonnet 4</th>
+            <th>Gemini 2.5 Pro</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Input price ($/M tokens)</td>
+            <td>$2.00</td>
+            <td>$3.00</td>
+            <td class="winner">$1.25</td>
+          </tr>
+          <tr>
+            <td>Output price ($/M tokens)</td>
+            <td class="winner">$8.00</td>
+            <td>$15.00</td>
+            <td>$10.00</td>
+          </tr>
+          <tr>
+            <td>Cache input ($/M tokens)</td>
+            <td>$0.50</td>
+            <td>$0.30</td>
+            <td class="winner">$0.07</td>
+          </tr>
+          <tr>
+            <td>Context window</td>
+            <td class="winner">1,047,576</td>
+            <td>200,000</td>
+            <td class="winner">1,048,576</td>
+          </tr>
+          <tr>
+            <td>Max output tokens</td>
+            <td>32,768</td>
+            <td class="winner">64,000</td>
+            <td>65,536</td>
+          </tr>
+          <tr>
+            <td>Free tier</td>
+            <td>No</td>
+            <td>Yes (limited)</td>
+            <td class="winner">Yes (generous)</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Winner on price:</strong> Gemini 2.5 Pro offers the best input pricing ($1.25/M) and
+        cache pricing ($0.07/M). GPT-4.1 wins on output pricing ($8/M vs $10-15/M).
+      </div>
+
+      <h2>3. Capabilities</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Capability</th>
+            <th>GPT-4.1</th>
+            <th>Claude Sonnet 4</th>
+            <th>Gemini 2.5 Pro</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Tool calling</td>
+            <td>✅</td>
+            <td>✅</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>Structured output</td>
+            <td>✅</td>
+            <td>✅</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>Reasoning (extended thinking)</td>
+            <td>❌ (use o3)</td>
+            <td>✅</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>Vision (image input)</td>
+            <td>✅</td>
+            <td>✅</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>Image generation</td>
+            <td>✅ (DALL-E)</td>
+            <td>❌</td>
+            <td>✅ (Imagen)</td>
+          </tr>
+          <tr>
+            <td>Audio input</td>
+            <td>✅</td>
+            <td>❌</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>Audio output</td>
+            <td>✅</td>
+            <td>❌</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>Video input</td>
+            <td>❌</td>
+            <td>❌</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>PDF input</td>
+            <td>✅</td>
+            <td>✅</td>
+            <td>✅</td>
+          </tr>
+          <tr>
+            <td>Code execution</td>
+            <td>✅</td>
+            <td>✅ (analysis tool)</td>
+            <td>✅</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Winner on capabilities:</strong> Gemini 2.5 Pro has the broadest multimodal support
+        (video, audio I/O, image generation). Claude Sonnet 4 excels at coding and analysis. GPT-4.1
+        has the strongest tool calling (BFCL #1).
+      </div>
+
+      <h2>4. Benchmark Performance</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Benchmark</th>
+            <th>GPT-4.1</th>
+            <th>Claude Sonnet 4</th>
+            <th>Gemini 2.5 Pro</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>MMLU</td>
+            <td>~90%</td>
+            <td>~88%</td>
+            <td>~90%</td>
+          </tr>
+          <tr>
+            <td>MATH-500</td>
+            <td>~85%</td>
+            <td>~88%</td>
+            <td>~91%</td>
+          </tr>
+          <tr>
+            <td>HumanEval</td>
+            <td>~91%</td>
+            <td class="winner">~93%</td>
+            <td>~90%</td>
+          </tr>
+          <tr>
+            <td>SWE-bench Verified</td>
+            <td>~65%</td>
+            <td class="winner">~72%</td>
+            <td>~63%</td>
+          </tr>
+          <tr>
+            <td>GPQA Diamond</td>
+            <td>~72%</td>
+            <td>~70%</td>
+            <td class="winner">~78%</td>
+          </tr>
+          <tr>
+            <td>BFCL v3 (tool calling)</td>
+            <td class="winner">~88%</td>
+            <td>~86%</td>
+            <td>~85%</td>
+          </tr>
+          <tr>
+            <td>Chatbot Arena</td>
+            <td class="winner">~1380</td>
+            <td>~1370</td>
+            <td>~1360</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key takeaway:</strong> No single model wins all benchmarks. GPT-4.1 leads on tool
+        calling and chat. Claude Sonnet 4 dominates coding (SWE-bench). Gemini 2.5 Pro excels at
+        math and science.
+      </div>
+
+      <h2>5. API &amp; Developer Experience</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Feature</th>
+            <th>OpenAI</th>
+            <th>Anthropic</th>
+            <th>Google</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>API maturity</td>
+            <td class="winner">Most mature</td>
+            <td>Mature</td>
+            <td>Maturing</td>
+          </tr>
+          <tr>
+            <td>SDK languages</td>
+            <td>Python, Node, Go, etc.</td>
+            <td>Python, Node</td>
+            <td>Python, Node, Go, etc.</td>
+          </tr>
+          <tr>
+            <td>Streaming</td>
+            <td>✅ SSE</td>
+            <td>✅ SSE</td>
+            <td>✅ SSE</td>
+          </tr>
+          <tr>
+            <td>Function calling</td>
+            <td class="winner">Parallel, strict mode</td>
+            <td>Parallel, forced tool</td>
+            <td>Parallel, auto</td>
+          </tr>
+          <tr>
+            <td>Batch API</td>
+            <td>✅ (50% discount)</td>
+            <td>✅ (50% discount)</td>
+            <td>✅ (50% discount)</td>
+          </tr>
+          <tr>
+            <td>Fine-tuning</td>
+            <td>✅</td>
+            <td>❌</td>
+            <td>✅ (limited)</td>
+          </tr>
+          <tr>
+            <td>Rate limits</td>
+            <td>Tier-based</td>
+            <td>Tier-based</td>
+            <td>Per-project</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>6. Budget Alternatives</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Use Case</th>
+            <th>Best Budget Option</th>
+            <th>Price</th>
+            <th>Why</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>General chat</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Free</td>
+            <td>Strong quality at zero cost</td>
+          </tr>
+          <tr>
+            <td>Coding</td>
+            <td>DeepSeek V3</td>
+            <td>$0.07/$0.27</td>
+            <td>Near-frontier coding at 1/30th the price</td>
+          </tr>
+          <tr>
+            <td>Reasoning</td>
+            <td>DeepSeek R1</td>
+            <td>Free</td>
+            <td>Top-tier reasoning at zero cost</td>
+          </tr>
+          <tr>
+            <td>Tool calling</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Free</td>
+            <td>Strong BFCL scores for free</td>
+          </tr>
+          <tr>
+            <td>Long context</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Free</td>
+            <td>1M context window for free</td>
+          </tr>
+          <tr>
+            <td>Open source</td>
+            <td>Qwen3-235B</td>
+            <td>Free</td>
+            <td>Best open-weight model</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>7. The Verdict</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>If you need...</th>
+            <th>Choose</th>
+            <th>Because</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Best overall value</td>
+            <td>Gemini 2.5 Pro</td>
+            <td>Lowest input price, 1M context, broadest capabilities</td>
+          </tr>
+          <tr>
+            <td>Best coding assistant</td>
+            <td>Claude Sonnet 4</td>
+            <td>#1 on SWE-bench, 64K output, analysis tool</td>
+          </tr>
+          <tr>
+            <td>Best tool calling</td>
+            <td>GPT-4.1</td>
+            <td>#1 on BFCL, parallel calls, strict mode</td>
+          </tr>
+          <tr>
+            <td>Best free option</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Free with 1M context, strong capabilities</td>
+          </tr>
+          <tr>
+            <td>Best reasoning</td>
+            <td>o3 / DeepSeek R1</td>
+            <td>Reasoning models outperform standard models on math/science</td>
+          </tr>
+          <tr>
+            <td>Most mature API</td>
+            <td>OpenAI</td>
+            <td>Widest SDK support, fine-tuning, most integrations</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <div class="related-pages">
+        <strong>Explore More:</strong>
+        <a href="best-ai-models.html">Best AI Models</a>
+        <a href="free-ai-models.html">Free AI Models</a>
+        <a href="llm-pricing.html">LLM Pricing</a>
+        <a href="openai-alternatives.html">OpenAI Alternatives</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="best-ai-models-for-coding.html">Coding Models</a>
+        <a href="best-ai-models-for-agents.html">Agent Models</a>
+        <a href="cheapest-ai-models.html">Cheapest Models</a>
+        <a href="ai-model-pricing-calculator.html">Price Calculator</a>
+        <a href="index.html">Interactive Catalog</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+      </div>
+    </div>
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models across 95 providers. Updated continuously.
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/cheapest-ai-models.html b/site/cheapest-ai-models.html
new file mode 100644
index 00000000..6da9a037
--- /dev/null
+++ b/site/cheapest-ai-models.html
@@ -0,0 +1,1555 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>Cheapest AI Models — Lowest Price LLMs Compared (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Find the cheapest AI models. Compare LLM pricing across 95 providers. Cheapest models with tool calling, reasoning, vision, and large context windows."
+    />
+    <meta
+      name="keywords"
+      content="cheapest AI model, lowest price LLM, cheap AI API, affordable LLM, budget AI model, cheapest GPT alternative, low cost AI"
+    />
+    <link rel="canonical" href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html" />
+    <meta property="og:title" content="Cheapest AI Models — Lowest Price LLMs Compared (2025)" />
+    <meta
+      property="og:description"
+      content="Find the cheapest AI models. Compare LLM pricing across 95 providers."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="Cheapest AI Models — Lowest Price LLMs Compared (2025)" />
+    <meta
+      name="twitter:description"
+      content="Find the cheapest AI models. Compare LLM pricing across 95 providers."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--green);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Cheapest AI Models — Lowest Price LLMs Compared (2025)",
+        "description": "Find the cheapest AI models. Compare LLM pricing across 95 providers.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>💰 Cheapest AI Models — Lowest Price LLMs (2025)</h1>
+    <p>
+      Find the most affordable AI models across <b>95 providers</b>. All prices per million tokens,
+      from first-party data. Aggregator providers excluded to avoid duplicates.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>81</b><small>Free Models</small></div>
+      <div class="stat"><b>95</b><small>Providers</small></div>
+      <div class="stat"><b>4,587</b><small>Total Models</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 Price tips:</strong> Input price is what you pay for prompts; output price is for
+      completions (usually 2-5x higher). For high-volume use, output price matters most. For
+      RAG/search, input price dominates. All prices shown per million tokens.
+    </div>
+
+    <h2>🏆 Cheapest Overall</h2>
+    <p>The absolute lowest-priced models across all providers.</p>
+    <table>
+      <tr>
+        <th>#</th>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td>1</td>
+        <td><b>openai--gpt-image-1-mini</b></td>
+        <td>aimlapi</td>
+        <td>$0.007</td>
+        <td>$0.676</td>
+        <td>?</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>2</td>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>klusterai</td>
+        <td>$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>3</td>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>4</td>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>5</td>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>6</td>
+        <td><b>openai--gpt-image-1-model</b></td>
+        <td>aimlapi</td>
+        <td>$0.012</td>
+        <td>$0.175</td>
+        <td>?</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>7</td>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>8</td>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>9</td>
+        <td><b>meta-llama-3.1-8b-instruct-turbo</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>10</td>
+        <td><b>meta-llama-3.1-8b-instruct</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>11</td>
+        <td><b>mistral-nemo-instruct-2407</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.04</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>12</td>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>13</td>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>14</td>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>15</td>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>16</td>
+        <td><b>Gemma-2-2b-it</b></td>
+        <td>nebius</td>
+        <td>$0.02</td>
+        <td>$0.06</td>
+        <td>8K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>17</td>
+        <td><b>Meta-Llama-3.1-8B-Instruct</b></td>
+        <td>nebius</td>
+        <td>$0.02</td>
+        <td>$0.06</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>18</td>
+        <td><b>meta-llama--llama-3.1-8b-instruct</b></td>
+        <td>novitaai</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>16K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>19</td>
+        <td><b>paddlepaddle--paddleocr-vl</b></td>
+        <td>novitaai</td>
+        <td>$0.02</td>
+        <td>$0.02</td>
+        <td>16K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>20</td>
+        <td><b>text-embedding-3-small</b></td>
+        <td>openai</td>
+        <td>$0.02</td>
+        <td>$0</td>
+        <td>8K</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🔧 Cheapest with Tool Calling</h2>
+    <p>
+      Most affordable models that support function/tool calling — essential for agents and
+      automation.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>togetherai</td>
+        <td>$0.03</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon</td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon-bedrock</td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-12b-instruct--fp-8</b></td>
+        <td>inferencenet</td>
+        <td>$0.0375</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>🧠 Cheapest with Reasoning</h2>
+    <p>Most affordable reasoning models — chain-of-thought for complex problems on a budget.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.14</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>deepinfra</td>
+        <td>$0.039</td>
+        <td>$0.19</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-9b-v2</b></td>
+        <td>deepinfra</td>
+        <td>$0.04</td>
+        <td>$0.16</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>novitaai</td>
+        <td>$0.04</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nemotron-3-nano-30b-a3b</b></td>
+        <td>deepinfra</td>
+        <td>$0.05</td>
+        <td>$0.2</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>$0.06</td>
+        <td>$0.4</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>👁️ Cheapest with Vision</h2>
+    <p>
+      Most affordable models that can process images — for OCR, visual Q&A, and multimodal tasks.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>paddlepaddle--paddleocr-vl</b></td>
+        <td>novitaai</td>
+        <td>$0.02</td>
+        <td>$0.02</td>
+        <td>16K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr-2</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>reka-edge-2</b></td>
+        <td>reka</td>
+        <td>$0.03</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--autoglm-phone-9b-multilingual</b></td>
+        <td>novitaai</td>
+        <td>$0.035</td>
+        <td>$0.138</td>
+        <td>65K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.0375</td>
+        <td>$0.15</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>google-gemma-3-4b</b></td>
+        <td>amazon-bedrock</td>
+        <td>$0.04</td>
+        <td>$0.08</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-12b-it</b></td>
+        <td>deepinfra</td>
+        <td>$0.04</td>
+        <td>$0.13</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-4b-it</b></td>
+        <td>deepinfra</td>
+        <td>$0.04</td>
+        <td>$0.08</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-9b</b></td>
+        <td>deepinfra</td>
+        <td>$0.04</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>novitaai</td>
+        <td>$0.04</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.2-11b-vision-instruct</b></td>
+        <td>cloudflare</td>
+        <td>$0.049</td>
+        <td>$0.676</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>📏 Cheapest with 128K+ Context</h2>
+    <p>
+      Most affordable models with large context windows — for long documents, codebases, and
+      conversations.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>klusterai</td>
+        <td>$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct-turbo</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-instruct-2407</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.04</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Meta-Llama-3.1-8B-Instruct</b></td>
+        <td>nebius</td>
+        <td>$0.02</td>
+        <td>$0.06</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.2-1b-instruct</b></td>
+        <td>cloudflare</td>
+        <td>$0.027</td>
+        <td>$0.201</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>🏢 Cheapest Model per Provider</h2>
+    <p>
+      The most affordable model from each provider — find the best deal from your preferred
+      provider.
+    </p>
+    <table>
+      <tr>
+        <th>Provider</th>
+        <th>Cheapest Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td>01ai</td>
+        <td><b>yi-lightning</b></td>
+        <td>$1</td>
+        <td>$1</td>
+        <td>16K</td>
+      </tr>
+      <tr>
+        <td>ai21</td>
+        <td><b>jamba-mini-2-2026-01</b></td>
+        <td>$0.2</td>
+        <td>$0.4</td>
+        <td>256K</td>
+      </tr>
+      <tr>
+        <td>aimlapi</td>
+        <td><b>openai--gpt-image-1-mini</b></td>
+        <td>$0.007</td>
+        <td>$0.676</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td>aion</td>
+        <td><b>aion-1.0-mini</b></td>
+        <td>$0.7</td>
+        <td>$1.4</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>alibaba</td>
+        <td><b>qwen-flash</b></td>
+        <td>$0.15</td>
+        <td>$1.5</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td>amazon</td>
+        <td><b>amazon-nova-micro</b></td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td>amazon-bedrock</td>
+        <td><b>amazon-nova-micro</b></td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td>anthropic</td>
+        <td><b>claude-haiku-4-5</b></td>
+        <td>$1</td>
+        <td>$5</td>
+        <td>200K</td>
+      </tr>
+      <tr>
+        <td>arcee</td>
+        <td><b>trinity-mini</b></td>
+        <td>$0.04</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>baichuan</td>
+        <td><b>baichuan4-air</b></td>
+        <td>$0.98</td>
+        <td>$0.98</td>
+        <td>32K</td>
+      </tr>
+      <tr>
+        <td>baidu</td>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.126</td>
+        <td>$0.252</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>baseten</td>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.1</td>
+        <td>$0.5</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>berget</td>
+        <td><b>meta-llama--Llama-3.1-8B-Instruct</b></td>
+        <td>$0.2</td>
+        <td>$0.2</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td>bytedance</td>
+        <td><b>seed-1.6-flash</b></td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td>cerebras</td>
+        <td><b>llama3.1-8b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>chutes</td>
+        <td><b>Qwen--Qwen3-32B-TEE</b></td>
+        <td>$0.08</td>
+        <td>$0.24</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td>clarifai</td>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.09</td>
+        <td>$0.36</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>cloudferro-sherlock</td>
+        <td><b>minimax-m2.5</b></td>
+        <td>$0.26</td>
+        <td>$1.04</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>cloudflare</td>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>databricks</td>
+        <td><b>databricks-gpt-5-nano</b></td>
+        <td>$0.05</td>
+        <td>$0.4</td>
+        <td>200K</td>
+      </tr>
+      <tr>
+        <td>deepinfra</td>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td>deepseek</td>
+        <td><b>deepseek-chat</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>digitalocean</td>
+        <td><b>openai-gpt-oss-20b</b></td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>dinference</td>
+        <td><b>gpt-oss-20b</b></td>
+        <td>$0.07</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>evroc</td>
+        <td><b>Qwen--Qwen3-30B-A3B-Instruct</b></td>
+        <td>$0.1</td>
+        <td>$0.8</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td>fireworks</td>
+        <td><b>gpt-oss-20b</b></td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>friendli</td>
+        <td><b>meta-llama-3.1-8b-instruct</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>gmicloud</td>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>$0.07</td>
+        <td>$0.28</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>google</td>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>google-vertex</td>
+        <td><b>gpt-oss-20b</b></td>
+        <td>$0.07</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>groq</td>
+        <td><b>llama-3.1-8b-instant</b></td>
+        <td>$0.05</td>
+        <td>$0.08</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>hpc-ai</td>
+        <td><b>deepseek--deepseek-v4-flash</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>hyperbolic</td>
+        <td><b>meta-llama--Llama-3.1-8B-BF16-Base</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>iflytek</td>
+        <td><b>spark-ultra</b></td>
+        <td>$0.8</td>
+        <td>$0.8</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>inception</td>
+        <td><b>mercury-2</b></td>
+        <td>$0.25</td>
+        <td>$0.75</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td>inclusionai</td>
+        <td><b>ling-2.6-flash</b></td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td>inferencenet</td>
+        <td><b>bdc-coder</b></td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>klusterai</td>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>meta</td>
+        <td><b>meta-llama-3.2-1b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td>microsoft</td>
+        <td><b>microsoft-phi-4-mini-reasoning</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td>minimax</td>
+        <td><b>M2-her</b></td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td>64K</td>
+      </tr>
+      <tr>
+        <td>mistral</td>
+        <td><b>ministral-3b</b></td>
+        <td>$0.04</td>
+        <td>$0.04</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td>mixlayer</td>
+        <td><b>qwen--qwen3.5-9b</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>moonshotai</td>
+        <td><b>moonshot-v1-8k-vision-preview</b></td>
+        <td>$2</td>
+        <td>$10</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td>morph</td>
+        <td><b>morph-compact</b></td>
+        <td>$0.2</td>
+        <td>$0.5</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>nebius</td>
+        <td><b>Gemma-2-2b-it</b></td>
+        <td>$0.02</td>
+        <td>$0.06</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td>neuralwatt</td>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td>nousresearch</td>
+        <td><b>hermes-3-llama-3.1-8b</b></td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>novitaai</td>
+        <td><b>meta-llama--llama-3.1-8b-instruct</b></td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>16K</td>
+      </tr>
+      <tr>
+        <td>openai</td>
+        <td><b>text-embedding-3-small</b></td>
+        <td>$0.02</td>
+        <td>$0</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td>ovhcloud</td>
+        <td><b>gpt-oss-20b</b></td>
+        <td>$0.05</td>
+        <td>$0.18</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>perplexity</td>
+        <td><b>sonar</b></td>
+        <td>$1</td>
+        <td>$1</td>
+        <td>127K</td>
+      </tr>
+      <tr>
+        <td>ppio</td>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>$0.2145</td>
+        <td>$0.2145</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td>privatemode</td>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.43</td>
+        <td>$1.7</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>reka</td>
+        <td><b>reka-edge-2</b></td>
+        <td>$0.03</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>sambanova</td>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.22</td>
+        <td>$0.59</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>scaleway</td>
+        <td><b>gpt-oss-120b</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>siliconflow</td>
+        <td><b>gpt-oss-20b</b></td>
+        <td>$0.04</td>
+        <td>$0.18</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>siliconflow-cn</td>
+        <td><b>ling-mini-2.0</b></td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>stepfun</td>
+        <td><b>step-3.5-flash-2603</b></td>
+        <td>$0.7</td>
+        <td>$2.1</td>
+        <td>256K</td>
+      </tr>
+      <tr>
+        <td>submodel</td>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>$0.1</td>
+        <td>$0.5</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>tencent</td>
+        <td><b>hunyuan-a13b</b></td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td>224K</td>
+      </tr>
+      <tr>
+        <td>tencent-tokenhub</td>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$1</td>
+        <td>$2</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>textsynth</td>
+        <td><b>EleutherAI--gpt-j-6B</b></td>
+        <td>$0.2</td>
+        <td>$2</td>
+        <td>2K</td>
+      </tr>
+      <tr>
+        <td>togetherai</td>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>$0.03</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>upstage</td>
+        <td><b>solar-embedding-1-large</b></td>
+        <td>$0.1</td>
+        <td>$0</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td>voyage</td>
+        <td><b>rerank-2.5-lite</b></td>
+        <td>$0.02</td>
+        <td>$0</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td>vultr</td>
+        <td><b>cosmos-reason-2-2b</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>wafer</td>
+        <td><b>Qwen3.5-397B-A17B</b></td>
+        <td>$0.6</td>
+        <td>$3.6</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td>writer</td>
+        <td><b>palmyra-x5</b></td>
+        <td>$0.6</td>
+        <td>$6</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td>xai</td>
+        <td><b>xai-grok-4-fast</b></td>
+        <td>$0.2</td>
+        <td>$0.5</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td>xiaomi</td>
+        <td><b>mimo-v2-flash</b></td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td>zhipuai</td>
+        <td><b>glm-4-flashx-250414</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>128K</td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b> — not third-party aggregators. Prices are per
+      million tokens as listed by each provider. Aggregator providers (OpenRouter, Requesty, etc.)
+      are excluded from ranking tables to avoid duplicate models. Actual costs may vary based on
+      usage patterns, caching, and batch discounts.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+          >Best AI Models for Coding</a
+        >
+        — code-focused comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+          >Best AI Models for Agents</a
+        >
+        — agentic model comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <p><a href="small-language-models.html">Small Language Models</a></p>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/context-window-comparison.html b/site/context-window-comparison.html
new file mode 100644
index 00000000..6f7a935f
--- /dev/null
+++ b/site/context-window-comparison.html
@@ -0,0 +1,1661 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      AI Model Context Window Comparison — Largest Context LLMs (2025) | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare AI model context windows. Find models with 1M+, 512K, 256K, 128K token context. Gemini, Claude, GPT-4, Llama and more ranked by context length."
+    />
+    <meta
+      name="keywords"
+      content="AI model context window, LLM context length comparison, largest context window AI, 1M token context, long context LLM, Gemini context window, Claude context window"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+    />
+    <meta
+      property="og:title"
+      content="AI Model Context Window Comparison — Largest Context LLMs (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare AI model context windows. Find models with 1M+, 512K, 256K, 128K token context."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="AI Model Context Window Comparison — Largest Context LLMs (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare AI model context windows. Find models with 1M+, 512K, 256K, 128K token context."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tier-badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 4px;
+        font-size: 11px;
+        font-weight: 600;
+      }
+      .tier-1m {
+        background: rgba(63, 185, 80, 0.15);
+        color: #3fb950;
+      }
+      .tier-512k {
+        background: rgba(88, 166, 255, 0.15);
+        color: #58a6ff;
+      }
+      .tier-256k {
+        background: rgba(210, 153, 34, 0.15);
+        color: #d29922;
+      }
+      .tier-128k {
+        background: rgba(240, 136, 62, 0.15);
+        color: #f0883e;
+      }
+      .ctx-bar {
+        height: 6px;
+        border-radius: 3px;
+        background: var(--accent);
+        margin-top: 4px;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Model Context Window Comparison — Largest Context LLMs (2025)",
+        "description": "Compare AI model context windows. Find models with 1M+, 512K, 256K, 128K token context.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>📏 AI Model Context Window Comparison</h1>
+    <p>
+      Compare context windows across <b>4,587</b> AI models. Find the largest context LLMs for your
+      use case — from 1M+ token monsters to compact 8K models.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>4,587</b><small>Models</small></div>
+      <div class="stat"><b>2,195</b><small>128K+ Context</small></div>
+      <div class="stat"><b>95</b><small>Providers</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <h2>🏆 Top 20 Largest Context Windows</h2>
+    <table>
+      <tr>
+        <th>#</th>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td>1</td>
+        <td><b>meta-llama-4-scout</b></td>
+        <td>meta</td>
+        <td>10M</td>
+        <td>$0.17</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>2</td>
+        <td><b>gemini-1.5-pro</b></td>
+        <td>google</td>
+        <td>2M</td>
+        <td>$1.25</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>3</td>
+        <td><b>xai--grok-4-fast-non-reasoning</b></td>
+        <td>aimlapi</td>
+        <td>2M</td>
+        <td>$0.52</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>4</td>
+        <td><b>xai--grok-4-fast-reasoning</b></td>
+        <td>aimlapi</td>
+        <td>2M</td>
+        <td>$0.52</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>5</td>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.24</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>6</td>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.17</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>7</td>
+        <td><b>minimax-m2-1</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>8</td>
+        <td><b>minimax-m2-5</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>9</td>
+        <td><b>minimax-m2</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>10</td>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>baidu</td>
+        <td>1M</td>
+        <td>$0.126</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>11</td>
+        <td><b>minimax-m2-5</b></td>
+        <td>baseten</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>12</td>
+        <td><b>gpt-5-1</b></td>
+        <td>clarifai</td>
+        <td>1M</td>
+        <td>$1.5625</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>13</td>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td>$0.14</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>14</td>
+        <td><b>llama-4-maverick-17b-128e-instruct-fp8</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td>$0.15</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>15</td>
+        <td><b>mimo-v2.5-pro</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td>$1</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>16</td>
+        <td><b>llama-4-maverick</b></td>
+        <td>digitalocean</td>
+        <td>1M</td>
+        <td>$0.25</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>17</td>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>fireworks</td>
+        <td>1M</td>
+        <td>$1.74</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>18</td>
+        <td><b>meta-llama--Llama-4-Maverick-17B-128E-Instruct-FP8</b></td>
+        <td>gmicloud</td>
+        <td>1M</td>
+        <td>$0.25</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>19</td>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>$0.075</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>20</td>
+        <td><b>gemini-1.5-flash</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>$0.075</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>📊 1M+ Tokens (93 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout</b></td>
+        <td>meta</td>
+        <td>10M</td>
+        <td>$0.17</td>
+        <td>$0.66</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-pro</b></td>
+        <td>google</td>
+        <td>2M</td>
+        <td>$1.25</td>
+        <td>$5</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>xai--grok-4-fast-non-reasoning</b></td>
+        <td>aimlapi</td>
+        <td>2M</td>
+        <td>$0.52</td>
+        <td>$1.3</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>xai--grok-4-fast-reasoning</b></td>
+        <td>aimlapi</td>
+        <td>2M</td>
+        <td>$0.52</td>
+        <td>$1.3</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.24</td>
+        <td>$0.97</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.17</td>
+        <td>$0.66</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-1</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>baidu</td>
+        <td>1M</td>
+        <td>$0.126</td>
+        <td>$0.252</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>baseten</td>
+        <td>1M</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-5-1</b></td>
+        <td>clarifai</td>
+        <td>1M</td>
+        <td>$1.5625</td>
+        <td>$12.5</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick-17b-128e-instruct-fp8</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mimo-v2.5-pro</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td>$1</td>
+        <td>$3</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td colspan="7" style="text-align: center; color: var(--text2)">... and 78 more models</td>
+      </tr>
+    </table>
+
+    <h2>📊 512K–1M Tokens (1 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>baidu</td>
+        <td>716K</td>
+        <td>$1.521</td>
+        <td>$3.042</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>📊 256K–512K Tokens (187 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5-chat</b></td>
+        <td>aimlapi</td>
+        <td>400K</td>
+        <td>$1.625</td>
+        <td>$13</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5-mini</b></td>
+        <td>aimlapi</td>
+        <td>400K</td>
+        <td>$0.325</td>
+        <td>$2.6</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5-nano</b></td>
+        <td>aimlapi</td>
+        <td>400K</td>
+        <td>$0.065</td>
+        <td>$0.52</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5.1-chat-latest</b></td>
+        <td>aimlapi</td>
+        <td>400K</td>
+        <td>$1.625</td>
+        <td>$13</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5.1</b></td>
+        <td>aimlapi</td>
+        <td>400K</td>
+        <td>$1.625</td>
+        <td>$13</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5.2</b></td>
+        <td>aimlapi</td>
+        <td>400K</td>
+        <td>$2.275</td>
+        <td>$18.2</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5</b></td>
+        <td>aimlapi</td>
+        <td>400K</td>
+        <td>$1.625</td>
+        <td>$13</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>cloudflare</td>
+        <td>327K</td>
+        <td>$0.27</td>
+        <td>$0.85</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>deepinfra</td>
+        <td>327K</td>
+        <td>$0.08</td>
+        <td>$0.3</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--Llama-4-Scout-17B-16E-Instruct</b></td>
+        <td>gmicloud</td>
+        <td>327K</td>
+        <td>$0.08</td>
+        <td>$0.5</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>vultr</td>
+        <td>327K</td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e</b></td>
+        <td>vultr</td>
+        <td>327K</td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-lite</b></td>
+        <td>amazon</td>
+        <td>300K</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-pro</b></td>
+        <td>amazon</td>
+        <td>300K</td>
+        <td>$0.8</td>
+        <td>$3.2</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-lite</b></td>
+        <td>amazon-bedrock</td>
+        <td>300K</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td colspan="7" style="text-align: center; color: var(--text2)">... and 172 more models</td>
+      </tr>
+    </table>
+
+    <h2>📊 128K–256K Tokens (685 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>hunyuan-lite</b></td>
+        <td>tencent</td>
+        <td>250K</td>
+        <td>Free</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-a13b</b></td>
+        <td>tencent</td>
+        <td>224K</td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2.5</b></td>
+        <td>dinference</td>
+        <td>204K</td>
+        <td>$0.22</td>
+        <td>$0.88</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5</b></td>
+        <td>hpc-ai</td>
+        <td>204K</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.1-highspeed</b></td>
+        <td>minimax</td>
+        <td>204K</td>
+        <td>$4.2</td>
+        <td>$16.8</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.1</b></td>
+        <td>minimax</td>
+        <td>204K</td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.5-highspeed</b></td>
+        <td>minimax</td>
+        <td>204K</td>
+        <td>$4.2</td>
+        <td>$16.8</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.5</b></td>
+        <td>minimax</td>
+        <td>204K</td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.7-highspeed</b></td>
+        <td>minimax</td>
+        <td>204K</td>
+        <td>$4.2</td>
+        <td>$16.8</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2.7</b></td>
+        <td>minimax</td>
+        <td>204K</td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-M2</b></td>
+        <td>minimax</td>
+        <td>204K</td>
+        <td>$2.1</td>
+        <td>$8.4</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.1</b></td>
+        <td>novitaai</td>
+        <td>204K</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5-highspeed</b></td>
+        <td>novitaai</td>
+        <td>204K</td>
+        <td>$0.6</td>
+        <td>$2.4</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5</b></td>
+        <td>novitaai</td>
+        <td>204K</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.7</b></td>
+        <td>novitaai</td>
+        <td>204K</td>
+        <td>$0.3</td>
+        <td>$1.2</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td colspan="7" style="text-align: center; color: var(--text2)">... and 670 more models</td>
+      </tr>
+    </table>
+
+    <h2>📊 64K–128K Tokens (56 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>sonar</b></td>
+        <td>perplexity</td>
+        <td>127K</td>
+        <td>$1</td>
+        <td>$1</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-300b-a47b-paddle</b></td>
+        <td>novitaai</td>
+        <td>123K</td>
+        <td>$0.28</td>
+        <td>$1.1</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-vl-424b-a47b</b></td>
+        <td>novitaai</td>
+        <td>123K</td>
+        <td>$0.42</td>
+        <td>$1.25</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-300b-a47b-paddle</b></td>
+        <td>ppio</td>
+        <td>123K</td>
+        <td>$2</td>
+        <td>$7</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-vl-424b-a47b</b></td>
+        <td>ppio</td>
+        <td>123K</td>
+        <td>$3</td>
+        <td>$9</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-0.3b</b></td>
+        <td>aimlapi</td>
+        <td>120K</td>
+        <td>Free</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-21B-a3b</b></td>
+        <td>novitaai</td>
+        <td>120K</td>
+        <td>$0.07</td>
+        <td>$0.28</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-0.3b</b></td>
+        <td>ppio</td>
+        <td>120K</td>
+        <td>Free</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-21B-a3b</b></td>
+        <td>ppio</td>
+        <td>120K</td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-27b</b></td>
+        <td>vultr</td>
+        <td>120K</td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-r1-v-mini</b></td>
+        <td>stepfun</td>
+        <td>100K</td>
+        <td>$2.5</td>
+        <td>$8</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-3-27b-it</b></td>
+        <td>novitaai</td>
+        <td>98K</td>
+        <td>$0.119</td>
+        <td>$0.2</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Gemma-3-27b-it</b></td>
+        <td>nebius</td>
+        <td>96K</td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-27b</b></td>
+        <td>privatemode</td>
+        <td>96K</td>
+        <td>$0.77</td>
+        <td>$1.27</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b</b></td>
+        <td>privatemode</td>
+        <td>96K</td>
+        <td>$0.77</td>
+        <td>$1.27</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td colspan="7" style="text-align: center; color: var(--text2)">... and 41 more models</td>
+      </tr>
+    </table>
+
+    <h2>📊 32K–64K Tokens (74 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>mistralai--mistral-nemo</b></td>
+        <td>novitaai</td>
+        <td>60K</td>
+        <td>$0.04</td>
+        <td>$0.17</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-32B-TEE</b></td>
+        <td>chutes</td>
+        <td>40K</td>
+        <td>$0.08</td>
+        <td>$0.24</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>40K</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-14b</b></td>
+        <td>deepinfra</td>
+        <td>40K</td>
+        <td>$0.12</td>
+        <td>$0.24</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b</b></td>
+        <td>deepinfra</td>
+        <td>40K</td>
+        <td>$0.09</td>
+        <td>$0.45</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-32b</b></td>
+        <td>deepinfra</td>
+        <td>40K</td>
+        <td>$0.08</td>
+        <td>$0.28</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-30B-A3B-Instruct</b></td>
+        <td>evroc</td>
+        <td>40K</td>
+        <td>$0.1</td>
+        <td>$0.8</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-VL-30B-A3B-Instruct</b></td>
+        <td>evroc</td>
+        <td>40K</td>
+        <td>$0.2</td>
+        <td>$0.8</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-30B-A3B</b></td>
+        <td>gmicloud</td>
+        <td>40K</td>
+        <td>$0.08</td>
+        <td>$0.25</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-32B-FP8</b></td>
+        <td>gmicloud</td>
+        <td>40K</td>
+        <td>$0.1</td>
+        <td>$0.6</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-235B-A22B-FP8</b></td>
+        <td>klusterai</td>
+        <td>40K</td>
+        <td>$0.13</td>
+        <td>$2</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Magistral-Small-2506</b></td>
+        <td>klusterai</td>
+        <td>40K</td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-235b-a22b-fp8</b></td>
+        <td>novitaai</td>
+        <td>40K</td>
+        <td>$0.2</td>
+        <td>$0.8</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-30b-a3b-fp8</b></td>
+        <td>novitaai</td>
+        <td>40K</td>
+        <td>$0.09</td>
+        <td>$0.45</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-32b-fp8</b></td>
+        <td>novitaai</td>
+        <td>40K</td>
+        <td>$0.1</td>
+        <td>$0.45</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td colspan="7" style="text-align: center; color: var(--text2)">... and 59 more models</td>
+      </tr>
+    </table>
+
+    <h2>📊 8K–32K Tokens (79 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-vl-28b-a3b</b></td>
+        <td>novitaai</td>
+        <td>30K</td>
+        <td>$0.14</td>
+        <td>$0.56</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-vl-28b-a3b</b></td>
+        <td>ppio</td>
+        <td>30K</td>
+        <td>$1</td>
+        <td>$4</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>vultr</td>
+        <td>30K</td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>vultr</td>
+        <td>30K</td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-large-role-latest</b></td>
+        <td>tencent</td>
+        <td>28K</td>
+        <td>$2.4</td>
+        <td>$9.6</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-t1-vision</b></td>
+        <td>tencent</td>
+        <td>28K</td>
+        <td>$3</td>
+        <td>$9</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-role</b></td>
+        <td>tencent-tokenhub</td>
+        <td>28K</td>
+        <td>$2.4</td>
+        <td>$9.6</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-turbos-vision-video</b></td>
+        <td>tencent</td>
+        <td>24K</td>
+        <td>$3</td>
+        <td>$9</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-turbos-vision</b></td>
+        <td>tencent</td>
+        <td>24K</td>
+        <td>$3</td>
+        <td>$9</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-vision-1.5-instruct</b></td>
+        <td>tencent</td>
+        <td>24K</td>
+        <td>$3</td>
+        <td>$9</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>autoglm-phone</b></td>
+        <td>zhipuai</td>
+        <td>20K</td>
+        <td>Free</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-3.5-turbo-16k</b></td>
+        <td>openai</td>
+        <td>16K</td>
+        <td>$3</td>
+        <td>$4</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-3.5-turbo</b></td>
+        <td>openai</td>
+        <td>16K</td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>yi-lightning</b></td>
+        <td>01ai</td>
+        <td>16K</td>
+        <td>$1</td>
+        <td>$1</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>yi-medium</b></td>
+        <td>01ai</td>
+        <td>16K</td>
+        <td>$2.5</td>
+        <td>$2.5</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td colspan="7" style="text-align: center; color: var(--text2)">... and 64 more models</td>
+      </tr>
+    </table>
+
+    <h2>📊 Under 8K Tokens (13 models)</h2>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-3-super-120b</b></td>
+        <td>amazon-bedrock</td>
+        <td>4K</td>
+        <td>$0.15</td>
+        <td>$0.65</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-2-vl</b></td>
+        <td>amazon-bedrock</td>
+        <td>4K</td>
+        <td>$0.2</td>
+        <td>$0.6</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-2</b></td>
+        <td>amazon-bedrock</td>
+        <td>4K</td>
+        <td>$0.06</td>
+        <td>$0.23</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-3-30b</b></td>
+        <td>amazon-bedrock</td>
+        <td>4K</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-2-7b-chat-fp16</b></td>
+        <td>cloudflare</td>
+        <td>4K</td>
+        <td>$0.556</td>
+        <td>$6.667</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mythomax-l2-13b</b></td>
+        <td>deepinfra</td>
+        <td>4K</td>
+        <td>$0.4</td>
+        <td>$0.4</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-3-super-120b</b></td>
+        <td>digitalocean</td>
+        <td>4K</td>
+        <td>$0.3</td>
+        <td>$0.65</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nemotron3-super</b></td>
+        <td>inferencenet</td>
+        <td>4K</td>
+        <td>$2.5</td>
+        <td>$5</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gryphe--mythomax-l2-13b</b></td>
+        <td>novitaai</td>
+        <td>4K</td>
+        <td>$0.09</td>
+        <td>$0.09</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nemotron-3-super-120b-a12b-bf16</b></td>
+        <td>vultr</td>
+        <td>4K</td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-translation-lite</b></td>
+        <td>tencent</td>
+        <td>4K</td>
+        <td>$1</td>
+        <td>$3</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-translation</b></td>
+        <td>tencent</td>
+        <td>4K</td>
+        <td>$1.2</td>
+        <td>$3.6</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>EleutherAI--gpt-j-6B</b></td>
+        <td>textsynth</td>
+        <td>2K</td>
+        <td>$0.2</td>
+        <td>$2</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>💰 Cheapest Models by Context Tier</h2>
+    <p>Find the most affordable model in each context window tier.</p>
+    <table>
+      <tr>
+        <th>Context Tier</th>
+        <th>Cheapest Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+      </tr>
+      <tr>
+        <td>1M+ Tokens</td>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td>$0.0375</td>
+      </tr>
+      <tr>
+        <td>512K–1M Tokens</td>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>baidu</td>
+        <td>716K</td>
+        <td>$1.521</td>
+      </tr>
+      <tr>
+        <td>256K–512K Tokens</td>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>262K</td>
+        <td>$0.01</td>
+      </tr>
+      <tr>
+        <td>128K–256K Tokens</td>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>klusterai</td>
+        <td>131K</td>
+        <td>$0.008</td>
+      </tr>
+      <tr>
+        <td>64K–128K Tokens</td>
+        <td><b>zai-org--autoglm-phone-9b-multilingual</b></td>
+        <td>novitaai</td>
+        <td>65K</td>
+        <td>$0.035</td>
+      </tr>
+      <tr>
+        <td>32K–64K Tokens</td>
+        <td><b>meta-llama--llama-3.2-3b-instruct</b></td>
+        <td>novitaai</td>
+        <td>32K</td>
+        <td>$0.03</td>
+      </tr>
+      <tr>
+        <td>8K–32K Tokens</td>
+        <td><b>Gemma-2-2b-it</b></td>
+        <td>nebius</td>
+        <td>8K</td>
+        <td>$0.02</td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b> — not third-party aggregators. Context
+      windows are as reported by each provider. Aggregator providers are excluded from ranking
+      tables to avoid duplicate models.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/devto-article.md b/site/devto-article.md
new file mode 100644
index 00000000..200c9f74
--- /dev/null
+++ b/site/devto-article.md
@@ -0,0 +1,184 @@
+# I Built the Most Comprehensive AI Model Catalog on GitHub (4,587 Models, 95 Providers)
+
+_Choosing the right AI model shouldn't require visiting 95 different websites._
+
+## The Problem
+
+Every week, a new AI model launches. Every month, a new provider enters the market. Keeping track of pricing, context windows, capabilities, and which models support tool calling or structured output is a full-time job.
+
+I got tired of:
+
+- Checking OpenAI's pricing page, then Anthropic's, then Google's...
+- Wondering "which models support tool calling again?"
+- Not knowing the cheapest model with a 128K+ context window
+- Manually comparing prices across providers for the same model
+
+So I built [AI Models Catalog](https://github.com/i-need-token/ai-models) — a structured YAML catalog of 4,587 AI models across 95 providers, all with first-party data.
+
+## What's Inside
+
+Every model file includes:
+
+```yaml
+id: gpt-4.1
+name: GPT-4.1
+provider: openai
+family: gpt-4
+pricing:
+  input: 2 # $/M tokens
+  output: 8
+  cache_read: 0.5
+limit:
+  context: 1047576 # 1M tokens
+  output: 32768
+tool_call: true
+structured_output: true
+reasoning: false
+modalities:
+  input: [text, image]
+  output: [text]
+```
+
+No more guessing. No more visiting 95 websites.
+
+## The Numbers
+
+| Metric              | Count |
+| ------------------- | ----- |
+| Total models        | 4,587 |
+| Providers           | 95    |
+| Tool-calling models | 2,350 |
+| Reasoning models    | 1,306 |
+| Vision models       | 1,487 |
+| Free models         | 81    |
+| Open weights        | 527   |
+| Structured output   | 829   |
+
+## Key Design Decisions
+
+### First-Party Data Only
+
+Every data point comes from the provider's own API or documentation. No third-party aggregators. This means:
+
+- Pricing is always accurate and up-to-date
+- Model capabilities are verified against official sources
+- No stale or incorrect data from middlemen
+
+### Machine-Readable YAML
+
+Not a web UI you can't query. Not a PDF you can't parse. Structured YAML with:
+
+- TypeScript type definitions
+- Zod runtime validation
+- JSON Schema for other languages
+
+### Automated Sync
+
+Scrape scripts pull fresh data from provider APIs. CI validates everything on every push. No manual updates needed.
+
+## How to Use It
+
+### One Command
+
+```bash
+# Download the latest data
+curl -sL https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+# → 4587
+```
+
+### npm Package
+
+```bash
+npm install ai-models
+```
+
+```javascript
+import catalog from "ai-models/models.json";
+console.log(catalog.models.length); // 4587
+```
+
+### GitHub Action
+
+```yaml
+- uses: i-need-token/ai-models@v0.2.0
+  id: catalog
+- run: echo "Models: ${{ steps.catalog.outputs.model-count }}"
+```
+
+### Interactive Catalog
+
+Try it live: [i-need-token.github.io/ai-models](https://i-need-token.github.io/ai-models/)
+
+Features:
+
+- 🔍 Search, sort, and filter 4,587 models
+- 💰 **Price Calculator** — enter your token usage, see monthly costs
+- 🎯 **Model Picker** — answer 2 questions, get top 5 recommendations
+- 📋 Model detail modal with full metadata
+- ⬇️ Export CSV/JSON
+- 🔗 Shareable URL filters
+
+## Unique Features You Won't Find Elsewhere
+
+### Price Calculator
+
+Enter your monthly token usage and instantly see the cheapest, median, and most expensive model. Filter by capability first (e.g., "only tool-calling models"), then calculate.
+
+### Model Picker
+
+Answer 2 questions:
+
+1. What do you need? (chat, code, agents, reasoning, vision, cheap, free, large context)
+2. What's your budget? (any, free, low, mid, high)
+
+Get the top 5 recommended models with pricing and capability badges.
+
+### 68 Documentation Pages
+
+34 English + 34 Chinese pages covering:
+
+- [Free Models](https://github.com/i-need-token/ai-models/blob/main/docs/free-models.md) — 81 free models
+- [OpenAI Alternatives](https://github.com/i-need-token/ai-models/blob/main/docs/openai-alternatives.md) — 70+ OpenAI-compatible providers
+- [Agentic Models](https://github.com/i-need-token/ai-models/blob/main/docs/agentic-models.md) — 1,080 models with tool_call + reasoning
+- [Code Models](https://github.com/i-need-token/ai-models/blob/main/docs/code-models.md) — 189 code-focused models
+- [Pricing Comparison](https://github.com/i-need-token/ai-models/blob/main/docs/pricing-comparison.md) — side-by-side pricing
+- And 29 more...
+
+## How It Compares
+
+| Project             | Scope                       | Data Source      | Format            | Auto-Update | Free    |
+| ------------------- | --------------------------- | ---------------- | ----------------- | ----------- | ------- |
+| **This catalog**    | 95 providers, 4,587+ models | First-party APIs | YAML + JSON + CSV | Weekly CI   | ✅      |
+| OpenRouter models   | OpenRouter only             | OpenRouter API   | Web UI            | ✅          | ✅      |
+| Artificial Analysis | ~30 providers               | Mixed            | Web UI            | ✅          | Partial |
+| Helicone models     | ~20 providers               | Mixed            | Web UI            | ✅          | Partial |
+| BerriAI/litellm     | 100+ providers              | Community        | Python config     | ✅          | ✅      |
+
+Key differentiators:
+
+- **First-party data only** — not aggregated from third parties
+- **Machine-readable** — structured data with validation, not just a web UI
+- **Multiple formats** — YAML, JSON, CSV, npm, GitHub Action, Hugging Face
+- **Bilingual docs** — 68 pages in English and Chinese
+
+## What's Next
+
+- Model benchmarking data integration
+- Historical pricing trends
+- REST API for querying model data
+- Python package (`pip install ai-models`)
+- Regional availability data
+
+## Get Started
+
+⭐ [Star the repo](https://github.com/i-need-token/ai-models) if you find it useful
+
+🔍 [Try the interactive catalog](https://i-need-token.github.io/ai-models/)
+
+📦 [Download the data](https://github.com/i-need-token/ai-models/releases)
+
+📖 [Read the docs](https://github.com/i-need-token/ai-models/tree/main/docs)
+
+---
+
+_If you're building with AI models, this catalog saves you hours of research. Give it a star and help others find it too!_
diff --git a/site/free-ai-models.html b/site/free-ai-models.html
new file mode 100644
index 00000000..c64782b2
--- /dev/null
+++ b/site/free-ai-models.html
@@ -0,0 +1,1552 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>Free AI Models — 81 Models at Zero Cost (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Complete list of 81 free AI models in 2025. Zero cost, no credit card required. Compare context windows, capabilities, and providers."
+    />
+    <meta
+      name="keywords"
+      content="free AI model, free LLM, free chatbot API, zero cost AI, free GPT alternative, free AI API"
+    />
+    <link rel="canonical" href="https://i-need-token.github.io/ai-models/free-ai-models.html" />
+    <meta property="og:title" content="Free AI Models — 81 Models at Zero Cost (2025)" />
+    <meta
+      property="og:description"
+      content="Complete list of 81 free AI models. Zero cost, no credit card. Compare context windows and capabilities."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/free-ai-models.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="Free AI Models — 81 Models at Zero Cost (2025)" />
+    <meta
+      name="twitter:description"
+      content="Complete list of 81 free AI models. Zero cost, no credit card."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 12px;
+        font-size: 11px;
+        font-weight: 600;
+      }
+      .badge-free {
+        background: rgba(63, 185, 80, 0.15);
+        color: var(--green);
+      }
+      .badge-tool {
+        background: rgba(88, 166, 255, 0.15);
+        color: var(--accent);
+      }
+      .badge-reason {
+        background: rgba(188, 140, 255, 0.15);
+        color: #bc8cff;
+      }
+      .badge-vision {
+        background: rgba(240, 136, 62, 0.15);
+        color: var(--orange);
+      }
+      .badge-ow {
+        background: rgba(63, 185, 80, 0.15);
+        color: var(--green);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .nav {
+        display: flex;
+        gap: 16px;
+        flex-wrap: wrap;
+        margin: 16px 0;
+      }
+      .nav a {
+        color: var(--accent);
+        text-decoration: none;
+        padding: 4px 12px;
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        font-size: 13px;
+      }
+      .nav a:hover {
+        border-color: var(--accent);
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--green);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Free AI Models — 81 Models at Zero Cost (2025)",
+        "description": "Complete list of 81 free AI models in 2025. Zero cost, no credit card required.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>🆓 Free AI Models — 81 Models at Zero Cost</h1>
+    <p>
+      A complete, verified list of <b>81</b> AI models you can use for free — no credit card, no
+      hidden fees. Data sourced from first-party provider APIs.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>81</b><small>Free Models</small></div>
+      <div class="stat"><b>20</b><small>Providers</small></div>
+      <div class="stat"><b>54</b><small>Tool Calling</small></div>
+      <div class="stat"><b>33</b><small>Reasoning</small></div>
+      <div class="stat"><b>27</b><small>Vision</small></div>
+      <div class="stat"><b>10</b><small>Open Weights</small></div>
+      <div class="stat"><b>51</b><small>128K+ Context</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 Pro tip:</strong> Use the
+      <a href="https://i-need-token.github.io/ai-models/" style="color: var(--accent)"
+        >interactive catalog</a
+      >
+      to filter by "Free" and compare models side-by-side. You can also calculate monthly costs for
+      paid alternatives.
+    </div>
+
+    <div class="nav">
+      <a href="#largest-context">Largest Context</a>
+      <a href="#tool-calling">With Tool Calling</a>
+      <a href="#reasoning">With Reasoning</a>
+      <a href="#vision">With Vision</a>
+      <a href="#open-weights">Open Weights</a>
+      <a href="#all">All Free Models</a>
+    </div>
+
+    <h2 id="largest-context">📏 Free Models with Largest Context Windows</h2>
+    <p>
+      These free models can handle the longest inputs — perfect for processing documents, codebases,
+      and long conversations.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+        <th>Vision</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-clip-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-pro-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>codestral</b></td>
+        <td>mistral</td>
+        <td>256K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-lite</b></td>
+        <td>tencent</td>
+        <td>250K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5--free</b></td>
+        <td>openrouter</td>
+        <td>204K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="tool-calling">🔧 Free Models with Tool Calling</h2>
+    <p>54 free models support tool/function calling — essential for building AI agents.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+        <th>Vision</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5--free</b></td>
+        <td>openrouter</td>
+        <td>204K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>z-ai--glm-5.1</b></td>
+        <td>openrouter</td>
+        <td>202K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.5-flash</b></td>
+        <td>auriko</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>zhipuai</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>cobuddy</b></td>
+        <td>baidu</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="reasoning">🧠 Free Models with Reasoning</h2>
+    <p>33 free models with advanced reasoning capabilities.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5--free</b></td>
+        <td>openrouter</td>
+        <td>204K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>z-ai--glm-5.1</b></td>
+        <td>openrouter</td>
+        <td>202K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="vision">👁️ Free Models with Vision</h2>
+    <p>27 free models that can understand images.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+    </table>
+
+    <h2 id="open-weights">🔓 Free Open-Weights Models</h2>
+    <p>10 free models with downloadable weights you can run locally.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>hunyuan-lite</b></td>
+        <td>tencent</td>
+        <td>250K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-8b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.3-70b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-2.5-32b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen-2.5-coder-32b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-32b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-4b-free</b></td>
+        <td>mixlayer</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>voyage-4-nano</b></td>
+        <td>voyage</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="all">📋 All 81 Free AI Models</h2>
+    <p>Complete list of every free AI model in our catalog, sorted by context window size.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+        <th>Vision</th>
+        <th>Open Weights</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-clip-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-pro-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>codestral</b></td>
+        <td>mistral</td>
+        <td>256K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-lite</b></td>
+        <td>tencent</td>
+        <td>250K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5--free</b></td>
+        <td>openrouter</td>
+        <td>204K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>z-ai--glm-5.1</b></td>
+        <td>openrouter</td>
+        <td>202K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.5-flash</b></td>
+        <td>auriko</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>zhipuai</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>spotlight</b></td>
+        <td>arcee</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>cobuddy</b></td>
+        <td>baidu</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-8b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.3-70b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-2.5-32b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen-2.5-coder-32b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-32b</b></td>
+        <td>cerebras</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-12b-it</b></td>
+        <td>google</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-1b-it</b></td>
+        <td>google</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-27b-it</b></td>
+        <td>google</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-4b-it</b></td>
+        <td>google</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3n-E2B-it</b></td>
+        <td>google</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3n-E4B-it</b></td>
+        <td>google</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4-7-flash</b></td>
+        <td>meganova</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>manta-flash-1.0</b></td>
+        <td>meganova</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>manta-mini-1.0</b></td>
+        <td>meganova</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>manta-pro-1.0</b></td>
+        <td>meganova</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-4b-free</b></td>
+        <td>mixlayer</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>baidu--cobuddy--free</b></td>
+        <td>openrouter</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b--free</b></td>
+        <td>openrouter</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b--free</b></td>
+        <td>openrouter</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>poolside--laguna-m.1--free</b></td>
+        <td>openrouter</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>poolside--laguna-xs.2--free</b></td>
+        <td>openrouter</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>z-ai--glm-4.5-air--free</b></td>
+        <td>openrouter</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.6v-flash</b></td>
+        <td>auriko</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>sarvam--sarvam-105b</b></td>
+        <td>fastrouter</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>sarvam--sarvam-30b</b></td>
+        <td>fastrouter</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>devstral</b></td>
+        <td>mistral</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-nano-12b-v2-vl--free</b></td>
+        <td>openrouter</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4-flash-250414</b></td>
+        <td>zhipuai</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.6v-flash</b></td>
+        <td>zhipuai</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-0.3b</b></td>
+        <td>aimlapi</td>
+        <td>120K</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baidu--ernie-4.5-0.3b</b></td>
+        <td>ppio</td>
+        <td>120K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-omni-30b-a3b-instruct</b></td>
+        <td>novitaai</td>
+        <td>65K</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-omni-30b-a3b-thinking</b></td>
+        <td>novitaai</td>
+        <td>65K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.1v-thinking-flash</b></td>
+        <td>zhipuai</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>baichuan4</b></td>
+        <td>baichuan</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>autoglm-phone</b></td>
+        <td>zhipuai</td>
+        <td>20K</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4v-flash</b></td>
+        <td>zhipuai</td>
+        <td>16K</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>spark-lite</b></td>
+        <td>iflytek</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni</b></td>
+        <td>aimlapi</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>auriko</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.5-flash</b></td>
+        <td>llmgateway</td>
+        <td>?</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.6v-flash</b></td>
+        <td>llmgateway</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>llmgateway</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>cognitivecomputations--dolphin-mistral-24b-venice-edition--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>liquid--lfm-2.5-1.2b-instruct--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>liquid--lfm-2.5-1.2b-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--llama-3.2-3b-instruct--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--llama-3.3-70b-instruct--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nousresearch--hermes-3-llama-3.1-405b--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-30b-a3b--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-nano-9b-v2--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openrouter--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-next-80b-a3b-instruct--free</b></td>
+        <td>openrouter</td>
+        <td>?</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-1x-edit</b></td>
+        <td>stepfun</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-2x-large</b></td>
+        <td>stepfun</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-audio-r1.1</b></td>
+        <td>stepfun</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>step-gui</b></td>
+        <td>stepfun</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>voyage-4-nano</b></td>
+        <td>voyage</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>glm-ocr</b></td>
+        <td>zhipuai</td>
+        <td>?</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated recommendations by use case
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/free-models.md"
+          >Free Models Guide</a
+        >
+        — detailed analysis
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/openai-alternatives.md"
+          >OpenAI Alternatives</a
+        >
+        — 70+ providers
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/pricing-comparison.md"
+          >Pricing Comparison</a
+        >
+        — find the cheapest model
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <p><a href="small-language-models.html">Small Language Models</a></p>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/index.html b/site/index.html
new file mode 100644
index 00000000..299757d5
--- /dev/null
+++ b/site/index.html
@@ -0,0 +1,2323 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>AI Models Catalog — Interactive Explorer</title>
+    <meta
+      name="description"
+      content="Explore 4,587+ AI models across 95 providers. Search, filter, and compare models by pricing, context windows, modalities, and capabilities."
+    />
+    <link rel="canonical" href="https://i-need-token.github.io/ai-models/" />
+    <meta property="og:title" content="AI Models Catalog — Interactive Explorer" />
+    <meta
+      property="og:description"
+      content="Explore 4,587+ AI models across 95 providers. Search, filter, and compare models by pricing, context windows, modalities, and capabilities."
+    />
+    <meta property="og:type" content="website" />
+    <meta property="og:url" content="https://i-need-token.github.io/ai-models/" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="AI Models Catalog — Interactive Explorer" />
+    <meta
+      name="twitter:description"
+      content="Explore 4,587+ AI models across 95 providers. Search, filter, and compare."
+    />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Dataset",
+        "name": "AI Models Catalog",
+        "description": "Structured catalog of 4,587 AI models across 95 providers with pricing, context windows, modalities, and capabilities. All data sourced from first-party APIs.",
+        "url": "https://github.com/i-need-token/ai-models",
+        "license": "https://opensource.org/licenses/MIT",
+        "creator": {
+          "@type": "Organization",
+          "name": "i-need-token"
+        },
+        "distribution": [
+          {
+            "@type": "DataDownload",
+            "name": "models.json",
+            "encodingFormat": "application/json",
+            "contentUrl": "https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+          },
+          {
+            "@type": "DataDownload",
+            "name": "models.csv",
+            "encodingFormat": "text/csv",
+            "contentUrl": "https://github.com/i-need-token/ai-models/releases/latest/download/models.csv"
+          }
+        ],
+        "keywords": [
+          "AI models",
+          "LLM pricing",
+          "model catalog",
+          "context windows",
+          "tool calling",
+          "reasoning",
+          "vision",
+          "open weights",
+          "free models"
+        ]
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text-secondary: #8b949e;
+        --accent: #58a6ff;
+        --accent-hover: #79c0ff;
+        --green: #3fb950;
+        --yellow: #d29922;
+        --red: #f85149;
+        --purple: #bc8cff;
+      }
+      [data-theme="light"] {
+        --bg: #ffffff;
+        --surface: #f6f8fa;
+        --border: #d0d7de;
+        --text: #1f2328;
+        --text-secondary: #656d76;
+        --accent: #0969da;
+        --accent-hover: #0550ae;
+        --green: #1a7f37;
+        --yellow: #9a6700;
+        --red: #cf222e;
+        --purple: #8250df;
+      }
+      * {
+        box-sizing: border-box;
+        margin: 0;
+        padding: 0;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Helvetica, Arial, sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        line-height: 1.5;
+      }
+      .container {
+        max-width: 1400px;
+        margin: 0 auto;
+        padding: 16px;
+      }
+      .header {
+        display: flex;
+        justify-content: space-between;
+        align-items: center;
+        flex-wrap: wrap;
+        gap: 12px;
+        margin-bottom: 16px;
+      }
+      .header h1 {
+        font-size: 1.5em;
+        font-weight: 600;
+      }
+      .header h1 a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      .header-actions {
+        display: flex;
+        gap: 8px;
+        align-items: center;
+      }
+      .theme-toggle {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        color: var(--text);
+        padding: 6px 10px;
+        border-radius: 6px;
+        cursor: pointer;
+        font-size: 14px;
+      }
+      .theme-toggle:hover {
+        border-color: var(--accent);
+      }
+      .stats {
+        display: flex;
+        gap: 16px;
+        flex-wrap: wrap;
+        margin-bottom: 16px;
+        font-size: 0.85em;
+        color: var(--text-secondary);
+      }
+      .stats span {
+        background: var(--surface);
+        padding: 4px 10px;
+        border-radius: 12px;
+        border: 1px solid var(--border);
+      }
+      .controls {
+        display: flex;
+        gap: 8px;
+        flex-wrap: wrap;
+        margin-bottom: 12px;
+      }
+      .controls input,
+      .controls select {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        color: var(--text);
+        padding: 8px 12px;
+        border-radius: 6px;
+        font-size: 14px;
+      }
+      .controls input {
+        flex: 1;
+        min-width: 200px;
+      }
+      .controls input:focus,
+      .controls select:focus {
+        outline: none;
+        border-color: var(--accent);
+      }
+      .filter-bar {
+        display: flex;
+        gap: 6px;
+        flex-wrap: wrap;
+        margin-bottom: 12px;
+      }
+      .filter-btn {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        color: var(--text-secondary);
+        padding: 4px 10px;
+        border-radius: 16px;
+        cursor: pointer;
+        font-size: 12px;
+        transition: all 0.15s;
+      }
+      .filter-btn:hover {
+        border-color: var(--accent);
+        color: var(--text);
+      }
+      .filter-btn.active {
+        background: var(--accent);
+        color: #fff;
+        border-color: var(--accent);
+      }
+      .result-count {
+        font-size: 0.85em;
+        color: var(--text-secondary);
+        margin-bottom: 8px;
+      }
+      .table-wrap {
+        overflow-x: auto;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        font-size: 13px;
+      }
+      th,
+      td {
+        padding: 8px 10px;
+        text-align: left;
+        border-bottom: 1px solid var(--border);
+        white-space: nowrap;
+      }
+      th {
+        background: var(--surface);
+        color: var(--text-secondary);
+        font-weight: 600;
+        cursor: pointer;
+        user-select: none;
+        position: sticky;
+        top: 0;
+      }
+      th:hover {
+        color: var(--accent);
+      }
+      th .sort-arrow {
+        margin-left: 4px;
+        font-size: 10px;
+      }
+      tr:hover {
+        background: var(--surface);
+      }
+      .model-id {
+        color: var(--accent);
+        cursor: pointer;
+        font-family: "SFMono-Regular", Consolas, monospace;
+        font-size: 12px;
+      }
+      .model-id:hover {
+        text-decoration: underline;
+      }
+      .copy-id {
+        opacity: 0;
+        cursor: pointer;
+        margin-left: 4px;
+        font-size: 11px;
+        color: var(--text-secondary);
+        transition: opacity 0.15s;
+      }
+      tr:hover .copy-id {
+        opacity: 1;
+      }
+      .copy-id:hover {
+        color: var(--accent);
+      }
+      .provider {
+        color: var(--purple);
+      }
+      .tag {
+        display: inline-block;
+        padding: 1px 6px;
+        border-radius: 10px;
+        font-size: 11px;
+        font-weight: 500;
+        margin: 1px;
+      }
+      .tag-free {
+        background: rgba(63, 185, 80, 0.15);
+        color: var(--green);
+      }
+      .tag-new {
+        background: rgba(240, 136, 62, 0.15);
+        color: #f0883e;
+        font-weight: 700;
+      }
+      .tag-ow {
+        background: rgba(188, 140, 255, 0.15);
+        color: var(--purple);
+      }
+      .tag-reason {
+        background: rgba(210, 153, 34, 0.15);
+        color: var(--yellow);
+      }
+      .tag-tool {
+        background: rgba(88, 166, 255, 0.15);
+        color: var(--accent);
+      }
+      .tag-vision {
+        background: rgba(248, 81, 73, 0.15);
+        color: var(--red);
+      }
+      .price {
+        font-family: "SFMono-Regular", Consolas, monospace;
+        font-size: 12px;
+      }
+      .ctx {
+        font-family: "SFMono-Regular", Consolas, monospace;
+        font-size: 12px;
+      }
+      .help-overlay {
+        display: none;
+        position: fixed;
+        inset: 0;
+        background: rgba(0, 0, 0, 0.5);
+        z-index: 1000;
+        justify-content: center;
+        align-items: center;
+      }
+      .help-panel {
+        background: var(--bg);
+        border: 1px solid var(--border);
+        border-radius: 12px;
+        padding: 20px 24px;
+        max-width: 400px;
+        width: 90vw;
+      }
+      .help-grid {
+        display: grid;
+        grid-template-columns: 60px 1fr;
+        gap: 8px 12px;
+        font-size: 13px;
+      }
+      .help-grid kbd {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 4px;
+        padding: 2px 8px;
+        font-family: monospace;
+        font-size: 12px;
+        text-align: center;
+      }
+      .help-grid span {
+        color: var(--text-secondary);
+      }
+      .star-nudge {
+        display: none;
+        position: fixed;
+        bottom: 24px;
+        right: 24px;
+        z-index: 900;
+        animation: slideUp 0.3s ease;
+      }
+      .star-nudge-content {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 12px;
+        padding: 20px;
+        text-align: center;
+        box-shadow: 0 8px 24px rgba(0, 0, 0, 0.4);
+        min-width: 200px;
+      }
+      .star-nudge-close {
+        position: absolute;
+        top: 8px;
+        right: 12px;
+        background: none;
+        border: none;
+        color: var(--text-secondary);
+        font-size: 18px;
+        cursor: pointer;
+      }
+      .star-nudge-btn {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 8px 20px;
+        border-radius: 6px;
+        text-decoration: none;
+        font-weight: 600;
+        font-size: 13px;
+      }
+      .star-nudge-btn:hover {
+        opacity: 0.9;
+      }
+      @keyframes slideUp {
+        from {
+          transform: translateY(20px);
+          opacity: 0;
+        }
+        to {
+          transform: translateY(0);
+          opacity: 1;
+        }
+      }
+      .toast {
+        position: fixed;
+        bottom: 20px;
+        left: 50%;
+        transform: translateX(-50%) translateY(80px);
+        background: var(--surface);
+        border: 1px solid var(--border);
+        color: var(--text);
+        padding: 8px 16px;
+        border-radius: 8px;
+        font-size: 13px;
+        z-index: 1000;
+        transition: transform 0.2s ease;
+        pointer-events: none;
+      }
+      .toast.show {
+        transform: translateX(-50%) translateY(0);
+      }
+      .footer {
+        text-align: center;
+        margin-top: 20px;
+        padding: 12px;
+        border-top: 1px solid var(--border);
+        font-size: 13px;
+      }
+      .footer a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      .footer a:hover {
+        text-decoration: underline;
+      }
+      .shortcut-hint {
+        color: var(--text-secondary);
+        font-size: 12px;
+      }
+      .pagination {
+        display: flex;
+        justify-content: center;
+        align-items: center;
+        gap: 8px;
+        padding: 16px 0;
+        flex-wrap: wrap;
+      }
+      .pagination button {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        color: var(--text);
+        padding: 6px 12px;
+        border-radius: 6px;
+        cursor: pointer;
+        font-size: 13px;
+      }
+      .pagination button:hover:not(:disabled) {
+        border-color: var(--accent);
+        color: var(--accent);
+      }
+      .pagination button:disabled {
+        opacity: 0.4;
+        cursor: default;
+      }
+      .pagination button.active {
+        background: var(--accent);
+        color: #fff;
+        border-color: var(--accent);
+      }
+      .per-page-select {
+        display: inline-flex;
+        align-items: center;
+        gap: 6px;
+        margin-left: 12px;
+        font-size: 13px;
+        color: var(--text-secondary);
+      }
+      .per-page-select select {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        color: var(--text);
+        padding: 4px 8px;
+        border-radius: 4px;
+        font-size: 13px;
+      }
+      .pagination .page-info {
+        color: var(--text-secondary);
+        font-size: 13px;
+      }
+      .export-btn {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        color: var(--text);
+        padding: 6px 12px;
+        border-radius: 6px;
+        cursor: pointer;
+        font-size: 13px;
+        margin-left: 8px;
+      }
+      .export-btn:hover {
+        border-color: var(--accent);
+        color: var(--accent);
+      }
+      .calculator {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 10px;
+        padding: 12px 16px;
+        margin-top: 8px;
+      }
+      .calc-header {
+        display: flex;
+        justify-content: space-between;
+        align-items: center;
+        font-weight: 600;
+        margin-bottom: 8px;
+      }
+      .calc-inputs {
+        display: flex;
+        gap: 16px;
+        flex-wrap: wrap;
+        margin-bottom: 8px;
+      }
+      .calc-inputs label {
+        font-size: 12px;
+        color: var(--text-secondary);
+        display: flex;
+        flex-direction: column;
+        gap: 4px;
+      }
+      .calc-inputs input {
+        background: var(--bg);
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        padding: 6px 10px;
+        color: var(--text);
+        font-size: 13px;
+        width: 180px;
+      }
+      .calc-result {
+        font-size: 13px;
+        color: var(--text-secondary);
+        line-height: 1.6;
+      }
+      .calc-result .price {
+        color: var(--accent);
+        font-weight: 600;
+      }
+      kbd {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 4px;
+        padding: 1px 5px;
+        font-size: 11px;
+        font-family: inherit;
+      }
+      .modal-overlay {
+        display: none;
+        position: fixed;
+        inset: 0;
+        background: rgba(0, 0, 0, 0.5);
+        z-index: 1000;
+        justify-content: center;
+        align-items: center;
+      }
+      .modal-overlay.open {
+        display: flex;
+      }
+      .modal {
+        background: var(--bg);
+        border: 1px solid var(--border);
+        border-radius: 12px;
+        padding: 24px;
+        max-width: 520px;
+        width: 90%;
+        max-height: 80vh;
+        overflow-y: auto;
+        position: relative;
+      }
+      .compare-modal {
+        max-width: 900px;
+        width: 95vw;
+        max-height: 85vh;
+        overflow-y: auto;
+      }
+      .compare-content {
+        overflow-x: auto;
+      }
+      .compare-table {
+        width: 100%;
+        border-collapse: collapse;
+        font-size: 13px;
+      }
+      .compare-table th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        white-space: nowrap;
+        color: var(--text-secondary);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      .compare-table td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      .compare-table tr:hover td {
+        background: var(--surface);
+      }
+      .compare-table .model-name {
+        font-weight: 600;
+        color: var(--accent);
+      }
+      .compare-table .best {
+        background: rgba(63, 185, 80, 0.1);
+        font-weight: 600;
+      }
+      .compare-checkbox {
+        cursor: pointer;
+        accent-color: var(--accent);
+      }
+      .copy-code-section {
+        margin-top: 12px;
+        padding-top: 12px;
+        border-top: 1px solid var(--border);
+      }
+      .copy-code-label {
+        font-size: 12px;
+        color: var(--text-secondary);
+        margin-bottom: 6px;
+      }
+      .copy-code-btn {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        padding: 4px 12px;
+        cursor: pointer;
+        font-size: 12px;
+        color: var(--text);
+        margin-right: 6px;
+        transition: border-color 0.15s;
+      }
+      .copy-code-btn:hover {
+        border-color: var(--accent);
+        color: var(--accent);
+      }
+      .modal-close {
+        position: absolute;
+        top: 12px;
+        right: 12px;
+        background: none;
+        border: none;
+        color: var(--text-secondary);
+        font-size: 20px;
+        cursor: pointer;
+        padding: 4px 8px;
+      }
+      .modal-close:hover {
+        color: var(--text);
+      }
+      .modal h2 {
+        margin: 0 0 4px;
+        font-size: 18px;
+        color: var(--accent);
+      }
+      .modal .modal-provider {
+        color: var(--purple);
+        font-size: 14px;
+        margin-bottom: 16px;
+      }
+      .modal-grid {
+        display: grid;
+        grid-template-columns: 1fr 1fr;
+        gap: 12px;
+      }
+      .modal-field {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 10px 12px;
+      }
+      .modal-field .label {
+        color: var(--text-secondary);
+        font-size: 11px;
+        text-transform: uppercase;
+        letter-spacing: 0.5px;
+      }
+      .modal-field .value {
+        color: var(--text);
+        font-size: 14px;
+        font-weight: 600;
+        margin-top: 2px;
+      }
+      .modal-caps {
+        display: flex;
+        gap: 6px;
+        margin-top: 12px;
+        flex-wrap: wrap;
+      }
+      @media (max-width: 768px) {
+        .container {
+          padding: 8px;
+        }
+        .header {
+          flex-direction: column;
+          gap: 8px;
+        }
+        .header h1 {
+          font-size: 1.2em;
+        }
+        .header-actions {
+          width: 100%;
+          justify-content: center;
+        }
+        .controls {
+          flex-direction: column;
+          gap: 6px;
+        }
+        .controls input {
+          min-width: 100%;
+          width: 100%;
+        }
+        .controls select {
+          width: 100%;
+        }
+        .filter-group {
+          flex-wrap: wrap;
+          gap: 4px;
+        }
+        .filter-group button {
+          font-size: 11px;
+          padding: 4px 8px;
+        }
+        .table-wrapper {
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        table {
+          min-width: 600px;
+        }
+        th,
+        td {
+          padding: 6px 8px;
+          font-size: 12px;
+        }
+        .modal-content,
+        .compare-modal {
+          width: 95vw;
+          max-height: 90vh;
+          margin: 2vh auto;
+        }
+        .footer-links {
+          font-size: 11px;
+        }
+        .star-nudge {
+          left: 8px;
+          right: 8px;
+          bottom: 8px;
+          max-width: none;
+        }
+      }
+      @media (max-width: 480px) {
+        .header h1 {
+          font-size: 1em;
+        }
+        .filter-group button {
+          font-size: 10px;
+          padding: 3px 6px;
+        }
+        .star-btn {
+          font-size: 12px;
+          padding: 4px 10px;
+        }
+        .shortcut-hint {
+          display: none;
+        }
+      }
+      .picker-inputs {
+        display: flex;
+        gap: 12px;
+        flex-wrap: wrap;
+        margin-bottom: 12px;
+      }
+      .picker-inputs label {
+        display: flex;
+        flex-direction: column;
+        gap: 4px;
+        font-size: 0.85em;
+        color: var(--text-secondary);
+      }
+      .picker-inputs select {
+        padding: 6px 8px;
+        border: 1px solid var(--border);
+        border-radius: 4px;
+        background: var(--bg);
+        color: var(--text);
+      }
+      .picker-result {
+        font-size: 0.9em;
+        line-height: 1.8;
+      }
+      .pick-item {
+        padding: 6px 0;
+        border-bottom: 1px solid var(--border);
+      }
+      .pick-item:last-child {
+        border-bottom: none;
+      }
+      .pick-rank {
+        display: inline-block;
+        width: 24px;
+        font-weight: 700;
+        color: var(--accent);
+      }
+
+      .motd {
+        margin: 12px 0;
+        padding: 16px 20px;
+        background: var(--card-bg);
+        border: 1px solid var(--accent);
+        border-radius: 12px;
+        display: flex;
+        align-items: center;
+        gap: 16px;
+        cursor: pointer;
+        transition: all 0.2s;
+      }
+      .motd:hover {
+        transform: translateY(-1px);
+        box-shadow: 0 4px 12px rgba(0, 0, 0, 0.15);
+      }
+      .motd-icon {
+        font-size: 2em;
+      }
+      .motd-content {
+        flex: 1;
+      }
+      .motd-title {
+        font-weight: 700;
+        font-size: 1.05em;
+      }
+      .motd-meta {
+        font-size: 0.85em;
+        color: var(--text-secondary);
+        margin-top: 2px;
+      }
+      .motd-badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 12px;
+        font-size: 0.7em;
+        font-weight: 600;
+        margin-left: 6px;
+        vertical-align: middle;
+      }
+    </style>
+  </head>
+  <body>
+    <div class="container">
+      <div class="header">
+        <h1>🤖 <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a></h1>
+        <div class="header-actions">
+          <a
+            class="star-btn"
+            href="https://github.com/i-need-token/ai-models"
+            target="_blank"
+            rel="noopener"
+            >⭐ Star</a
+          >
+          <span class="shortcut-hint"><kbd>/</kbd> to search</span>
+          <button class="theme-toggle" onclick="toggleTheme()" title="Toggle light/dark mode">
+            🌙
+          </button>
+        </div>
+      </div>
+      <div class="stats" id="stats"></div>
+
+      <div class="motd" id="motd" onclick="showMotdDetail()" style="display: none">
+        <div class="motd-icon">🌟</div>
+        <div class="motd-content">
+          <div class="motd-title" id="motd-title"></div>
+          <div class="motd-meta" id="motd-meta"></div>
+        </div>
+        <div style="font-size: 0.8em; color: var(--text-secondary)">Model of the Day</div>
+      </div>
+
+      <div class="calculator" id="calculator" style="display: none">
+        <div class="calc-header">
+          <span>💰 Price Calculator</span>
+          <button
+            onclick="toggleCalc()"
+            style="
+              background: none;
+              border: none;
+              color: var(--text-secondary);
+              cursor: pointer;
+              font-size: 16px;
+            "
+          >
+            ✕
+          </button>
+        </div>
+        <div class="calc-inputs">
+          <label
+            >Input tokens/month
+            <input
+              type="number"
+              id="calcInput"
+              value="1000000"
+              min="0"
+              step="100000"
+              onchange="updateCalc()"
+              oninput="updateCalc()"
+          /></label>
+          <label
+            >Output tokens/month
+            <input
+              type="number"
+              id="calcOutput"
+              value="500000"
+              min="0"
+              step="100000"
+              onchange="updateCalc()"
+              oninput="updateCalc()"
+          /></label>
+        </div>
+        <div class="calc-result" id="calcResult"></div>
+        <div class="calculator" id="picker" style="display: none">
+          <div class="calc-header">
+            <span>🎯 Model Picker</span>
+            <button
+              onclick="togglePicker()"
+              style="
+                background: none;
+                border: none;
+                color: var(--text-secondary);
+                cursor: pointer;
+                font-size: 16px;
+              "
+            >
+              ✕
+            </button>
+          </div>
+          <div class="picker-inputs">
+            <label
+              >Task
+              <select id="pickerTask" onchange="updatePicker()">
+                <option value="chat">General Chat</option>
+                <option value="code">Coding</option>
+                <option value="agent">AI Agents</option>
+                <option value="reasoning">Reasoning</option>
+                <option value="vision">Vision</option>
+                <option value="cheap">Cheapest</option>
+                <option value="free">Free</option>
+                <option value="large">Large Context</option>
+              </select></label
+            >
+            <label
+              >Budget
+              <select id="pickerBudget" onchange="updatePicker()">
+                <option value="any">Any</option>
+                <option value="free">Free</option>
+                <option value="low">Under $1/M</option>
+                <option value="mid">$1-5/M</option>
+                <option value="high">$5+/M</option>
+              </select></label
+            >
+          </div>
+          <div class="picker-result" id="pickerResult"></div>
+        </div>
+        <div class="controls">
+          <input
+            type="text"
+            id="search"
+            placeholder="Search models, providers, families… (press /)"
+            autocomplete="off"
+          />
+          <select id="providerFilter">
+            <option value="">All providers</option>
+          </select>
+          <select id="familyFilter">
+            <option value="">All families</option>
+          </select>
+          <select id="sortBy">
+            <option value="id">Sort: Model ID</option>
+            <option value="provider">Sort: Provider</option>
+            <option value="context">Sort: Context ↓</option>
+            <option value="input_price">Sort: Price ↓</option>
+          </select>
+        </div>
+        <div class="filter-bar">
+          <button class="filter-btn" data-filter="free">🆓 Free</button>
+          <button class="filter-btn" data-filter="open_weights">🔓 Open Weights</button>
+          <button class="filter-btn" data-filter="reasoning">🧠 Reasoning</button>
+          <button class="filter-btn" data-filter="tool_call">🔧 Tool Call</button>
+          <button class="filter-btn" data-filter="structured_output">📋 Structured Output</button>
+          <button class="filter-btn" data-filter="vision">👁️ Vision</button>
+          <button class="filter-btn" data-filter="image_output">🖼️ Image Gen</button>
+          <button class="filter-btn" data-filter="audio_input">🎤 Audio In</button>
+          <button class="filter-btn" data-filter="video_input">📹 Video In</button>
+          <button class="filter-btn" data-filter="audio_output">🔊 Audio Out</button>
+          <button class="filter-btn" data-filter="deprecated">⚠️ Deprecated</button>
+          <button
+            class="filter-btn"
+            data-filter="trending"
+            style="background: rgba(240, 136, 62, 0.1); border-color: rgba(240, 136, 62, 0.3)"
+          >
+            🔥 Trending
+          </button>
+        </div>
+        <div class="result-count" id="resultCount"></div>
+        <button class="export-btn" id="compareBtn" onclick="showCompare()" style="display: none">
+          ⚖️ Compare (<span id="compareCount">0</span>)
+        </button>
+        <button class="export-btn" onclick="shareView()" title="Share this view">🔗 Share</button>
+        <button class="export-btn" onclick="exportCSV()" title="Export filtered results as CSV">
+          ⬇ Export CSV
+        </button>
+        <button class="export-btn" onclick="exportJSON()" title="Export filtered results as JSON">
+          ⬇ Export JSON
+        </button>
+        <div class="table-wrap">
+          <table>
+            <thead>
+              <tr>
+                <th data-col="id">Model <span class="sort-arrow"></span></th>
+                <th data-col="provider">Provider <span class="sort-arrow"></span></th>
+                <th data-col="context">Context <span class="sort-arrow"></span></th>
+                <th data-col="input_price">Input $/M <span class="sort-arrow"></span></th>
+                <th data-col="output_price">Output $/M <span class="sort-arrow"></span></th>
+                <th>Capabilities</th>
+              </tr>
+            </thead>
+            <tbody id="tbody"></tbody>
+          </table>
+        </div>
+        <div
+          style="
+            display: flex;
+            align-items: center;
+            justify-content: center;
+            flex-wrap: wrap;
+            gap: 8px;
+          "
+        >
+          <div class="pagination" id="pagination"></div>
+          <div class="per-page-select">
+            <label for="perPageSelect">Per page:</label>
+            <select id="perPageSelect" onchange="changePerPage(this.value)">
+              <option value="25">25</option>
+              <option value="50">50</option>
+              <option value="100" selected>100</option>
+              <option value="200">200</option>
+              <option value="500">500</option>
+            </select>
+          </div>
+        </div>
+        <div class="footer">
+          <a href="https://github.com/i-need-token/ai-models">⭐ Star on GitHub</a> ·
+          <a href="https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+            >JSON</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/action.yml">GitHub Action</a>
+          · <a href="https://www.npmjs.com/package/ai-models">npm</a> ·
+          <a href="https://huggingface.co/datasets/i-need-token/ai-models">Hugging Face</a>
+          <br />
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/quick-start.md"
+            >Quick Start</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/model-selection.md"
+            >Model Selection</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/free-models.md"
+            >Free Models</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/tool-calling.md"
+            >Tool Calling</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/reasoning-models.md"
+            >Reasoning</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/agentic-models.md"
+            >Agentic Models</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/code-models.md"
+            >Code Models</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/pricing-comparison.md"
+            >Pricing</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/cached-pricing.md"
+            >Cached Pricing</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/context-windows.md"
+            >Context Windows</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/vision-models.md"
+            >Vision</a
+          >
+          ·
+          <a href="small-language-models.html">Small Language Models</a>
+          ·
+          <a href="ai-model-picker.html">🎯 Model Picker</a>
+          ·
+          <a href="ai-model-github-action.html">⚡ GitHub Action</a>
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/api.md">API</a>
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/faq.md">FAQ</a>
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/chat-models.md"
+            >Chat Models</a
+          >
+          ·
+          <a href="state-of-ai-models.html">📊 State of AI Models 2025</a>
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/multimodal-models.md"
+            >Multimodal</a
+          >
+          ·
+          <a href="https://github.com/i-need-token/ai-models/blob/main/docs/embedding-models.md"
+            >Embeddings</a
+          >
+          <br />
+          <a href="https://i-need-token.github.io/ai-models/best-ai-models.html"
+            >🏆 Best AI Models</a
+          >
+          ·
+          <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">🆓 Free Models</a>
+          ·
+          <a href="https://i-need-token.github.io/ai-models/llm-pricing.html">💰 LLM Pricing</a>
+          ·
+          <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+            >🔄 OpenAI Alternatives</a
+          >
+          ·
+          <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+            >🔧 Tool Calling Models</a
+          >
+          ·
+          <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+            >💰 Pricing Calculator</a
+          >
+        </div>
+        ·
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >👁️ Vision</a
+        >
+      </div>
+      <div
+        class="modal-overlay"
+        id="compareModal"
+        onclick="if (event.target === this) closeCompare();"
+      >
+        <div class="modal compare-modal">
+          <div
+            class="modal-header"
+            style="
+              display: flex;
+              justify-content: space-between;
+              align-items: center;
+              margin-bottom: 16px;
+            "
+          >
+            <h2 style="margin: 0">⚖️ Model Comparison</h2>
+            <button
+              onclick="closeCompare()"
+              style="
+                background: none;
+                border: none;
+                color: var(--text-secondary);
+                font-size: 20px;
+                cursor: pointer;
+              "
+            >
+              ✕
+            </button>
+          </div>
+          <div class="compare-content" id="compareContent"></div>
+        </div>
+      </div>
+      <div class="help-overlay" id="helpOverlay" onclick="if (event.target === this) closeHelp();">
+        <div class="help-panel">
+          <div
+            style="
+              display: flex;
+              justify-content: space-between;
+              align-items: center;
+              margin-bottom: 12px;
+            "
+          >
+            <h3 style="margin: 0">⌨️ Keyboard Shortcuts</h3>
+            <button
+              onclick="closeHelp()"
+              style="
+                background: none;
+                border: none;
+                color: var(--text-secondary);
+                font-size: 18px;
+                cursor: pointer;
+              "
+            >
+              ✕
+            </button>
+          </div>
+          <div class="help-grid">
+            <kbd>/</kbd><span>Focus search</span> <kbd>Esc</kbd
+            ><span>Close modal / clear search</span> <kbd>?</kbd><span>Show this help</span>
+            <kbd>←</kbd><span>Previous page</span> <kbd>→</kbd><span>Next page</span> <kbd>j</kbd
+            ><span>Next row</span> <kbd>k</kbd><span>Previous row</span> <kbd>Enter</kbd
+            ><span>Open model detail</span> <kbd>c</kbd><span>Toggle compare checkbox</span>
+          </div>
+        </div>
+      </div>
+      <div class="star-nudge" id="starNudge">
+        <div class="star-nudge-content">
+          <button class="star-nudge-close" onclick="dismissNudge()">&times;</button>
+          <div style="font-size: 24px; margin-bottom: 8px">⭐</div>
+          <div style="font-weight: 600; margin-bottom: 4px">Finding this useful?</div>
+          <div style="font-size: 13px; color: var(--text-secondary); margin-bottom: 12px">
+            Star the repo to help others discover it
+          </div>
+          <a
+            href="https://github.com/i-need-token/ai-models"
+            target="_blank"
+            class="star-nudge-btn"
+            onclick="dismissNudge()"
+            >Star on GitHub</a
+          >
+        </div>
+      </div>
+      <div class="toast" id="toast"></div>
+      <div class="modal-overlay" id="modalOverlay" onclick="closeModal()">
+        <div class="modal" onclick="event.stopPropagation()">
+          <button class="modal-close" onclick="closeModal()">✕</button>
+          <h2 id="modalTitle"></h2>
+          <div class="modal-provider" id="modalProvider"></div>
+          <div class="modal-grid" id="modalGrid"></div>
+          <div class="modal-caps" id="modalCaps"></div>
+        </div>
+      </div>
+    </div>
+
+    <script>
+      let perPage = 100;
+      let models = [];
+      let filtered = [];
+      let activeFilters = new Set();
+      let sortCol = "id";
+      let sortAsc = true;
+      let currentPage = 1;
+
+      // Theme
+      function toggleTheme() {
+        const current = document.documentElement.getAttribute("data-theme");
+        const next = current === "light" ? "dark" : "light";
+        document.documentElement.setAttribute("data-theme", next);
+        localStorage.setItem("theme", next);
+        document.querySelector(".theme-toggle").textContent = next === "light" ? "☀️" : "🌙";
+      }
+      (function () {
+        const saved = localStorage.getItem("theme");
+        if (saved) {
+          document.documentElement.setAttribute("data-theme", saved);
+          document.querySelector(".theme-toggle").textContent = saved === "light" ? "☀️" : "🌙";
+        }
+      })();
+
+      // Keyboard shortcut
+      let activeRow = -1;
+
+      document.addEventListener("keydown", (e) => {
+        if (e.key === "/" && document.activeElement !== document.getElementById("search")) {
+          e.preventDefault();
+          document.getElementById("search").focus();
+        }
+        if (e.key === "Escape") {
+          document.getElementById("search").blur();
+          closeDetail();
+          closeCompare();
+          closeHelp();
+          activeRow = -1;
+          highlightRow(-1);
+        }
+        if (e.key === "?") {
+          toggleHelp();
+        }
+        // j/k navigation (only when search is not focused)
+        if (document.activeElement === document.getElementById("search")) return;
+        const rows = document.querySelectorAll("#tbody tr");
+        if (e.key === "j" || e.key === "ArrowDown") {
+          e.preventDefault();
+          activeRow = Math.min(activeRow + 1, rows.length - 1);
+          highlightRow(activeRow);
+        }
+        if (e.key === "k" || e.key === "ArrowUp") {
+          e.preventDefault();
+          activeRow = Math.max(activeRow - 1, 0);
+          highlightRow(activeRow);
+        }
+        if (e.key === "Enter" && activeRow >= 0 && activeRow < rows.length) {
+          showDetail(activeRow + (currentPage - 1) * perPage);
+        }
+        if (e.key === "c" && activeRow >= 0 && activeRow < rows.length) {
+          const cb = rows[activeRow].querySelector(".compare-checkbox");
+          if (cb) {
+            cb.checked = !cb.checked;
+            toggleCompare(cb.dataset.id);
+          }
+        }
+      });
+
+      function highlightRow(idx) {
+        document.querySelectorAll("#tbody tr").forEach((r, i) => {
+          r.classList.toggle("active-row", i === idx);
+        });
+        if (idx >= 0) {
+          const rows = document.querySelectorAll("#tbody tr");
+          if (rows[idx]) rows[idx].scrollIntoView({ block: "nearest" });
+        }
+      }
+
+      // Toast
+      function showToast(msg) {
+        const t = document.getElementById("toast");
+        t.textContent = msg;
+        t.classList.add("show");
+        setTimeout(() => t.classList.remove("show"), 1500);
+      }
+
+      // Copy model ID
+      function copyId(id) {
+        navigator.clipboard.writeText(id).then(() => showToast(`Copied: ${id}`));
+      }
+
+      // Fetch data — try local first (same-origin, always works on Pages),
+      // then CDN (fast when npm published), then Releases (CORS may not work)
+      const LOCAL_URL = "models.json";
+      const CDN_URL = "https://cdn.jsdelivr.net/npm/ai-models@latest/models.json";
+      const RELEASES_URL =
+        "https://github.com/i-need-token/ai-models/releases/latest/download/models.json";
+
+      async function loadData() {
+        const urls = [LOCAL_URL, CDN_URL, RELEASES_URL];
+        for (const url of urls) {
+          try {
+            const r = await fetch(url);
+            if (!r.ok) continue;
+            const data = await r.json();
+            models = Array.isArray(data) ? data : data.models;
+            try {
+              init();
+              initMotd();
+              return; // success
+            } catch (e) {
+              console.error("init() error:", e);
+              document.getElementById("tbody").innerHTML =
+                '<tr><td colspan="6" style="text-align:center;padding:40px;color:var(--text-secondary)">Error rendering data: ' +
+                esc(e.message) +
+                "</td></tr>";
+              return;
+            }
+          } catch (e) {
+            // fetch or parse failed, try next URL
+            continue;
+          }
+        }
+        document.getElementById("tbody").innerHTML =
+          '<tr><td colspan="6" style="text-align:center;padding:40px;color:var(--text-secondary)">Failed to load data. Try refreshing the page.</td></tr>';
+      }
+
+      // Model of the Day
+      function initMotd() {
+        if (!models || models.length === 0) return;
+        const AGG = new Set([
+          "openrouter",
+          "requesty",
+          "auriko",
+          "llmgateway",
+          "cortecs",
+          "aihubmix",
+          "orcarouter",
+          "fastrouter",
+          "302ai",
+          "martian",
+          "nanogpt",
+          "jiekou",
+          "venice",
+          "meganova",
+        ]);
+        const fp = models.filter((m) => !AGG.has(m.provider));
+        // Use date as seed for consistent daily pick
+        const today = new Date();
+        const seed = today.getFullYear() * 10000 + (today.getMonth() + 1) * 100 + today.getDate();
+        const idx = seed % fp.length;
+        const m = fp[idx];
+
+        const price =
+          m.pricing && m.pricing.unit === "free"
+            ? "Free"
+            : m.pricing
+              ? "$" + m.pricing.input + "/$" + m.pricing.output + "/M"
+              : "N/A";
+        const ctx =
+          m.limit && m.limit.context
+            ? m.limit.context >= 1000
+              ? Math.round(m.limit.context / 1000) + "K"
+              : m.limit.context
+            : "N/A";
+
+        let badges = "";
+        if (m.tool_call)
+          badges += '<span class="motd-badge" style="background:#fff8c5;color:#7c6600">TC</span>';
+        if (m.reasoning)
+          badges +=
+            '<span class="motd-badge" style="background:#f0fff4;color:#1a7f37">Reason</span>';
+        if (m.pricing && m.pricing.unit === "free")
+          badges += '<span class="motd-badge" style="background:#ddf4ff;color:#0969da">Free</span>';
+
+        document.getElementById("motd-title").innerHTML = m.id + badges;
+        document.getElementById("motd-meta").textContent =
+          m.provider + " · " + price + " · " + ctx + " context";
+        document.getElementById("motd").style.display = "flex";
+      }
+
+      function showMotdDetail() {
+        // Find the model and show its detail
+        const title = document.getElementById("motd-title").textContent;
+        const modelId = title.replace(/TC|Reason|Free/g, "").trim();
+        const m = models.find((x) => x.id === modelId);
+        if (m) showDetail(m);
+      }
+
+      loadData();
+
+      function init() {
+        // Stats
+        const providers = new Set(models.map((m) => m.provider));
+        const free = models.filter(
+          (m) => m.pricing && (m.pricing.input === 0 || m.pricing.unit === "free"),
+        ).length;
+        const openW = models.filter((m) => m.open_weights).length;
+        document.getElementById("stats").innerHTML =
+          `<span>📦 ${models.length.toLocaleString()} models</span>` +
+          `<span>🏢 ${providers.size} providers</span>` +
+          `<span>🆓 ${free} free</span>` +
+          `<span>🔓 ${openW} open weights</span>`;
+
+        // Family filter
+        const families = new Set(models.map((m) => m.family).filter(Boolean));
+        const famSel = document.getElementById("familyFilter");
+        [...families].sort().forEach((f) => {
+          const opt = document.createElement("option");
+          opt.value = f;
+          opt.textContent = f;
+          famSel.appendChild(opt);
+        });
+
+        // Provider filter
+        const sel = document.getElementById("providerFilter");
+        [...providers].sort().forEach((p) => {
+          const opt = document.createElement("option");
+          opt.value = p;
+          opt.textContent = p;
+          sel.appendChild(opt);
+        });
+
+        render();
+      }
+
+      function render() {
+        const q = document.getElementById("search").value.toLowerCase();
+        const prov = document.getElementById("providerFilter").value;
+
+        filtered = models.filter((m) => {
+          if (q && !(m.id + " " + m.provider + " " + (m.family || "")).toLowerCase().includes(q))
+            return false;
+          if (prov && m.provider !== prov) return false;
+          const fam = document.getElementById("familyFilter").value;
+          if (fam && m.family !== fam) return false;
+          for (const f of activeFilters) {
+            if (
+              f === "free" &&
+              !(m.pricing && (m.pricing.input === 0 || m.pricing.unit === "free"))
+            )
+              return false;
+            if (
+              f === "vision" &&
+              !(m.modalities && m.modalities.input && m.modalities.input.includes("image"))
+            )
+              return false;
+            if (
+              f === "image_output" &&
+              !(m.modalities && m.modalities.output && m.modalities.output.includes("image"))
+            )
+              return false;
+            if (
+              f === "audio_input" &&
+              !(m.modalities && m.modalities.input && m.modalities.input.includes("audio"))
+            )
+              return false;
+            if (
+              f === "video_input" &&
+              !(m.modalities && m.modalities.input && m.modalities.input.includes("video"))
+            )
+              return false;
+            if (
+              f === "audio_output" &&
+              !(m.modalities && m.modalities.output && m.modalities.output.includes("audio"))
+            )
+              return false;
+            if (f === "open_weights" && !m.open_weights) return false;
+            if (f === "reasoning" && !m.reasoning) return false;
+            if (f === "tool_call" && !m.tool_call) return false;
+            if (f === "structured_output" && !m.structured_output) return false;
+            if (f === "deprecated" && !m.deprecated) return false;
+            if (f === "trending")
+              return (
+                m.tool_call &&
+                m.reasoning &&
+                m.release_date &&
+                new Date(m.release_date).getTime() > Date.now() - 90 * 24 * 60 * 60 * 1000
+              );
+          }
+          return true;
+        });
+
+        // Sort
+        filtered.sort((a, b) => {
+          let va, vb;
+          switch (sortCol) {
+            case "id":
+              va = a.id;
+              vb = b.id;
+              break;
+            case "provider":
+              va = a.provider;
+              vb = b.provider;
+              break;
+            case "context":
+              va = (a.limit && a.limit.context) || a.context_window || 0;
+              vb = (b.limit && b.limit.context) || b.context_window || 0;
+              break;
+            case "input_price":
+              va =
+                a.pricing && a.pricing.unit === "free" ? 0 : (a.pricing && a.pricing.input) || 999;
+              vb =
+                b.pricing && b.pricing.unit === "free" ? 0 : (b.pricing && b.pricing.input) || 999;
+              break;
+            case "output_price":
+              va =
+                a.pricing && a.pricing.unit === "free" ? 0 : (a.pricing && a.pricing.output) || 999;
+              vb =
+                b.pricing && b.pricing.unit === "free" ? 0 : (b.pricing && b.pricing.output) || 999;
+              break;
+            default:
+              va = a.id;
+              vb = b.id;
+          }
+          if (typeof va === "string") return sortAsc ? va.localeCompare(vb) : vb.localeCompare(va);
+          return sortAsc ? va - vb : vb - va;
+        });
+
+        // Pagination
+        const totalPages = Math.ceil(filtered.length / perPage);
+        if (currentPage > totalPages) currentPage = totalPages || 1;
+        const start = (currentPage - 1) * perPage;
+        const end = Math.min(start + perPage, filtered.length);
+
+        // Result count
+        document.getElementById("resultCount").textContent =
+          `Showing ${start + 1}–${end} of ${filtered.length.toLocaleString()} models`;
+
+        // Render table
+        const tbody = document.getElementById("tbody");
+        const rows = filtered.slice(start, end).map((m, i) => {
+          const tags = [];
+          const thirtyDaysAgo = Date.now() - 30 * 24 * 60 * 60 * 1000;
+          const releaseDate = m.release_date ? new Date(m.release_date).getTime() : 0;
+          if (releaseDate && releaseDate > thirtyDaysAgo)
+            tags.push('<span class="tag tag-new">New</span>');
+          if (m.pricing && (m.pricing.input === 0 || m.pricing.unit === "free"))
+            tags.push('<span class="tag tag-free">Free</span>');
+          if (m.open_weights) tags.push('<span class="tag tag-ow">Open</span>');
+          if (m.reasoning) tags.push('<span class="tag tag-reason">Reason</span>');
+          if (m.tool_call) tags.push('<span class="tag tag-tool">Tool</span>');
+          if (m.modalities && m.modalities.input && m.modalities.input.includes("image"))
+            tags.push('<span class="tag tag-vision">Vision</span>');
+
+          const ctx =
+            m.limit && m.limit.context
+              ? m.limit.context.toLocaleString()
+              : m.context_window
+                ? m.context_window.toLocaleString()
+                : "—";
+          const inp =
+            m.pricing && m.pricing.unit === "free"
+              ? "Free"
+              : m.pricing && m.pricing.input != null
+                ? m.pricing.input === 0
+                  ? "Free"
+                  : "$" + m.pricing.input
+                : "—";
+          const out =
+            m.pricing && m.pricing.unit === "free"
+              ? "Free"
+              : m.pricing && m.pricing.output != null
+                ? m.pricing.output === 0
+                  ? "Free"
+                  : "$" + m.pricing.output
+                : "—";
+
+          const idx = start + i;
+          const checked = selectedModels.has(m.id) ? "checked" : "";
+          return `<tr>
+          <td><input type="checkbox" class="compare-checkbox" data-id="${m.id}" ${checked} onchange="toggleCompare(this.dataset.id)"></td>
+          <td class="model-id" onclick="showDetail(${idx})" title="Click for details">${esc(m.id)}<span class="copy-id" onclick="event.stopPropagation();copyId('${m.id}')" title="Copy ID">📋</span></td>
+          <td class="provider">${esc(m.provider)}</td>
+          <td class="ctx">${ctx}</td>
+          <td class="price">${inp}</td>
+          <td class="price">${out}</td>
+          <td>${tags.join(" ")}</td>
+        </tr>`;
+        });
+        tbody.innerHTML = rows.join("");
+
+        // Render pagination
+        const pag = document.getElementById("pagination");
+        if (totalPages <= 1) {
+          pag.innerHTML = "";
+          return;
+        }
+        let pagHtml = `<button onclick="goPage(1)" ${currentPage === 1 ? "disabled" : ""}>«</button>`;
+        pagHtml += `<button onclick="goPage(${currentPage - 1})" ${currentPage === 1 ? "disabled" : ""}>‹</button>`;
+
+        const maxButtons = 7;
+        let startPage = Math.max(1, currentPage - Math.floor(maxButtons / 2));
+        let endPage = Math.min(totalPages, startPage + maxButtons - 1);
+        if (endPage - startPage < maxButtons - 1) startPage = Math.max(1, endPage - maxButtons + 1);
+
+        for (let p = startPage; p <= endPage; p++) {
+          pagHtml += `<button onclick="goPage(${p})" class="${p === currentPage ? "active" : ""}">${p}</button>`;
+        }
+        pagHtml += `<button onclick="goPage(${currentPage + 1})" ${currentPage === totalPages ? "disabled" : ""}>›</button>`;
+        pagHtml += `<button onclick="goPage(${totalPages})" ${currentPage === totalPages ? "disabled" : ""}>»</button>`;
+        pagHtml += `<span class="page-info">Page ${currentPage} of ${totalPages}</span>`;
+        pag.innerHTML = pagHtml;
+        updateURL();
+      }
+
+      function changePerPage(val) {
+        perPage = parseInt(val) || 100;
+        currentPage = 1;
+        render();
+      }
+      function goPage(p) {
+        const totalPages = Math.ceil(filtered.length / perPage);
+        currentPage = Math.max(1, Math.min(p, totalPages));
+        render();
+        document.querySelector(".table-wrap").scrollTop = 0;
+      }
+
+      function esc(s) {
+        const d = document.createElement("div");
+        d.textContent = s;
+        return d.innerHTML;
+      }
+
+      // Model detail modal
+      function showDetail(idx) {
+        const m = filtered[idx];
+        if (!m) return;
+        document.getElementById("modalTitle").textContent = m.id;
+        document.getElementById("modalProvider").textContent = m.provider;
+
+        const ctx = (m.limit && m.limit.context) || m.context_window || null;
+        const outLimit = (m.limit && m.limit.output) || null;
+        const inp =
+          m.pricing && m.pricing.unit === "free"
+            ? "Free"
+            : m.pricing && m.pricing.input != null
+              ? m.pricing.input === 0
+                ? "Free"
+                : "$" + m.pricing.input + "/1M"
+              : "—";
+        const out =
+          m.pricing && m.pricing.unit === "free"
+            ? "Free"
+            : m.pricing && m.pricing.output != null
+              ? m.pricing.output === 0
+                ? "Free"
+                : "$" + m.pricing.output + "/1M"
+              : "—";
+        const cacheRead =
+          m.pricing && m.pricing.cache_read ? "$" + m.pricing.cache_read + "/1M" : null;
+        const cacheWrite =
+          m.pricing && m.pricing.cache_write ? "$" + m.pricing.cache_write + "/1M" : null;
+
+        let gridHtml = "";
+        gridHtml += field("Context Window", ctx ? ctx.toLocaleString() + " tokens" : "—");
+        gridHtml += field("Max Output", outLimit ? outLimit.toLocaleString() + " tokens" : "—");
+        gridHtml += field("Input Price", inp);
+        gridHtml += field("Output Price", out);
+        if (cacheRead) gridHtml += field("Cache Read", cacheRead);
+        if (cacheWrite) gridHtml += field("Cache Write", cacheWrite);
+        gridHtml += field("Family", m.family || "—");
+        gridHtml += field("Released", m.release_date || "—");
+        gridHtml += field("Last Updated", m.last_updated || "—");
+        document.getElementById("modalGrid").innerHTML = gridHtml;
+
+        const caps = [];
+        if (m.tool_call) caps.push(tag("tag-tool", "🔧 Tool Call"));
+        if (m.reasoning) caps.push(tag("tag-reason", "🧠 Reasoning"));
+        if (m.structured_output) caps.push(tag("tag-tool", "📋 Structured Output"));
+        if (m.open_weights) caps.push(tag("tag-ow", "🔓 Open Weights"));
+        if (m.pricing && (m.pricing.input === 0 || m.pricing.unit === "free"))
+          caps.push(tag("tag-free", "🆓 Free"));
+        if (m.modalities && m.modalities.input && m.modalities.input.includes("image"))
+          caps.push(tag("tag-vision", "👁️ Vision"));
+        if (m.modalities && m.modalities.input && m.modalities.input.includes("audio"))
+          caps.push(tag("tag-tool", "🎤 Audio In"));
+        if (m.modalities && m.modalities.output && m.modalities.output.includes("image"))
+          caps.push(tag("tag-vision", "🖼️ Image Gen"));
+        if (m.modalities && m.modalities.output && m.modalities.output.includes("audio"))
+          caps.push(tag("tag-tool", "🔊 Audio Out"));
+        if (m.modalities && m.modalities.input && m.modalities.input.includes("video"))
+          caps.push(tag("tag-vision", "📹 Video In"));
+        if (m.deprecated) caps.push(tag("tag-reason", "⚠️ Deprecated"));
+        document.getElementById("modalCaps").innerHTML = caps.join(" ");
+
+        // Copy as code section
+        const copySection = document.createElement("div");
+        copySection.className = "copy-code-section";
+        copySection.innerHTML =
+          '<div class="copy-code-label">Copy as code:</div>' +
+          "<button class=\"copy-code-btn\" onclick=\"copyAsCode('python', '" +
+          m.id +
+          "')\">Python</button>" +
+          "<button class=\"copy-code-btn\" onclick=\"copyAsCode('js', '" +
+          m.id +
+          "')\">JavaScript</button>" +
+          "<button class=\"copy-code-btn\" onclick=\"copyAsCode('curl', '" +
+          m.id +
+          "')\">curl</button>";
+        document.getElementById("modalCaps").appendChild(copySection);
+
+        document.getElementById("modalOverlay").classList.add("open");
+      }
+
+      function closeModal() {
+        document.getElementById("modalOverlay").classList.remove("open");
+      }
+
+      function copyAsCode(lang, modelId) {
+        const m = models.find((x) => x.id === modelId);
+        if (!m) return;
+        const ctx = (m.limit && m.limit.context) || "?";
+        const inpPrice =
+          m.pricing && m.pricing.unit === "free" ? "0" : (m.pricing && m.pricing.input) || "?";
+        const outPrice =
+          m.pricing && m.pricing.unit === "free" ? "0" : (m.pricing && m.pricing.output) || "?";
+        let code = "";
+        if (lang === "python") {
+          code =
+            "# " +
+            m.id +
+            " (" +
+            m.provider +
+            ")\n" +
+            "# Context: " +
+            ctx +
+            " tokens\n" +
+            "# Input: $" +
+            inpPrice +
+            "/1M, Output: $" +
+            outPrice +
+            "/1M\n" +
+            'model_id = "' +
+            m.id +
+            '"\n' +
+            "context = " +
+            ctx +
+            "\n" +
+            'pricing = {"input": ' +
+            inpPrice +
+            ', "output": ' +
+            outPrice +
+            "}";
+        } else if (lang === "js") {
+          code =
+            "// " +
+            m.id +
+            " (" +
+            m.provider +
+            ")\n" +
+            "const model = {\n" +
+            '  id: "' +
+            m.id +
+            '",\n' +
+            '  provider: "' +
+            m.provider +
+            '",\n' +
+            "  context: " +
+            ctx +
+            ",\n" +
+            "  pricing: { input: " +
+            inpPrice +
+            ", output: " +
+            outPrice +
+            " }\n" +
+            "};";
+        } else if (lang === "curl") {
+          code =
+            "# Fetch " +
+            m.id +
+            " metadata\n" +
+            "curl -s https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models[] | select(.id==\"" +
+            m.id +
+            "\")'";
+        }
+        navigator.clipboard
+          .writeText(code)
+          .then(() => showToast("Copied " + lang + " code for " + m.id));
+      }
+
+      function dismissNudge() {
+        document.getElementById("starNudge").style.display = "none";
+        sessionStorage.setItem("starNudgeDismissed", "1");
+      }
+
+      function field(label, value) {
+        return (
+          '<div class="modal-field"><div class="label">' +
+          esc(label) +
+          '</div><div class="value">' +
+          esc(value) +
+          "</div></div>"
+        );
+      }
+
+      function tag(cls, text) {
+        return '<span class="tag ' + cls + '">' + text + "</span>";
+      }
+
+      // Price calculator
+      function toggleCalc() {
+        const el = document.getElementById("calculator");
+        el.style.display = el.style.display === "none" ? "block" : "none";
+        if (el.style.display !== "none") updateCalc();
+      }
+
+      function togglePicker() {
+        const el = document.getElementById("picker");
+        el.style.display = el.style.display === "none" ? "block" : "none";
+        if (el.style.display !== "none") updatePicker();
+      }
+
+      function updatePicker() {
+        const task = document.getElementById("pickerTask").value;
+        const budget = document.getElementById("pickerBudget").value;
+        const AGGREGATORS = new Set([
+          "openrouter",
+          "requesty",
+          "auriko",
+          "llmgateway",
+          "cortecs",
+          "aihubmix",
+          "orcarouter",
+          "fastrouter",
+          "302ai",
+          "martian",
+          "nanogpt",
+          "jiekou",
+          "venice",
+          "meganova",
+        ]);
+        let pool = models.filter((m) => !AGGREGATORS.has(m.provider));
+        if (budget === "free") pool = pool.filter((m) => m.pricing && m.pricing.unit === "free");
+        else if (budget === "low")
+          pool = pool.filter((m) => m.pricing && m.pricing.unit !== "free" && m.pricing.input < 1);
+        else if (budget === "mid")
+          pool = pool.filter(
+            (m) =>
+              m.pricing &&
+              m.pricing.unit !== "free" &&
+              m.pricing.input >= 1 &&
+              m.pricing.input <= 5,
+          );
+        else if (budget === "high") pool = pool.filter((m) => m.pricing && m.pricing.input > 5);
+        let scored = pool
+          .map((m) => {
+            let s = 0;
+            if (task === "chat") {
+              if (m.modalities) s += 1;
+              if (m.tool_call) s += 1;
+            } else if (task === "code") {
+              if (m.code) s += 3;
+              if (m.reasoning) s += 1;
+            } else if (task === "agent") {
+              if (m.tool_call) s += 3;
+              if (m.reasoning) s += 1;
+            } else if (task === "reasoning") {
+              if (m.reasoning) s += 3;
+            } else if (task === "vision") {
+              if (m.modalities && m.modalities.input && m.modalities.input.includes("image"))
+                s += 3;
+            } else if (task === "cheap") {
+              if (m.pricing && m.pricing.input > 0) s = 1000 / m.pricing.input;
+            } else if (task === "free") {
+              if (m.pricing && m.pricing.unit === "free") s += 1;
+            } else if (task === "large") {
+              if (m.limit && m.limit.context) s = m.limit.context;
+            }
+            return { ...m, score: s };
+          })
+          .filter((m) => m.score > 0)
+          .sort((a, b) => b.score - a.score);
+        const top5 = scored.slice(0, 5);
+        if (!top5.length) {
+          document.getElementById("pickerResult").innerHTML = "No matching models found";
+          return;
+        }
+        document.getElementById("pickerResult").innerHTML = top5
+          .map((m, i) => {
+            const price =
+              m.pricing && m.pricing.unit === "free"
+                ? "Free"
+                : m.pricing
+                  ? "$" + m.pricing.input + "/$" + m.pricing.output
+                  : "N/A";
+            const ctx =
+              m.limit && m.limit.context
+                ? m.limit.context >= 1000000
+                  ? m.limit.context / 1000000 + "M"
+                  : m.limit.context / 1000 + "K"
+                : "?";
+            const badges = [
+              m.tool_call ? "🔧" : "",
+              m.reasoning ? "🧠" : "",
+              m.modalities && m.modalities.input && m.modalities.input.includes("image")
+                ? "👁️"
+                : "",
+            ]
+              .filter(Boolean)
+              .join(" ");
+            return (
+              '<span class="price">' +
+              (i + 1) +
+              ". " +
+              m.id +
+              "</span> (" +
+              m.provider +
+              ") — " +
+              price +
+              " · " +
+              ctx +
+              " ctx " +
+              badges
+            );
+          })
+          .join("<br>");
+      }
+
+      function updateCalc() {
+        const inputTokens = parseInt(document.getElementById("calcInput").value) || 0;
+        const outputTokens = parseInt(document.getElementById("calcOutput").value) || 0;
+
+        const prices = filtered
+          .filter((m) => m.pricing && m.pricing.unit !== "free" && m.pricing.input > 0)
+          .map((m) => ({
+            id: m.id,
+            provider: m.provider,
+            monthly:
+              (inputTokens / 1e6) * m.pricing.input + (outputTokens / 1e6) * m.pricing.output,
+          }))
+          .sort((a, b) => a.monthly - b.monthly);
+
+        if (!prices.length) {
+          document.getElementById("calcResult").innerHTML = "No priced models in current filter";
+          return;
+        }
+
+        const cheapest = prices[0];
+        const median = prices[Math.floor(prices.length / 2)];
+        const mostExpensive = prices[prices.length - 1];
+
+        document.getElementById("calcResult").innerHTML =
+          `For <b>${(inputTokens / 1e6).toFixed(1)}M</b> input + <b>${(outputTokens / 1e6).toFixed(1)}M</b> output tokens/month across <b>${prices.length}</b> models:<br>` +
+          `💰 Cheapest: <span class="price">${cheapest.id}</span> ($${cheapest.monthly.toFixed(2)}/mo) · ` +
+          `Median: <span class="price">${median.id}</span> ($${median.monthly.toFixed(2)}/mo) · ` +
+          `Most expensive: <span class="price">${mostExpensive.id}</span> ($${mostExpensive.monthly.toFixed(2)}/mo)`;
+      }
+
+      // === Model Comparison ===
+      const selectedModels = new Set();
+
+      function toggleCompare(id) {
+        if (selectedModels.has(id)) {
+          selectedModels.delete(id);
+        } else if (selectedModels.size < 3) {
+          selectedModels.add(id);
+        }
+        const btn = document.getElementById("compareBtn");
+        const cnt = document.getElementById("compareCount");
+        if (selectedModels.size >= 2) {
+          btn.style.display = "inline-block";
+          cnt.textContent = selectedModels.size;
+        } else {
+          btn.style.display = "none";
+        }
+        document.querySelectorAll(".compare-checkbox").forEach((cb) => {
+          cb.checked = selectedModels.has(cb.dataset.id);
+        });
+      }
+
+      function showCompare() {
+        const compareModels = models.filter((m) => selectedModels.has(m.id));
+        if (compareModels.length < 2) return;
+
+        const fields = [
+          { key: "provider", label: "Provider" },
+          { key: "pricing.input", label: "Input $/M", best: "lowest" },
+          { key: "pricing.output", label: "Output $/M", best: "lowest" },
+          { key: "pricing.cache_read", label: "Cache Read $/M", best: "lowest" },
+          { key: "limit.context", label: "Context", best: "highest" },
+          { key: "limit.output", label: "Max Output", best: "highest" },
+          { key: "tool_call", label: "Tool Call" },
+          { key: "reasoning", label: "Reasoning" },
+          { key: "structured_output", label: "Structured" },
+          { key: "open_weights", label: "Open Weights" },
+          { key: "code", label: "Code" },
+        ];
+
+        function getVal(obj, path) {
+          return path.split(".").reduce((o, k) => o && o[k], obj);
+        }
+
+        function fmtVal(val, m, key) {
+          if (key.startsWith("pricing.")) {
+            if (m.pricing && m.pricing.unit === "free") return "Free";
+            return val != null ? "$" + val : "N/A";
+          }
+          if (key.startsWith("limit.")) {
+            if (!val) return "N/A";
+            return val >= 1000000 ? val / 1000000 + "M" : val / 1000 + "K";
+          }
+          if (typeof val === "boolean") return val ? "✅" : "❌";
+          return val || "N/A";
+        }
+
+        const bestValues = {};
+        fields.forEach((f) => {
+          if (f.best) {
+            const vals = compareModels
+              .map((m) => getVal(m, f.key))
+              .filter((v) => v != null && v !== true && v !== false);
+            if (vals.length)
+              bestValues[f.key] = f.best === "lowest" ? Math.min(...vals) : Math.max(...vals);
+          }
+        });
+
+        let table = '<table class="compare-table"><thead><tr><th></th>';
+        compareModels.forEach((m) => {
+          table += '<th class="model-name">' + m.id + "</th>";
+        });
+        table += "</tr></thead><tbody>";
+
+        fields.forEach((f) => {
+          table += "<tr><th>" + f.label + "</th>";
+          compareModels.forEach((m) => {
+            const val = getVal(m, f.key);
+            const formatted = fmtVal(val, m, f.key);
+            const isBest = f.best && val != null && val === bestValues[f.key];
+            table += "<td" + (isBest ? ' class="best"' : "") + ">" + formatted + "</td>";
+          });
+          table += "</tr>";
+        });
+
+        table += "<tr><th>Input Mods</th>";
+        compareModels.forEach((m) => {
+          table +=
+            "<td>" +
+            (m.modalities && m.modalities.input ? m.modalities.input.join(", ") : "text") +
+            "</td>";
+        });
+        table += "</tr>";
+
+        table += "<tr><th>Output Mods</th>";
+        compareModels.forEach((m) => {
+          table +=
+            "<td>" +
+            (m.modalities && m.modalities.output ? m.modalities.output.join(", ") : "text") +
+            "</td>";
+        });
+        table += "</tr>";
+
+        table += "</tbody></table>";
+        // Add share button
+        const shareBtn =
+          '<div style="margin-top:12px;text-align:center"><button onclick="shareCompare()" style="background:var(--accent);color:#fff;border:none;padding:8px 16px;border-radius:6px;cursor:pointer;font-size:0.9em">🔗 Share Comparison</button></div>';
+        document.getElementById("compareContent").innerHTML = table + shareBtn;
+        document.getElementById("compareModal").style.display = "flex";
+      }
+
+      function closeCompare() {
+        document.getElementById("compareModal").style.display = "none";
+      }
+
+      function shareCompare() {
+        const ids = Array.from(selectedModels).join(",");
+        const url = new URL(window.location);
+        url.searchParams.set("compare", ids);
+        const text = "Comparing " + selectedModels.size + " AI models";
+        if (navigator.share) {
+          navigator.share({ title: text, url: url.toString() });
+        } else {
+          navigator.clipboard.writeText(url.toString());
+          alert("Comparison URL copied to clipboard!");
+        }
+      }
+
+      // Share current view
+      function shareView() {
+        const url = new URL(window.location);
+        const text = "AI Models Catalog — " + filtered.length + " models";
+        if (navigator.share) {
+          navigator.share({ title: text, url: url.toString() });
+        } else {
+          navigator.clipboard.writeText(url.toString()).then(() => showToast("Link copied!"));
+        }
+      }
+
+      // Export filtered results
+      function exportCSV() {
+        const cols = [
+          "id",
+          "provider",
+          "context",
+          "input_price",
+          "output_price",
+          "free",
+          "open_weights",
+          "reasoning",
+          "tool_call",
+          "structured_output",
+          "vision",
+          "audio_input",
+          "image_output",
+        ];
+        let csv = cols.join(",") + "\n";
+        filtered.forEach((m) => {
+          const ctx = (m.limit && m.limit.context) || m.context_window || "";
+          const inp =
+            m.pricing && m.pricing.unit === "free" ? 0 : (m.pricing && m.pricing.input) || "";
+          const out =
+            m.pricing && m.pricing.unit === "free" ? 0 : (m.pricing && m.pricing.output) || "";
+          const free = m.pricing && (m.pricing.input === 0 || m.pricing.unit === "free") ? 1 : 0;
+          const ow = m.open_weights ? 1 : 0;
+          const r = m.reasoning ? 1 : 0;
+          const tc = m.tool_call ? 1 : 0;
+          const so = m.structured_output ? 1 : 0;
+          const vis =
+            m.modalities && m.modalities.input && m.modalities.input.includes("image") ? 1 : 0;
+          const ai =
+            m.modalities && m.modalities.input && m.modalities.input.includes("audio") ? 1 : 0;
+          const io =
+            m.modalities && m.modalities.output && m.modalities.output.includes("image") ? 1 : 0;
+          csv +=
+            [m.id, m.provider, ctx, inp, out, free, ow, r, tc, so, vis, ai, io].join(",") + "\n";
+        });
+        const blob = new Blob([csv], { type: "text/csv" });
+        const a = document.createElement("a");
+        a.href = URL.createObjectURL(blob);
+        a.download = "ai-models-filtered.csv";
+        a.click();
+      }
+
+      function exportJSON() {
+        const data = filtered.map((m) => ({
+          id: m.id,
+          provider: m.provider,
+          context: (m.limit && m.limit.context) || m.context_window || null,
+          pricing: m.pricing,
+          free: m.pricing && (m.pricing.input === 0 || m.pricing.unit === "free"),
+          open_weights: m.open_weights,
+          reasoning: m.reasoning,
+          tool_call: m.tool_call,
+          structured_output: m.structured_output,
+          modalities: m.modalities,
+        }));
+        const blob = new Blob([JSON.stringify(data, null, 2)], { type: "application/json" });
+        const a = document.createElement("a");
+        a.href = URL.createObjectURL(blob);
+        a.download = "ai-models-filtered.json";
+        a.click();
+      }
+
+      // URL state — share filter views via URL params
+      function updateURL() {
+        const params = new URLSearchParams();
+        const q = document.getElementById("search").value;
+        const prov = document.getElementById("providerFilter").value;
+        if (q) params.set("q", q);
+        if (prov) params.set("provider", prov);
+        if (activeFilters.size) params.set("filters", [...activeFilters].join(","));
+        if (sortCol !== "id") params.set("sort", sortCol);
+        if (!sortAsc) params.set("dir", "desc");
+        if (currentPage > 1) params.set("page", currentPage);
+        const url = params.toString();
+        history.replaceState(null, "", url ? "?" + url : location.pathname);
+      }
+
+      function loadURL() {
+        const params = new URLSearchParams(location.search);
+        if (params.has("q")) document.getElementById("search").value = params.get("q");
+        if (params.has("provider"))
+          document.getElementById("providerFilter").value = params.get("provider");
+        if (params.has("filters")) {
+          params
+            .get("filters")
+            .split(",")
+            .forEach((f) => {
+              activeFilters.add(f);
+              const btn = document.querySelector(`.filter-btn[data-filter="${f}"]`);
+              if (btn) btn.classList.add("active");
+            });
+        }
+        if (params.has("sort")) sortCol = params.get("sort");
+        if (params.has("dir") && params.get("dir") === "desc") sortAsc = false;
+        if (params.has("page")) currentPage = parseInt(params.get("page")) || 1;
+        if (params.has("compare")) {
+          params
+            .get("compare")
+            .split(",")
+            .forEach((id) => {
+              selectedModels.add(id);
+            });
+          const btn = document.getElementById("compareBtn");
+          const cnt = document.getElementById("compareCount");
+          btn.style.display = "inline-flex";
+          cnt.textContent = selectedModels.size;
+          // Auto-show comparison after data loads
+          setTimeout(() => {
+            if (selectedModels.size >= 2) showCompare();
+          }, 500);
+        }
+      }
+
+      // Events
+      document.getElementById("search").addEventListener("input", () => {
+        currentPage = 1;
+        render();
+      });
+      document.getElementById("providerFilter").addEventListener("change", () => {
+        currentPage = 1;
+        render();
+      });
+      document.getElementById("sortBy").addEventListener("change", (e) => {
+        const v = e.target.value;
+        if (v === sortCol) sortAsc = !sortAsc;
+        else {
+          sortCol = v;
+          sortAsc = v === "id" || v === "provider";
+        }
+        currentPage = 1;
+        render();
+      });
+
+      // Column header sorting
+      document.querySelectorAll("th[data-col]").forEach((th) => {
+        th.addEventListener("click", () => {
+          const col = th.dataset.col;
+          if (sortCol === col) sortAsc = !sortAsc;
+          else {
+            sortCol = col;
+            sortAsc = col === "id" || col === "provider";
+          }
+          // Update sort arrows
+          document.querySelectorAll("th .sort-arrow").forEach((a) => (a.textContent = ""));
+          th.querySelector(".sort-arrow").textContent = sortAsc ? "▲" : "▼";
+          currentPage = 1;
+          render();
+        });
+      });
+
+      // Filter buttons
+      document.querySelectorAll(".filter-btn").forEach((btn) => {
+        btn.addEventListener("click", () => {
+          const f = btn.dataset.filter;
+          if (activeFilters.has(f)) {
+            activeFilters.delete(f);
+            btn.classList.remove("active");
+          } else {
+            activeFilters.add(f);
+            btn.classList.add("active");
+          }
+          currentPage = 1;
+          render();
+
+          // Star nudge: show after 30s, only once per session
+          if (!sessionStorage.getItem("starNudgeDismissed")) {
+            setTimeout(() => {
+              if (!sessionStorage.getItem("starNudgeDismissed")) {
+                document.getElementById("starNudge").style.display = "block";
+              }
+            }, 30000);
+          }
+        });
+      });
+    </script>
+  </body>
+</html>
diff --git a/site/linkedin-article.md b/site/linkedin-article.md
new file mode 100644
index 00000000..016d0a42
--- /dev/null
+++ b/site/linkedin-article.md
@@ -0,0 +1,86 @@
+# LinkedIn Article: AI Models Catalog
+
+## Title Options
+
+1. I Built the Most Comprehensive AI Model Catalog — 4,587 Models, 95 Providers, Zero Third-Party Data
+2. How to Choose the Right AI Model in 2025: A Data-Driven Guide
+3. Stop Guessing Which AI Model to Use — Here's a Catalog of 4,587 Models with Real Pricing
+
+---
+
+## Article Body
+
+As AI practitioners, we face a growing challenge: with 4,500+ models from 95+ providers, how do you find the right model for your use case?
+
+I've been maintaining an open-source AI Models Catalog that solves this problem with first-party data, structured YAML, and an interactive comparison tool.
+
+**The numbers:**
+
+- 4,587 models across 95 providers
+- 81 free models
+- 2,350 with tool calling
+- 1,306 with reasoning
+- 1,487 with vision
+- 527 open weights
+- 2,195 with 128K+ context windows
+
+**What makes it different:**
+
+1️⃣ **First-party data only** — every data point comes from the provider's own API or documentation, not third-party aggregators. This means pricing is accurate, capabilities are verified, and context windows are real.
+
+2️⃣ **Structured & programmable** — every model is a YAML file with Zod-validated TypeScript types. Use it in your code:
+
+```python
+import requests
+catalog = requests.get(
+    "https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+).json()
+free_models = [m for m in catalog["models"] if m.get("pricing", {}).get("unit") == "free"]
+```
+
+3️⃣ **Interactive catalog** — search, filter by 9 capabilities, compare models side-by-side, calculate monthly costs, and use the model picker wizard at https://i-need-token.github.io/ai-models/
+
+4️⃣ **Free to use** — all data is open source under MIT license. Download as JSON, CSV, or use the npm package.
+
+**Who is this for?**
+
+- 🔧 Developers choosing models for their apps
+- 💰 Teams optimizing AI spend
+- 🤖 Agent builders needing tool-calling models
+- 📊 Researchers tracking the AI landscape
+- 🏢 Enterprises evaluating providers
+
+**Key findings from the data:**
+
+- The cheapest model with tool calling costs $0.01/1M input tokens
+- 81 models are completely free (including some with 128K+ context)
+- Only 527 out of 4,587 models have open weights
+- 1,306 models support reasoning (a rapidly growing category)
+
+If you work with AI models, I'd love your feedback. Star the repo, open an issue, or contribute a provider.
+
+🔗 GitHub: https://github.com/i-need-token/ai-models
+🔗 Interactive Catalog: https://i-need-token.github.io/ai-models/
+🔗 npm: npm install ai-models
+
+#AI #MachineLearning #LLM #OpenSource #ArtificialIntelligence #AIModels #DataScience
+
+---
+
+## Short Post Version (for sharing)
+
+I maintain an open-source catalog of 4,587 AI models from 95 providers — all with first-party data, real pricing, and verified capabilities.
+
+🔍 Interactive catalog: https://i-need-token.github.io/ai-models/
+⭐ GitHub: https://github.com/i-need-token/ai-models
+
+Key stats:
+• 81 free models
+• 2,350 with tool calling
+• 1,306 with reasoning
+• 527 open weights
+• 2,195 with 128K+ context
+
+Search, filter, compare, and calculate costs — all in one place.
+
+#AI #LLM #OpenSource #MachineLearning
diff --git a/site/llm-pricing.html b/site/llm-pricing.html
new file mode 100644
index 00000000..7b23fc87
--- /dev/null
+++ b/site/llm-pricing.html
@@ -0,0 +1,929 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>LLM Pricing Comparison — 4587 AI Models, Real Prices (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Compare LLM pricing across 4587 AI models and 95 providers. Find the cheapest model for your use case. Input/output prices per million tokens, cache pricing, and cost calculator."
+    />
+    <meta
+      name="keywords"
+      content="LLM pricing, AI model pricing, cheapest LLM, LLM cost comparison, GPT-4 pricing, Claude pricing, AI API cost"
+    />
+    <link rel="canonical" href="https://i-need-token.github.io/ai-models/llm-pricing.html" />
+    <meta
+      property="og:title"
+      content="LLM Pricing Comparison — 4587 AI Models, Real Prices (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare LLM pricing across 4587 models. Find the cheapest model. Input/output prices per million tokens."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:url" content="https://i-need-token.github.io/ai-models/llm-pricing.html" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="LLM Pricing Comparison — 4587 AI Models, Real Prices" />
+    <meta
+      name="twitter:description"
+      content="Compare LLM pricing across 4587 models. Find the cheapest model for your use case."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+        --red: #f85149;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cheapest {
+        color: var(--green);
+        font-weight: 600;
+      }
+      .priciest {
+        color: var(--red);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .nav {
+        display: flex;
+        gap: 16px;
+        flex-wrap: wrap;
+        margin: 16px 0;
+      }
+      .nav a {
+        color: var(--accent);
+        text-decoration: none;
+        padding: 4px 12px;
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        font-size: 13px;
+      }
+      .nav a:hover {
+        border-color: var(--accent);
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .calc {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 20px;
+        margin: 20px 0;
+      }
+      .calc input {
+        background: var(--bg);
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        padding: 8px 12px;
+        color: var(--text);
+        font-size: 14px;
+        width: 120px;
+      }
+      .calc button {
+        background: var(--accent);
+        border: none;
+        border-radius: 6px;
+        padding: 8px 16px;
+        color: #fff;
+        cursor: pointer;
+        font-weight: 600;
+      }
+      .tip {
+        background: rgba(88, 166, 255, 0.08);
+        border: 1px solid rgba(88, 166, 255, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "LLM Pricing Comparison — 4587 AI Models, Real Prices (2025)",
+        "description": "Compare LLM pricing across 4587 AI models and 95 providers. Find the cheapest model for your use case.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>💰 LLM Pricing Comparison — 4587 AI Models</h1>
+    <p>
+      Real pricing data for <b>4587</b> AI models across <b>95</b> providers. All prices are per
+      million tokens, sourced from first-party APIs. No third-party aggregators.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>$0.01</b><small>Cheapest Input/1M</small></div>
+      <div class="stat"><b>$150.00</b><small>Most Expensive Input/1M</small></div>
+      <div class="stat"><b>$1.61</b><small>Average Input/1M</small></div>
+      <div class="stat"><b>81</b><small>Free Models</small></div>
+      <div class="stat"><b>0</b><small>With Cache Pricing</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/"
+      >🔍 Price Calculator in Catalog</a
+    >
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 Pro tip:</strong> Use the
+      <a href="https://i-need-token.github.io/ai-models/" style="color: var(--accent)"
+        >interactive catalog's price calculator</a
+      >
+      to estimate monthly costs based on your actual token usage.
+    </div>
+
+    <div class="nav">
+      <a href="#cheapest-all">Cheapest Overall</a>
+      <a href="#cheapest-tool">Cheapest Tool Calling</a>
+      <a href="#cheapest-reasoning">Cheapest Reasoning</a>
+      <a href="#cheapest-vision">Cheapest Vision</a>
+      <a href="#cheapest-128k">Cheapest 128K+ Context</a>
+      <a href="#flagship">Flagship Model Prices</a>
+      <a href="#cache">Cache Pricing</a>
+    </div>
+
+    <h2 id="cheapest-all">💵 Cheapest AI Models Overall</h2>
+    <p>The most affordable models per million input tokens.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-image-1-mini</b></td>
+        <td>aimlapi</td>
+        <td class="cheapest">$0.007</td>
+        <td>$0.676</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>klusterai</td>
+        <td class="cheapest">$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-image-1-model</b></td>
+        <td>aimlapi</td>
+        <td class="cheapest">$0.012</td>
+        <td>$0.175</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td class="cheapest">$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td class="cheapest">$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct-turbo</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-instruct-2407</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.04</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2 id="cheapest-tool">🔧 Cheapest Models with Tool Calling</h2>
+    <p>The most affordable models that support function/tool calling — essential for AI agents.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td class="cheapest">$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td class="cheapest">$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+    </table>
+
+    <h2 id="cheapest-reasoning">🧠 Cheapest Models with Reasoning</h2>
+    <p>The most affordable models with advanced reasoning capabilities.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.14</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.039</td>
+        <td>$0.19</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-9b-v2</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.04</td>
+        <td>$0.16</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>novitaai</td>
+        <td class="cheapest">$0.04</td>
+        <td>$0.15</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>nemotron-3-nano-30b-a3b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.05</td>
+        <td>$0.2</td>
+        <td>262K</td>
+      </tr>
+    </table>
+
+    <h2 id="cheapest-vision">👁️ Cheapest Models with Vision</h2>
+    <p>The most affordable models that can understand images.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>paddlepaddle--paddleocr-vl</b></td>
+        <td>novitaai</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.02</td>
+        <td>16K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr-2</b></td>
+        <td>novitaai</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr</b></td>
+        <td>novitaai</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+      </tr>
+      <tr>
+        <td><b>reka-edge-2</b></td>
+        <td>reka</td>
+        <td class="cheapest">$0.03</td>
+        <td>$0.1</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--autoglm-phone-9b-multilingual</b></td>
+        <td>novitaai</td>
+        <td class="cheapest">$0.035</td>
+        <td>$0.138</td>
+        <td>65K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.0375</td>
+        <td>$0.15</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>google-gemma-3-4b</b></td>
+        <td>amazon-bedrock</td>
+        <td class="cheapest">$0.04</td>
+        <td>$0.08</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2 id="cheapest-128k">📏 Cheapest Models with 128K+ Context</h2>
+    <p>The most affordable models with large context windows (128K+ tokens).</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>klusterai</td>
+        <td class="cheapest">$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td class="cheapest">$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td class="cheapest">$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td class="cheapest">$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct-turbo</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-3.1-8b-instruct</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-instruct-2407</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.04</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td class="cheapest">$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+      </tr>
+    </table>
+
+    <h2 id="flagship">🏆 Flagship Model Prices</h2>
+    <p>How much do the top AI models cost? A side-by-side comparison of the most popular models.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1</b></td>
+        <td>openai</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o</b></td>
+        <td>openai</td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>deepinfra</td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>deepinfra</td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick</b></td>
+        <td>digitalocean</td>
+        <td>$0.25</td>
+        <td>$0.87</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>amazon-bedrock</td>
+        <td>$1.35</td>
+        <td>$5.4</td>
+        <td>65K</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3</b></td>
+        <td>deepinfra</td>
+        <td>$0.32</td>
+        <td>$0.89</td>
+        <td>163K</td>
+      </tr>
+    </table>
+
+    <h2 id="cache">⚡ Cache Pricing</h2>
+    <p>
+      0 models offer cache pricing — significantly reducing costs for repeated prompts. Cache
+      pricing is typically 50-90% cheaper than standard input pricing.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Cache $/1M</th>
+        <th>Savings</th>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All pricing data is sourced from <b>first-party APIs</b> — not third-party aggregators. Prices
+      are per million tokens (input and output separately). Aggregator providers (OpenRouter,
+      Requesty, etc.) are excluded from ranking tables to avoid duplicate models. Cache pricing is
+      shown where available.
+    </p>
+    <p>Data is auto-scraped and validated with Zod schemas. Last updated: 2025-05-21.</p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare with price calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/pricing-comparison.md"
+          >Pricing Comparison Guide</a
+        >
+        — detailed analysis
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/multimodal-ai-models.html b/site/multimodal-ai-models.html
new file mode 100644
index 00000000..ebe8c7bb
--- /dev/null
+++ b/site/multimodal-ai-models.html
@@ -0,0 +1,664 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      Multimodal AI Models — 1,548 Vision, Audio & Image Models Compared | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare 1,548 multimodal AI models — vision (1,487), audio input (118), image generation (28), audio output (34), and video understanding (167). Pricing, context windows, and capabilities."
+    />
+    <meta
+      name="keywords"
+      content="multimodal AI models, vision language models, audio AI models, image generation models, video understanding AI, text to image, text to audio, multimodal LLM"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/multimodal-ai-models.html"
+    />
+    <meta
+      property="og:title"
+      content="Multimodal AI Models — 1,548 Vision, Audio & Image Models Compared"
+    />
+    <meta
+      property="og:description"
+      content="Compare 1,548 multimodal AI models — vision, audio, image generation, and video understanding. Pricing, context windows, and capabilities."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/multimodal-ai-models.html"
+    />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Multimodal AI Models — 1,548 Vision, Audio & Image Models Compared",
+        "description": "Compare 1,548 multimodal AI models — vision, audio, image generation, and video understanding.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "url": "https://i-need-token.github.io/ai-models/multimodal-ai-models.html",
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #fff;
+        --text: #1a1a2e;
+        --accent: #e17055;
+        --accent2: #6c5ce7;
+        --border: #e0e0e0;
+        --card-bg: #f8f9fa;
+        --code-bg: #f1f3f5;
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #1a1a2e;
+          --text: #e0e0e0;
+          --accent: #fab1a0;
+          --accent2: #a29bfe;
+          --border: #333;
+          --card-bg: #16213e;
+          --code-bg: #0f3460;
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        line-height: 1.7;
+      }
+      .container {
+        max-width: 1100px;
+        margin: 0 auto;
+        padding: 0 20px;
+      }
+      header {
+        background: linear-gradient(135deg, #e17055, #6c5ce7);
+        color: #fff;
+        padding: 60px 0 40px;
+        text-align: center;
+      }
+      header h1 {
+        font-size: 2.2em;
+        margin-bottom: 10px;
+      }
+      header p {
+        font-size: 1.15em;
+        opacity: 0.95;
+        max-width: 700px;
+        margin: 0 auto;
+      }
+      .stats-bar {
+        display: flex;
+        justify-content: center;
+        gap: 25px;
+        margin-top: 25px;
+        flex-wrap: wrap;
+      }
+      .stat {
+        text-align: center;
+      }
+      .stat .num {
+        font-size: 2em;
+        font-weight: 800;
+      }
+      .stat .label {
+        font-size: 0.85em;
+        opacity: 0.9;
+      }
+      h2 {
+        color: var(--accent);
+        margin: 40px 0 15px;
+        font-size: 1.6em;
+        border-bottom: 2px solid var(--accent);
+        padding-bottom: 8px;
+      }
+      h3 {
+        color: var(--accent2);
+        margin: 25px 0 10px;
+        font-size: 1.2em;
+      }
+      p,
+      li {
+        margin: 8px 0;
+      }
+      ul {
+        padding-left: 20px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 15px 0;
+        font-size: 0.9em;
+      }
+      th,
+      td {
+        border: 1px solid var(--border);
+        padding: 8px 12px;
+        text-align: left;
+      }
+      th {
+        background: var(--accent);
+        color: #fff;
+        font-weight: 600;
+      }
+      tr:nth-child(even) {
+        background: var(--card-bg);
+      }
+      td code {
+        background: var(--code-bg);
+        padding: 2px 6px;
+        border-radius: 3px;
+        font-size: 0.88em;
+      }
+      .card {
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 20px;
+        margin: 15px 0;
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #e17055, #6c5ce7);
+        color: #fff;
+        padding: 12px 28px;
+        border-radius: 6px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 10px 5px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+        transform: translateY(-1px);
+      }
+      .modality-grid {
+        display: grid;
+        grid-template-columns: repeat(auto-fill, minmax(200px, 1fr));
+        gap: 15px;
+        margin: 15px 0;
+      }
+      .modality-card {
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 15px;
+        text-align: center;
+      }
+      .modality-card .icon {
+        font-size: 2em;
+      }
+      .modality-card .count {
+        font-size: 1.5em;
+        font-weight: 800;
+        color: var(--accent);
+      }
+      .modality-card .name {
+        font-size: 0.9em;
+      }
+      footer {
+        text-align: center;
+        padding: 30px;
+        border-top: 1px solid var(--border);
+        margin-top: 40px;
+        font-size: 0.9em;
+      }
+      footer a {
+        color: var(--accent);
+      }
+      .toc {
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 20px;
+        margin: 20px 0;
+      }
+      .toc a {
+        color: var(--accent2);
+        text-decoration: none;
+      }
+      .toc a:hover {
+        text-decoration: underline;
+      }
+      .related-pages {
+        display: grid;
+        grid-template-columns: repeat(auto-fill, minmax(220px, 1fr));
+        gap: 12px;
+        margin: 20px 0;
+      }
+      .related-pages a {
+        display: block;
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        padding: 12px;
+        text-decoration: none;
+        color: var(--text);
+        font-size: 0.9em;
+      }
+      .related-pages a:hover {
+        border-color: var(--accent);
+      }
+      @media (max-width: 768px) {
+        header h1 {
+          font-size: 1.5em;
+        }
+        .stats-bar {
+          gap: 15px;
+        }
+        table {
+          font-size: 0.8em;
+        }
+        th,
+        td {
+          padding: 6px 8px;
+        }
+      }
+      @media (max-width: 480px) {
+        header {
+          padding: 30px 0 20px;
+        }
+        header h1 {
+          font-size: 1.2em;
+        }
+        .stat .num {
+          font-size: 1.5em;
+        }
+        .modality-grid {
+          grid-template-columns: repeat(2, 1fr);
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <header>
+      <div class="container">
+        <h1>🎨 Multimodal AI Models</h1>
+        <p>
+          1,548 models that see, hear, speak, and create — compared with pricing, context windows,
+          and capabilities
+        </p>
+        <div class="stats-bar">
+          <div class="stat">
+            <div class="num">1,548</div>
+            <div class="label">Multimodal Models</div>
+          </div>
+          <div class="stat">
+            <div class="num">1,487</div>
+            <div class="label">Vision</div>
+          </div>
+          <div class="stat">
+            <div class="num">118</div>
+            <div class="label">Audio Input</div>
+          </div>
+          <div class="stat">
+            <div class="num">34</div>
+            <div class="label">Audio Output</div>
+          </div>
+          <div class="stat">
+            <div class="num">28</div>
+            <div class="label">Image Output</div>
+          </div>
+          <div class="stat">
+            <div class="num">167</div>
+            <div class="label">Video Input</div>
+          </div>
+        </div>
+        <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+        <a class="cta" href="https://github.com/i-need-token/ai-models">⭐ Star on GitHub</a>
+      </div>
+    </header>
+    <div class="container">
+      <div class="toc">
+        <strong>Contents</strong>
+        <ol>
+          <li><a href="#modalities">Modality Breakdown</a></li>
+          <li><a href="#flagship">Flagship Multimodal Models</a></li>
+          <li><a href="#vision">Vision Models (Image Input)</a></li>
+          <li><a href="#audio-in">Audio Input Models</a></li>
+          <li><a href="#image-gen">Image Generation Models</a></li>
+          <li><a href="#audio-out">Audio Output Models</a></li>
+          <li><a href="#video">Video Understanding Models</a></li>
+          <li><a href="#choosing">Choosing the Right Multimodal Model</a></li>
+        </ol>
+      </div>
+
+      <h2 id="modalities">📊 Modality Breakdown</h2>
+      <div class="modality-grid">
+        <div class="modality-card">
+          <div class="icon">👁️</div>
+          <div class="count">1,487</div>
+          <div class="name">Vision (Image Input)</div>
+        </div>
+        <div class="modality-card">
+          <div class="icon">🎬</div>
+          <div class="count">167</div>
+          <div class="name">Video Input</div>
+        </div>
+        <div class="modality-card">
+          <div class="icon">🎤</div>
+          <div class="count">118</div>
+          <div class="name">Audio Input</div>
+        </div>
+        <div class="modality-card">
+          <div class="icon">📄</div>
+          <div class="count">141</div>
+          <div class="name">PDF Input</div>
+        </div>
+        <div class="modality-card">
+          <div class="icon">🖼️</div>
+          <div class="count">28</div>
+          <div class="name">Image Output</div>
+        </div>
+        <div class="modality-card">
+          <div class="icon">🔊</div>
+          <div class="count">34</div>
+          <div class="name">Audio Output</div>
+        </div>
+        <div class="modality-card">
+          <div class="icon">🎥</div>
+          <div class="count">4</div>
+          <div class="name">Video Output</div>
+        </div>
+      </div>
+
+      <h2 id="flagship">🏆 Flagship Multimodal Models</h2>
+      <p>The most capable multimodal models across all providers:</p>
+      <table>
+        <tr>
+          <th>Model</th>
+          <th>Provider</th>
+          <th>Context</th>
+          <th>Input</th>
+          <th>Output</th>
+          <th>Tool Call</th>
+          <th>Price (in/out per 1M)</th>
+        </tr>
+        <tr>
+          <td><code>gpt-4o</code></td>
+          <td>OpenAI</td>
+          <td>128K</td>
+          <td>text, image</td>
+          <td>text</td>
+          <td>✓</td>
+          <td>$2.50/$10</td>
+        </tr>
+        <tr>
+          <td><code>gpt-4.1</code></td>
+          <td>OpenAI</td>
+          <td>1M</td>
+          <td>text, image</td>
+          <td>text</td>
+          <td>✓</td>
+          <td>$2/$8</td>
+        </tr>
+        <tr>
+          <td><code>claude-sonnet-4</code></td>
+          <td>Anthropic</td>
+          <td>200K</td>
+          <td>text, image</td>
+          <td>text</td>
+          <td>✓</td>
+          <td>$3/$15</td>
+        </tr>
+        <tr>
+          <td><code>gemini-2.5-pro</code></td>
+          <td>Google</td>
+          <td>1M</td>
+          <td>text, image, audio, video</td>
+          <td>text</td>
+          <td>✓</td>
+          <td>$1.25/$10</td>
+        </tr>
+        <tr>
+          <td><code>gemini-2.5-flash</code></td>
+          <td>Google</td>
+          <td>1M</td>
+          <td>text, image, audio, video</td>
+          <td>text</td>
+          <td>✓</td>
+          <td>$0.15/$0.60</td>
+        </tr>
+        <tr>
+          <td><code>llama-4-maverick</code></td>
+          <td>Meta</td>
+          <td>1M</td>
+          <td>text, image</td>
+          <td>text</td>
+          <td>✓</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-235b-a22b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>text, image</td>
+          <td>text</td>
+          <td>✓</td>
+          <td>Varies</td>
+        </tr>
+      </table>
+
+      <h2 id="vision">👁️ Vision Models (Image Input)</h2>
+      <p>
+        1,487 models can accept images as input alongside text. These are the most common type of
+        multimodal model:
+      </p>
+      <div class="card">
+        <h3>Best Vision Models by Use Case</h3>
+        <ul>
+          <li>
+            <strong>Document analysis:</strong> Gemini 2.5 Pro (1M context, PDF + image support),
+            GPT-4.1
+          </li>
+          <li><strong>Visual Q&A:</strong> Claude Sonnet 4, GPT-4o, Llama 4 Maverick</li>
+          <li><strong>Code from screenshots:</strong> GPT-4o, Claude Sonnet 4, Gemini 2.5 Pro</li>
+          <li>
+            <strong>Medical imaging:</strong> Specialized models available through various providers
+          </li>
+          <li>
+            <strong>Free vision models:</strong> Gemma 3 (1B–27B), Qwen3 series, Llama 4 Maverick
+          </li>
+        </ul>
+      </div>
+      <p>→ <a href="best-ai-models-for-vision.html">See all 1,487 vision models compared</a></p>
+
+      <h2 id="audio-in">🎤 Audio Input Models</h2>
+      <p>
+        118 models can process audio input — for transcription, voice analysis, and audio
+        understanding:
+      </p>
+      <table>
+        <tr>
+          <th>Model</th>
+          <th>Provider</th>
+          <th>Audio Capabilities</th>
+          <th>Context</th>
+        </tr>
+        <tr>
+          <td><code>gemini-2.5-pro</code></td>
+          <td>Google</td>
+          <td>Audio understanding + transcription</td>
+          <td>1M</td>
+        </tr>
+        <tr>
+          <td><code>gemini-2.5-flash</code></td>
+          <td>Google</td>
+          <td>Audio understanding + transcription</td>
+          <td>1M</td>
+        </tr>
+        <tr>
+          <td><code>gpt-4o-audio-preview</code></td>
+          <td>OpenAI</td>
+          <td>Audio input + output</td>
+          <td>128K</td>
+        </tr>
+        <tr>
+          <td><code>claude-sonnet-4</code></td>
+          <td>Anthropic</td>
+          <td>Audio transcription</td>
+          <td>200K</td>
+        </tr>
+      </table>
+
+      <h2 id="image-gen">🖼️ Image Generation Models</h2>
+      <p>
+        28 models can generate images from text descriptions. This is a rapidly growing category:
+      </p>
+      <table>
+        <tr>
+          <th>Model</th>
+          <th>Provider</th>
+          <th>Capabilities</th>
+        </tr>
+        <tr>
+          <td><code>gpt-image-1</code></td>
+          <td>OpenAI</td>
+          <td>Text-to-image, image editing</td>
+        </tr>
+        <tr>
+          <td><code>dall-e-3</code></td>
+          <td>OpenAI</td>
+          <td>Text-to-image generation</td>
+        </tr>
+        <tr>
+          <td><code>flux-1.1-pro</code></td>
+          <td>Black Forest Labs</td>
+          <td>High-quality text-to-image</td>
+        </tr>
+        <tr>
+          <td><code>stable-diffusion-3.5</code></td>
+          <td>Stability AI</td>
+          <td>Open-weight text-to-image</td>
+        </tr>
+      </table>
+      <p>
+        → <a href="best-ai-models-for-image-generation.html">See all 28 image generation models</a>
+      </p>
+
+      <h2 id="audio-out">🔊 Audio Output Models</h2>
+      <p>
+        34 models can generate audio output — for text-to-speech, voice cloning, and audio
+        generation:
+      </p>
+      <div class="card">
+        <h3>Key Audio Output Models</h3>
+        <ul>
+          <li>
+            <strong>GPT-4o Audio Preview:</strong> Natural conversation with voice input and output
+          </li>
+          <li><strong>Gemini 2.5 Flash:</strong> Audio understanding with text response</li>
+          <li>
+            <strong>Specialized TTS models:</strong> Available through various providers for
+            production voice applications
+          </li>
+        </ul>
+      </div>
+
+      <h2 id="video">🎬 Video Understanding Models</h2>
+      <p>
+        167 models can process video input — for video analysis, summarization, and content
+        understanding:
+      </p>
+      <div class="card">
+        <h3>Top Video Understanding Models</h3>
+        <ul>
+          <li>
+            <strong>Gemini 2.5 Pro/Flash:</strong> Native video input with 1M context, process up to
+            1 hour of video
+          </li>
+          <li><strong>GPT-4o:</strong> Video frame extraction and analysis</li>
+          <li><strong>Qwen3 series:</strong> Video understanding across model sizes</li>
+        </ul>
+      </div>
+
+      <h2 id="choosing">🤔 Choosing the Right Multimodal Model</h2>
+      <div class="card">
+        <h3>Decision Framework</h3>
+        <ul>
+          <li>
+            <strong>Image understanding only?</strong> → <code>gemma-3-27b-it</code> (free) or
+            <code>gpt-4o</code>
+          </li>
+          <li>
+            <strong>Need audio + vision?</strong> → <code>gemini-2.5-flash</code> (cheapest
+            multimodal) or <code>gemini-2.5-pro</code>
+          </li>
+          <li>
+            <strong>Generate images?</strong> → <code>gpt-image-1</code> or
+            <code>flux-1.1-pro</code>
+          </li>
+          <li>
+            <strong>Video analysis?</strong> → <code>gemini-2.5-pro</code> (best video
+            understanding)
+          </li>
+          <li>
+            <strong>Need tool calling + vision?</strong> → <code>llama-4-maverick</code> or
+            <code>claude-sonnet-4</code>
+          </li>
+          <li>
+            <strong>Budget-conscious?</strong> → <code>gemini-2.5-flash</code> ($0.15/$0.60 per 1M
+            tokens)
+          </li>
+          <li>
+            <strong>Need free API?</strong> → <code>gemma-3-27b-it</code> (Google, free) or
+            <code>qwen3-32b</code> (Alibaba, free)
+          </li>
+        </ul>
+      </div>
+
+      <h2>🔗 Related Comparisons</h2>
+      <div class="related-pages">
+        <a href="best-ai-models-for-vision.html">👁️ Best AI Models for Vision (1,487 models)</a>
+        <a href="best-ai-models-for-image-generation.html"
+          >🖼️ Image Generation Models (28 models)</a
+        >
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="free-ai-models.html">🆓 Free AI Models (81 models)</a>
+        <a href="reasoning-models-comparison.html">🧠 Reasoning Models (1,306 models)</a>
+        <a href="tool-calling-models-comparison.html">🔧 Tool Calling Models (2,350 models)</a>
+        <a href="context-window-comparison.html">📏 Context Window Comparison</a>
+        <a href="cheapest-ai-models.html">💰 Cheapest AI Models</a>
+        <a href="best-ai-models.html">⭐ Best AI Models in 2025</a>
+        <a href="ai-model-pricing-calculator.html">🧮 AI Model Pricing Calculator</a>
+        <a href="openai-alternatives.html">🔄 OpenAI Alternatives</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+      </div>
+    </div>
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 95
+        providers, 4,587+ models. Updated automatically.
+      </p>
+      <p>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> ·
+        <a href="https://github.com/i-need-token/ai-models">GitHub</a> ·
+        <a href="best-ai-models.html">Best AI Models</a> ·
+        <a href="free-ai-models.html">Free Models</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/open-source-ai-models.html b/site/open-source-ai-models.html
new file mode 100644
index 00000000..342d6f0c
--- /dev/null
+++ b/site/open-source-ai-models.html
@@ -0,0 +1,849 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>Open Source AI Models — 527 Open Weight LLMs Compared | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Compare 527 open source AI models with open weights. Free LLMs, tool-calling, reasoning, vision, and large context models. Pricing, context windows, and capabilities for every open-weight model."
+    />
+    <meta
+      name="keywords"
+      content="open source AI models, open weight LLMs, open source large language models, free AI models, Llama, Qwen, DeepSeek, Mistral, Gemma, Phi"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/open-source-ai-models.html"
+    />
+    <meta property="og:title" content="Open Source AI Models — 527 Open Weight LLMs Compared" />
+    <meta
+      property="og:description"
+      content="Compare 527 open source AI models with open weights. Free LLMs, tool-calling, reasoning, vision, and large context models."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/open-source-ai-models.html"
+    />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Open Source AI Models — 527 Open Weight LLMs Compared",
+        "description": "Compare 527 open source AI models with open weights. Free LLMs, tool-calling, reasoning, vision, and large context models.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "url": "https://i-need-token.github.io/ai-models/open-source-ai-models.html",
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #fff;
+        --text: #1a1a2e;
+        --accent: #6c5ce7;
+        --accent2: #00b894;
+        --border: #e0e0e0;
+        --card-bg: #f8f9fa;
+        --code-bg: #f1f3f5;
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #1a1a2e;
+          --text: #e0e0e0;
+          --accent: #a29bfe;
+          --accent2: #55efc4;
+          --border: #333;
+          --card-bg: #16213e;
+          --code-bg: #0f3460;
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        line-height: 1.7;
+      }
+      .container {
+        max-width: 1100px;
+        margin: 0 auto;
+        padding: 0 20px;
+      }
+      header {
+        background: linear-gradient(135deg, #6c5ce7, #00b894);
+        color: #fff;
+        padding: 60px 0 40px;
+        text-align: center;
+      }
+      header h1 {
+        font-size: 2.2em;
+        margin-bottom: 10px;
+      }
+      header p {
+        font-size: 1.15em;
+        opacity: 0.95;
+        max-width: 700px;
+        margin: 0 auto;
+      }
+      .stats-bar {
+        display: flex;
+        justify-content: center;
+        gap: 30px;
+        margin-top: 25px;
+        flex-wrap: wrap;
+      }
+      .stat {
+        text-align: center;
+      }
+      .stat .num {
+        font-size: 2em;
+        font-weight: 800;
+      }
+      .stat .label {
+        font-size: 0.85em;
+        opacity: 0.9;
+      }
+      h2 {
+        color: var(--accent);
+        margin: 40px 0 15px;
+        font-size: 1.6em;
+        border-bottom: 2px solid var(--accent);
+        padding-bottom: 8px;
+      }
+      h3 {
+        color: var(--accent2);
+        margin: 25px 0 10px;
+        font-size: 1.2em;
+      }
+      p,
+      li {
+        margin: 8px 0;
+      }
+      ul {
+        padding-left: 20px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 15px 0;
+        font-size: 0.9em;
+      }
+      th,
+      td {
+        border: 1px solid var(--border);
+        padding: 8px 12px;
+        text-align: left;
+      }
+      th {
+        background: var(--accent);
+        color: #fff;
+        font-weight: 600;
+      }
+      tr:nth-child(even) {
+        background: var(--card-bg);
+      }
+      td code {
+        background: var(--code-bg);
+        padding: 2px 6px;
+        border-radius: 3px;
+        font-size: 0.88em;
+      }
+      .card {
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 20px;
+        margin: 15px 0;
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #6c5ce7, #00b894);
+        color: #fff;
+        padding: 12px 28px;
+        border-radius: 6px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 10px 5px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+        transform: translateY(-1px);
+      }
+      .badge {
+        display: inline-block;
+        background: var(--accent2);
+        color: #fff;
+        padding: 2px 8px;
+        border-radius: 10px;
+        font-size: 0.78em;
+        font-weight: 600;
+      }
+      .badge-free {
+        background: #00b894;
+      }
+      .badge-tc {
+        background: #6c5ce7;
+      }
+      .badge-reason {
+        background: #e17055;
+      }
+      .badge-vision {
+        background: #0984e3;
+      }
+      footer {
+        text-align: center;
+        padding: 30px;
+        border-top: 1px solid var(--border);
+        margin-top: 40px;
+        font-size: 0.9em;
+      }
+      footer a {
+        color: var(--accent);
+      }
+      .toc {
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 20px;
+        margin: 20px 0;
+      }
+      .toc a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      .toc a:hover {
+        text-decoration: underline;
+      }
+      .related-pages {
+        display: grid;
+        grid-template-columns: repeat(auto-fill, minmax(220px, 1fr));
+        gap: 12px;
+        margin: 20px 0;
+      }
+      .related-pages a {
+        display: block;
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        padding: 12px;
+        text-decoration: none;
+        color: var(--text);
+        font-size: 0.9em;
+      }
+      .related-pages a:hover {
+        border-color: var(--accent);
+      }
+      @media (max-width: 768px) {
+        header h1 {
+          font-size: 1.5em;
+        }
+        .stats-bar {
+          gap: 15px;
+        }
+        table {
+          font-size: 0.8em;
+        }
+        th,
+        td {
+          padding: 6px 8px;
+        }
+      }
+      @media (max-width: 480px) {
+        header {
+          padding: 30px 0 20px;
+        }
+        header h1 {
+          font-size: 1.2em;
+        }
+        .stat .num {
+          font-size: 1.5em;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <header>
+      <div class="container">
+        <h1>🔓 Open Source AI Models</h1>
+        <p>
+          527 open-weight LLMs compared — pricing, context windows, tool calling, reasoning, and
+          vision capabilities
+        </p>
+        <div class="stats-bar">
+          <div class="stat">
+            <div class="num">527</div>
+            <div class="label">Open Weight Models</div>
+          </div>
+          <div class="stat">
+            <div class="num">81</div>
+            <div class="label">Free to Use</div>
+          </div>
+          <div class="stat">
+            <div class="num">375</div>
+            <div class="label">Tool Calling</div>
+          </div>
+          <div class="stat">
+            <div class="num">231</div>
+            <div class="label">Reasoning</div>
+          </div>
+          <div class="stat">
+            <div class="num">269</div>
+            <div class="label">Vision</div>
+          </div>
+        </div>
+        <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+        <a class="cta" href="https://github.com/i-need-token/ai-models">⭐ Star on GitHub</a>
+      </div>
+    </header>
+    <div class="container">
+      <div class="toc">
+        <strong>Contents</strong>
+        <ol>
+          <li><a href="#flagship">Flagship Open-Weight Models</a></li>
+          <li><a href="#free">Free Open-Source AI Models</a></li>
+          <li><a href="#tool-calling">Open-Weight Tool-Calling Models</a></li>
+          <li><a href="#reasoning">Open-Weight Reasoning Models</a></li>
+          <li><a href="#vision">Open-Weight Vision Models</a></li>
+          <li><a href="#large-context">Open-Weight Large Context Models</a></li>
+          <li><a href="#choosing">How to Choose an Open-Source Model</a></li>
+        </ol>
+      </div>
+
+      <h2 id="flagship">🏆 Flagship Open-Weight Models</h2>
+      <p>The most capable open-weight models available today, from leading AI labs:</p>
+      <table>
+        <tr>
+          <th>Model</th>
+          <th>Provider</th>
+          <th>Context</th>
+          <th>Tool Call</th>
+          <th>Reasoning</th>
+          <th>Price (in/out per 1M)</th>
+        </tr>
+        <tr>
+          <td><code>llama-4-maverick</code></td>
+          <td>Meta</td>
+          <td>1M</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>llama-4-scout</code></td>
+          <td>Meta</td>
+          <td>10M</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>deepseek-r1</code></td>
+          <td>DeepSeek</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>deepseek-v3</code></td>
+          <td>DeepSeek</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-235b-a22b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-32b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>llama-3.3-70b-instruct</code></td>
+          <td>Meta</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>gemma-3-27b-it</code></td>
+          <td>Google</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Free</td>
+        </tr>
+        <tr>
+          <td><code>phi-4</code></td>
+          <td>Microsoft</td>
+          <td>16K</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>command-a</code></td>
+          <td>Cohere</td>
+          <td>256K</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Varies</td>
+        </tr>
+        <tr>
+          <td><code>mistral-large-2411</code></td>
+          <td>Mistral</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+          <td>Varies</td>
+        </tr>
+      </table>
+
+      <h2 id="free">🆓 Free Open-Source AI Models</h2>
+      <p>
+        81 open-weight models you can use for free through their provider APIs. These are ideal for
+        prototyping, testing, and learning:
+      </p>
+      <table>
+        <tr>
+          <th>Model</th>
+          <th>Provider</th>
+          <th>Context</th>
+          <th>Tool Call</th>
+          <th>Reasoning</th>
+        </tr>
+        <tr>
+          <td><code>gemma-3-27b-it</code></td>
+          <td>Google</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>gemma-3-12b-it</code></td>
+          <td>Google</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>gemma-3-4b-it</code></td>
+          <td>Google</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>gemma-3-1b-it</code></td>
+          <td>Google</td>
+          <td>128K</td>
+          <td>✗</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-235b-a22b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-30b-a3b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-32b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-14b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-8b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-4b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-1.7b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-0.6b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>llama-4-maverick</code></td>
+          <td>Meta</td>
+          <td>1M</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>llama-4-scout</code></td>
+          <td>Meta</td>
+          <td>10M</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>llama-3.3-70b-instruct</code></td>
+          <td>Meta</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+      </table>
+      <p>
+        → <a href="free-ai-models.html">See all 81 free AI models</a> (including non-open-weight)
+      </p>
+
+      <h2 id="tool-calling">🔧 Open-Weight Tool-Calling Models</h2>
+      <p>
+        375 open-weight models support tool/function calling — essential for AI agents and agentic
+        workflows:
+      </p>
+      <div class="card">
+        <h3>Top Open-Weight Tool-Calling Models</h3>
+        <ul>
+          <li>
+            <strong>Llama 4 Maverick/Scout</strong> — Meta's latest with native tool calling, 1M–10M
+            context
+          </li>
+          <li>
+            <strong>Qwen3 series</strong> — All sizes support tool calling + reasoning (0.6B to
+            235B)
+          </li>
+          <li><strong>DeepSeek R1/V3</strong> — Strong tool calling with 128K context</li>
+          <li><strong>Gemma 3 (1B–27B)</strong> — Google's lightweight models with tool calling</li>
+          <li>
+            <strong>Command A</strong> — Cohere's 111B model optimized for enterprise tool use
+          </li>
+          <li>
+            <strong>Mistral Large</strong> — 123B parameter model with robust function calling
+          </li>
+        </ul>
+      </div>
+      <p>→ <a href="tool-calling-models-comparison.html">See all 2,350 tool-calling models</a></p>
+
+      <h2 id="reasoning">🧠 Open-Weight Reasoning Models</h2>
+      <p>
+        231 open-weight models with reasoning capabilities — these can "think step by step" for
+        complex tasks:
+      </p>
+      <table>
+        <tr>
+          <th>Model</th>
+          <th>Provider</th>
+          <th>Context</th>
+          <th>Tool Call</th>
+          <th>Key Strength</th>
+        </tr>
+        <tr>
+          <td><code>deepseek-r1</code></td>
+          <td>DeepSeek</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>Best open-weight reasoning, rivals o1</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-235b-a22b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>MoE architecture, thinking mode</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-32b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>Dense reasoning, strong benchmarks</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-30b-a3b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>Lightweight MoE reasoning</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-14b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>Mid-size reasoning model</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-8b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>Small but capable reasoning</td>
+        </tr>
+      </table>
+      <p>→ <a href="reasoning-models-comparison.html">See all 1,306 reasoning models</a></p>
+
+      <h2 id="vision">👁️ Open-Weight Vision Models</h2>
+      <p>
+        269 open-weight models can process images alongside text — useful for document analysis,
+        visual Q&A, and multimodal applications:
+      </p>
+      <div class="card">
+        <h3>Top Open-Weight Vision Models</h3>
+        <ul>
+          <li>
+            <strong>Llama 4 Maverick/Scout</strong> — Native multimodal with 1M–10M context, process
+            images + text
+          </li>
+          <li><strong>Qwen3 series</strong> — Vision-capable across all sizes</li>
+          <li><strong>Gemma 3 (1B–27B)</strong> — Google's vision-language models, free to use</li>
+          <li><strong>DeepSeek R1/V3</strong> — Reasoning + vision capabilities</li>
+          <li><strong>Command A</strong> — Enterprise-grade vision + tool calling</li>
+        </ul>
+      </div>
+      <p>→ <a href="best-ai-models-for-vision.html">See all 1,487 vision models</a></p>
+
+      <h2 id="large-context">📏 Open-Weight Large Context Models</h2>
+      <p>
+        Open-weight models with the largest context windows — essential for processing long
+        documents, codebases, and multi-turn conversations:
+      </p>
+      <table>
+        <tr>
+          <th>Model</th>
+          <th>Provider</th>
+          <th>Context Window</th>
+          <th>Tool Call</th>
+          <th>Reasoning</th>
+        </tr>
+        <tr>
+          <td><code>llama-4-scout</code></td>
+          <td>Meta</td>
+          <td>10M</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>llama-4-maverick</code></td>
+          <td>Meta</td>
+          <td>1M</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>command-a</code></td>
+          <td>Cohere</td>
+          <td>256K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>deepseek-r1</code></td>
+          <td>DeepSeek</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>deepseek-v3</code></td>
+          <td>DeepSeek</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>qwen3-235b-a22b</code></td>
+          <td>Alibaba</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✓</td>
+        </tr>
+        <tr>
+          <td><code>llama-3.3-70b-instruct</code></td>
+          <td>Meta</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>gemma-3-27b-it</code></td>
+          <td>Google</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+        <tr>
+          <td><code>mistral-large-2411</code></td>
+          <td>Mistral</td>
+          <td>128K</td>
+          <td>✓</td>
+          <td>✗</td>
+        </tr>
+      </table>
+      <p>
+        → <a href="context-window-comparison.html">See all models with context window comparison</a>
+      </p>
+
+      <h2 id="choosing">🤔 How to Choose an Open-Source AI Model</h2>
+      <div class="card">
+        <h3>Decision Framework</h3>
+        <ul>
+          <li>
+            <strong>Need free API access?</strong> → Start with <code>gemma-3-27b-it</code> (Google,
+            free) or <code>qwen3-32b</code> (Alibaba, free)
+          </li>
+          <li>
+            <strong>Building AI agents?</strong> → <code>llama-4-maverick</code> (1M context + tool
+            calling) or <code>deepseek-r1</code> (reasoning + tools)
+          </li>
+          <li>
+            <strong>Processing long documents?</strong> → <code>llama-4-scout</code> (10M context)
+            or <code>llama-4-maverick</code> (1M context)
+          </li>
+          <li>
+            <strong>Complex reasoning tasks?</strong> → <code>deepseek-r1</code> (best open-weight
+            reasoning) or <code>qwen3-235b-a22b</code>
+          </li>
+          <li>
+            <strong>Vision/image understanding?</strong> → <code>llama-4-maverick</code> or
+            <code>gemma-3-27b-it</code>
+          </li>
+          <li>
+            <strong>Edge/mobile deployment?</strong> → <code>qwen3-0.6b</code> or
+            <code>gemma-3-1b-it</code> (smallest open-weight)
+          </li>
+          <li>
+            <strong>Enterprise tool use?</strong> → <code>command-a</code> (256K context, optimized
+            for RAG + tools)
+          </li>
+        </ul>
+      </div>
+      <div class="card">
+        <h3>Open Weights vs. Proprietary Models</h3>
+        <table>
+          <tr>
+            <th>Aspect</th>
+            <th>Open Weights</th>
+            <th>Proprietary</th>
+          </tr>
+          <tr>
+            <td>Self-hosting</td>
+            <td>✓ Run on your own hardware</td>
+            <td>✗ Cloud API only</td>
+          </tr>
+          <tr>
+            <td>Data privacy</td>
+            <td>✓ Full control over data</td>
+            <td>✗ Data sent to provider</td>
+          </tr>
+          <tr>
+            <td>Customization</td>
+            <td>✓ Fine-tune on your data</td>
+            <td>✗ Limited (prompt-based)</td>
+          </tr>
+          <tr>
+            <td>Cost at scale</td>
+            <td>✓ Fixed infra cost</td>
+            <td>✗ Per-token pricing</td>
+          </tr>
+          <tr>
+            <td>Latest capabilities</td>
+            <td>~3–6 months behind</td>
+            <td>✓ Cutting-edge</td>
+          </tr>
+          <tr>
+            <td>Convenience</td>
+            <td>Requires infra setup</td>
+            <td>✓ Instant API access</td>
+          </tr>
+        </table>
+      </div>
+
+      <h2>🔗 Related Comparisons</h2>
+      <div class="related-pages">
+        <a href="free-ai-models.html">🆓 Free AI Models (81 models)</a>
+        <a href="reasoning-models-comparison.html">🧠 Reasoning Models (1,306 models)</a>
+        <a href="tool-calling-models-comparison.html">🔧 Tool Calling Models (2,350 models)</a>
+        <a href="best-ai-models-for-vision.html">👁️ Vision Models (1,487 models)</a>
+        <a href="context-window-comparison.html">📏 Context Window Comparison</a>
+        <a href="cheapest-ai-models.html">💰 Cheapest AI Models</a>
+        <a href="best-ai-models-for-agents.html">🤖 Best AI Models for Agents</a>
+        <a href="llm-pricing.html">💵 LLM Pricing Comparison</a>
+        <a href="openai-alternatives.html">🔄 OpenAI Alternatives</a>
+        <a href="best-ai-models.html">⭐ Best AI Models in 2025</a>
+        <a href="ai-model-pricing-calculator.html">🧮 AI Model Pricing Calculator</a>
+        <a href="small-language-models.html">Small Language Models</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+      </div>
+    </div>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 95
+        providers, 4,587+ models. Updated automatically.
+      </p>
+      <p>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> ·
+        <a href="https://github.com/i-need-token/ai-models">GitHub</a> ·
+        <a href="best-ai-models.html">Best AI Models</a> ·
+        <a href="free-ai-models.html">Free Models</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/openai-alternatives.html b/site/openai-alternatives.html
new file mode 100644
index 00000000..77f5a716
--- /dev/null
+++ b/site/openai-alternatives.html
@@ -0,0 +1,2851 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>OpenAI Alternatives — 87 AI Providers Compared (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Compare 87 OpenAI alternatives with real pricing, context windows, and capabilities. Find cheaper, faster, or more capable models than GPT-4 and ChatGPT."
+    />
+    <meta
+      name="keywords"
+      content="OpenAI alternative, ChatGPT alternative, GPT-4 alternative, alternative to OpenAI, AI model comparison, cheaper than GPT-4"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+    />
+    <meta property="og:title" content="OpenAI Alternatives — 87 AI Providers Compared (2025)" />
+    <meta
+      property="og:description"
+      content="Compare 87 OpenAI alternatives. Find cheaper, faster, or more capable models than GPT-4."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta name="twitter:title" content="OpenAI Alternatives — 87 AI Providers Compared (2025)" />
+    <meta
+      name="twitter:description"
+      content="Compare 87 OpenAI alternatives. Find cheaper, faster, or more capable models."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      h3 {
+        font-size: 1.1rem;
+        margin-top: 24px;
+        color: var(--orange);
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cheapest {
+        color: var(--green);
+        font-weight: 600;
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .nav {
+        display: flex;
+        gap: 16px;
+        flex-wrap: wrap;
+        margin: 16px 0;
+      }
+      .nav a {
+        color: var(--accent);
+        text-decoration: none;
+        padding: 4px 12px;
+        border: 1px solid var(--border);
+        border-radius: 6px;
+        font-size: 13px;
+      }
+      .nav a:hover {
+        border-color: var(--accent);
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .provider-card {
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 12px 0;
+      }
+      .provider-card h3 {
+        margin-top: 0;
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "OpenAI Alternatives — 87 AI Providers Compared (2025)",
+        "description": "Compare 87 OpenAI alternatives with real pricing, context windows, and capabilities.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>🔄 OpenAI Alternatives — 87 AI Providers Compared</h1>
+    <p>
+      Looking for alternatives to OpenAI? Compare <b>87</b> AI providers with <b>4,587</b> models.
+      Real pricing, real capabilities, first-party data.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>87</b><small>Providers</small></div>
+      <div class="stat"><b>4,587</b><small>Models</small></div>
+      <div class="stat"><b>81</b><small>Free Models</small></div>
+      <div class="stat"><b>2,350</b><small>Tool Calling</small></div>
+      <div class="stat"><b>527</b><small>Open Weights</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 Why consider alternatives?</strong> OpenAI is great, but many providers offer
+      cheaper pricing, larger context windows, open weights, or specialized capabilities. This page
+      helps you find the right model for your needs.
+    </div>
+
+    <div class="nav">
+      <a href="#price-comparison">Price Comparison</a>
+      <a href="#anthropic">Anthropic (Claude)</a>
+      <a href="#google">Google (Gemini)</a>
+      <a href="#meta">Meta (Llama)</a>
+      <a href="#deepseek">DeepSeek</a>
+      <a href="#mistral">Mistral</a>
+      <a href="#free">Free Alternatives</a>
+      <a href="#open-weights">Open Weights</a>
+    </div>
+
+    <h2 id="price-comparison">💰 Price Comparison: OpenAI vs Alternatives</h2>
+    <p>How do alternative providers compare on price? All prices per million tokens.</p>
+    <table>
+      <tr>
+        <th>Provider</th>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td>OpenAI</td>
+        <td><b>gpt-4.1</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>OpenAI</td>
+        <td><b>gpt-4o</b></td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>OpenAI</td>
+        <td><b>gpt-4o-mini</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td>Google</td>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>Google</td>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>DeepSeek</td>
+        <td><b>deepseek-r1</b></td>
+        <td>$1.35</td>
+        <td>$5.4</td>
+        <td>65K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>DeepSeek</td>
+        <td><b>deepseek-v3</b></td>
+        <td>$0.32</td>
+        <td>$0.89</td>
+        <td>163K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td>Meta</td>
+        <td><b>llama-4-maverick</b></td>
+        <td>$0.25</td>
+        <td>$0.87</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="anthropic">🟣 Anthropic (Claude)</h2>
+    <p>
+      Anthropic's Claude models are known for superior reasoning, safety, and long context windows.
+      Claude is a strong alternative for complex tasks, coding, and analysis.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>claude-haiku-4-5</b></td>
+        <td>$1</td>
+        <td>$5</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-haiku-4-5</b></td>
+        <td>$1</td>
+        <td>$5</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-haiku-4-5</b></td>
+        <td>$1</td>
+        <td>$5</td>
+        <td>200K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-haiku-4-5</b></td>
+        <td>$1</td>
+        <td>$5</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-0</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-5</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-6</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-sonnet-4-5</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-sonnet-4</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-6</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-5</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-6</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4</b></td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-5</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-6</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-7</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-opus-4-5</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-7</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-5</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-6</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-7</b></td>
+        <td>$5</td>
+        <td>$25</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-5</b></td>
+        <td>$6.25</td>
+        <td>$31.25</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-0</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-1</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>databricks-claude-opus-4-1</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-1</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4</b></td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-6-fast</b></td>
+        <td>$30</td>
+        <td>$150</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-7-fast</b></td>
+        <td>$30</td>
+        <td>$150</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="google">🔵 Google (Gemini)</h2>
+    <p>
+      Google's Gemini models offer multimodal capabilities (text, image, audio, video) with
+      competitive pricing and massive context windows.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>$0.0375</td>
+        <td>$0.15</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash-lite</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2-0-flash-lite</b></td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash-lite</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2-5-flash-lite</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>$0.15</td>
+        <td>$3.5</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2-0-flash</b></td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-3-1-flash-lite</b></td>
+        <td>$0.25</td>
+        <td>$1.5</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-flash-lite</b></td>
+        <td>$0.25</td>
+        <td>$1.5</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-1-flash-lite</b></td>
+        <td>$0.25</td>
+        <td>$1.5</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-2-5-flash</b></td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2-5-flash</b></td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-flash</b></td>
+        <td>$0.5</td>
+        <td>$3</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-3-flash</b></td>
+        <td>$0.63</td>
+        <td>$3.75</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-2-5-pro</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-pro</b></td>
+        <td>$1.25</td>
+        <td>$5</td>
+        <td>2M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2-5-pro</b></td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-3.1-pro</b></td>
+        <td>$2</td>
+        <td>$12</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-3-pro</b></td>
+        <td>$2</td>
+        <td>$12</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>databricks-gemini-3-1-pro</b></td>
+        <td>$2.5</td>
+        <td>$15</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>chirp-3.0-HD</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-12b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-1b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-27b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3-4b-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3n-E2B-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemma-3n-E4B-it</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-3.0-fast-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-3.0-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-4.0-fast-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>imagen-4.0-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>lyria-2.0</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>veo-2.0-generate</b></td>
+        <td>$?</td>
+        <td>$?</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="meta">🦙 Meta (Llama)</h2>
+    <p>
+      Meta's Llama models are open-weight, meaning you can download and run them locally. Great for
+      privacy-sensitive applications and cost optimization.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+        <th>Open Weights</th>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout</b></td>
+        <td>meta</td>
+        <td>10M</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick-17b-128e-instruct-fp8</b></td>
+        <td>deepinfra</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick</b></td>
+        <td>digitalocean</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--Llama-4-Maverick-17B-128E-Instruct-FP8</b></td>
+        <td>gmicloud</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick</b></td>
+        <td>google-vertex</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout</b></td>
+        <td>google-vertex</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--Llama-4-Maverick-17B-128E-Instruct-FP8</b></td>
+        <td>klusterai</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--llama-4-maverick-17b-128e-instruct-fp8</b></td>
+        <td>novitaai</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick</b></td>
+        <td>meta</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>cloudflare</td>
+        <td>327K</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>deepinfra</td>
+        <td>327K</td>
+        <td></td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama--Llama-4-Scout-17B-16E-Instruct</b></td>
+        <td>gmicloud</td>
+        <td>327K</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout-17b-16e-instruct</b></td>
+        <td>vultr</td>
+        <td>327K</td>
+        <td>✅</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="deepseek">🔮 DeepSeek</h2>
+    <p>
+      DeepSeek offers high-performance reasoning and chat models at significantly lower prices than
+      OpenAI. DeepSeek-R1 rivals o1 on reasoning benchmarks.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr-2</b></td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr</b></td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>8K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-0528-qwen3-8b</b></td>
+        <td>$0.06</td>
+        <td>$0.09</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1-Distill-Qwen-7B</b></td>
+        <td>$0.1</td>
+        <td>$0.2</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.126</td>
+        <td>$0.252</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-chat</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-reasoner</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1-Distill-Llama-8B</b></td>
+        <td>$0.14</td>
+        <td>$0.39</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-distill-qwen-14b</b></td>
+        <td>$0.15</td>
+        <td>$0.15</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-4-flash</b></td>
+        <td>$0.182</td>
+        <td>$0.364</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3-0324</b></td>
+        <td>$0.2</td>
+        <td>$0.77</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1-Distill-Qwen-14B</b></td>
+        <td>$0.2</td>
+        <td>$0.2</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--DeepSeek-R1</b></td>
+        <td>$0.2</td>
+        <td>$0.8</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--DeepSeek-V3.1</b></td>
+        <td>$0.2</td>
+        <td>$0.8</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.1</b></td>
+        <td>$0.21</td>
+        <td>$0.79</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-ocr-2</b></td>
+        <td>$0.216</td>
+        <td>$0.216</td>
+        <td>8K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1-Distill-Llama-70B</b></td>
+        <td>$0.25</td>
+        <td>$0.75</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.2</b></td>
+        <td>$0.252</td>
+        <td>$0.378</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.2</b></td>
+        <td>$0.26</td>
+        <td>$0.38</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.2</b></td>
+        <td>$0.269</td>
+        <td>$0.4</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.1-terminus</b></td>
+        <td>$0.27</td>
+        <td>$0.95</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3.1-Terminus</b></td>
+        <td>$0.27</td>
+        <td>$1</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3.1</b></td>
+        <td>$0.27</td>
+        <td>$1</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3.2-Exp</b></td>
+        <td>$0.27</td>
+        <td>$0.41</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3-0324</b></td>
+        <td>$0.27</td>
+        <td>$1.12</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.1-terminus</b></td>
+        <td>$0.27</td>
+        <td>$1</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.1</b></td>
+        <td>$0.27</td>
+        <td>$1</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.2-exp</b></td>
+        <td>$0.27</td>
+        <td>$0.41</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.1-nex-n1</b></td>
+        <td>$0.27</td>
+        <td>$1</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.1-terminus</b></td>
+        <td>$0.27</td>
+        <td>$1</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.2-exp</b></td>
+        <td>$0.27</td>
+        <td>$0.41</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.2</b></td>
+        <td>$0.27</td>
+        <td>$0.42</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3.2-TEE</b></td>
+        <td>$0.28</td>
+        <td>$0.42</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3-0324</b></td>
+        <td>$0.28</td>
+        <td>$0.88</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3-0324</b></td>
+        <td>$0.28</td>
+        <td>$1.14</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.1-release</b></td>
+        <td>$0.294</td>
+        <td>$0.441</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.1</b></td>
+        <td>$0.294</td>
+        <td>$0.441</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>DeepSeek-V3.2</b></td>
+        <td>$0.3</td>
+        <td>$0.45</td>
+        <td>160K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-distill-qwen-32b</b></td>
+        <td>$0.3</td>
+        <td>$0.3</td>
+        <td>64K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3</b></td>
+        <td>$0.32</td>
+        <td>$0.89</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.1-terminus</b></td>
+        <td>$0.364</td>
+        <td>$0.546</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.2-exp-non-thinking</b></td>
+        <td>$0.364</td>
+        <td>$0.546</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek‑v3.2‑exp-thinking</b></td>
+        <td>$0.364</td>
+        <td>$0.546</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.2-speciale</b></td>
+        <td>$0.36855</td>
+        <td>$0.56186</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3--fp-8</b></td>
+        <td>$0.4</td>
+        <td>$1.2</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3-turbo</b></td>
+        <td>$0.4</td>
+        <td>$1.3</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$0.435</td>
+        <td>$0.87</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-qwen-32b</b></td>
+        <td>$0.497</td>
+        <td>$4.881</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3-1</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-0528</b></td>
+        <td>$0.5</td>
+        <td>$2.15</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-3.2</b></td>
+        <td>$0.5</td>
+        <td>$1.6</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3.2</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-Prover-V2-671B</b></td>
+        <td>$0.5</td>
+        <td>$2.18</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1-Distill-Qwen-32B</b></td>
+        <td>$0.5</td>
+        <td>$0.9</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1</b></td>
+        <td>$0.5</td>
+        <td>$2.18</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-0528--fp-8</b></td>
+        <td>$0.5</td>
+        <td>$2.15</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-0528</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-8b</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-qwen-1.5b</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>32K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-qwen-14b</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-qwen-32b</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-qwen-7b</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>32K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v32-exp</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v32-speciale</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v32</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3-2</b></td>
+        <td>$0.56</td>
+        <td>$1.68</td>
+        <td>65K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3-1</b></td>
+        <td>$0.6</td>
+        <td>$1.7</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V3.1</b></td>
+        <td>$0.6</td>
+        <td>$1.7</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3-2</b></td>
+        <td>$0.62</td>
+        <td>$1.85</td>
+        <td>65K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>$0.7</td>
+        <td>$0.8</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1-0528</b></td>
+        <td>$0.7</td>
+        <td>$2.3</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-prover-v2-671b</b></td>
+        <td>$0.7</td>
+        <td>$2.5</td>
+        <td>160K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-0528</b></td>
+        <td>$0.7</td>
+        <td>$2.5</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-turbo</b></td>
+        <td>$0.7</td>
+        <td>$2.5</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-distill-llama-70b</b></td>
+        <td>$0.8</td>
+        <td>$0.8</td>
+        <td>8K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>$0.99</td>
+        <td>$0.99</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-0528-turbo</b></td>
+        <td>$1</td>
+        <td>$3</td>
+        <td>32K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash</b></td>
+        <td>$1</td>
+        <td>$2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$1</td>
+        <td>$2</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-flash</b></td>
+        <td>$1</td>
+        <td>$2</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>$1.35</td>
+        <td>$5.4</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>$1.35</td>
+        <td>$5.4</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$1.521</td>
+        <td>$3.042</td>
+        <td>716K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-pro</b></td>
+        <td>$1.67</td>
+        <td>$3.38</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4</b></td>
+        <td>$1.74</td>
+        <td>$3.48</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$1.74</td>
+        <td>$3.48</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$1.74</td>
+        <td>$3.48</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$1.74</td>
+        <td>$3.48</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-pro</b></td>
+        <td>$1.74</td>
+        <td>$3.48</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$1.74</td>
+        <td>$3.48</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>DeepSeek-V4-Pro</b></td>
+        <td>$1.75</td>
+        <td>$3.5</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V2.5</b></td>
+        <td>$2</td>
+        <td>$2</td>
+        <td>163K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3--community</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3-0324</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3-turbo</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.2-exp</b></td>
+        <td>$2</td>
+        <td>$3</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.2</b></td>
+        <td>$2</td>
+        <td>$3</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.2</b></td>
+        <td>$2</td>
+        <td>$3</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3-0324</b></td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.2</b></td>
+        <td>$2</td>
+        <td>$3</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-V4-Pro</b></td>
+        <td>$2.1</td>
+        <td>$4.4</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-pro</b></td>
+        <td>$2.262</td>
+        <td>$4.524</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>$2.44</td>
+        <td>$2.44</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-ai--DeepSeek-R1-0528</b></td>
+        <td>$2.5</td>
+        <td>$5</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>DeepSeek-V3.1</b></td>
+        <td>$3</td>
+        <td>$4.5</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>DeepSeek-V3.2</b></td>
+        <td>$3</td>
+        <td>$4.5</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-prover-v2-671b</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>160K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1--community</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-0528</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>163K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-turbo</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.1-terminus</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v3.1</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.1-terminus</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>163K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-0528</b></td>
+        <td>$4</td>
+        <td>$16</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v3.1</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-r1-distill-llama-70b</b></td>
+        <td>$5.8</td>
+        <td>$5.8</td>
+        <td>32K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-pro</b></td>
+        <td>$12</td>
+        <td>$24</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-v4-pro</b></td>
+        <td>$12</td>
+        <td>$24</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-8b</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="mistral">🇫🇷 Mistral</h2>
+    <p>
+      Mistral offers both open-weight and commercial models. Known for efficiency and European data
+      sovereignty.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Open Weights</th>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Nemo-Instruct-2407</b></td>
+        <td>$0.008</td>
+        <td>$0.001</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-instruct-2407</b></td>
+        <td>$0.02</td>
+        <td>$0.04</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-12b-instruct--fp-8</b></td>
+        <td>$0.0375</td>
+        <td>$0.1</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>ministral-3b</b></td>
+        <td>$0.04</td>
+        <td>$0.04</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>voxtral-mini</b></td>
+        <td>$0.04</td>
+        <td>$0.04</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistralai--mistral-nemo</b></td>
+        <td>$0.04</td>
+        <td>$0.17</td>
+        <td>60K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-small-24b-instruct-2501</b></td>
+        <td>$0.05</td>
+        <td>$0.08</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Small-24B-Instruct-2501</b></td>
+        <td>$0.05</td>
+        <td>$0.08</td>
+        <td>32K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-small-3.2-24b-instruct-2506</b></td>
+        <td>$0.075</td>
+        <td>$0.2</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Devstral-Small-2-24B-Instruct</b></td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-small-3-1</b></td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>ministral-8b</b></td>
+        <td>$0.1</td>
+        <td>$0.1</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>voxtral-small</b></td>
+        <td>$0.1</td>
+        <td>$0.3</td>
+        <td>128K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Mistral-Small-3.2-24B-Instruct-2506</b></td>
+        <td>$0.1</td>
+        <td>$0.31</td>
+        <td>131K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-7b-instruct-v0.1</b></td>
+        <td>$0.11</td>
+        <td>$0.19</td>
+        <td>32K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>Mistral-7B-Instruct-v0.3</b></td>
+        <td>$0.11</td>
+        <td>$0.11</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Mistral-Nemo-Instruct-2407</b></td>
+        <td>$0.14</td>
+        <td>$0.14</td>
+        <td>65K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-7b</b></td>
+        <td>$0.15</td>
+        <td>$0.2</td>
+        <td>32K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-7b</b></td>
+        <td>$0.15</td>
+        <td>$0.2</td>
+        <td>32K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo</b></td>
+        <td>$0.15</td>
+        <td>$0.15</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-small-3.2-24b-instruct-2506</b></td>
+        <td>$0.15</td>
+        <td>$0.35</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-small</b></td>
+        <td>$0.2</td>
+        <td>$0.6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-instruct-2407</b></td>
+        <td>$0.2</td>
+        <td>$0.2</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-7B</b></td>
+        <td>$0.2</td>
+        <td>$2</td>
+        <td>8K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Mistral-Small-3.2-24B-Instruct-2506</b></td>
+        <td>$0.3</td>
+        <td>$0.3</td>
+        <td>?</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-small-3.1-24b-instruct</b></td>
+        <td>$0.351</td>
+        <td>$0.555</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-medium-3</b></td>
+        <td>$0.4</td>
+        <td>$2</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-medium</b></td>
+        <td>$0.4</td>
+        <td>$2</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mixtral-8x7b</b></td>
+        <td>$0.45</td>
+        <td>$0.7</td>
+        <td>32K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-large-3</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistralai--Magistral-Small</b></td>
+        <td>$0.5</td>
+        <td>$2</td>
+        <td>131K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>magistral-small</b></td>
+        <td>$0.5</td>
+        <td>$1.5</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-large-3-675b-instruct-2512</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mistral-small-4-119b-2603</b></td>
+        <td>$0.55</td>
+        <td>$2.75</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>mixtral-8x22b</b></td>
+        <td>$0.8</td>
+        <td>$1.2</td>
+        <td>64K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-small</b></td>
+        <td>$1</td>
+        <td>$3</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-ai--mixtral-8x22b</b></td>
+        <td>$1.26</td>
+        <td>$1.26</td>
+        <td>?</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-small-24b-instruct-2501</b></td>
+        <td>$1.26</td>
+        <td>$1.26</td>
+        <td>32K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-large</b></td>
+        <td>$2</td>
+        <td>$6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>pixtral-large</b></td>
+        <td>$2</td>
+        <td>$6</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-mistral-large</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-large-2407</b></td>
+        <td>$4</td>
+        <td>$12</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>codestral</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>256K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>devstral</b></td>
+        <td>Free</td>
+        <td></td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2 id="free">🆓 Free Alternatives to OpenAI</h2>
+    <p>
+      81 models are available at zero cost — perfect for testing, prototyping, and learning. Many
+      support tool calling and have large context windows.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-clip-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>google--lyria-3-pro-preview</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>codestral</b></td>
+        <td>mistral</td>
+        <td>256K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>hunyuan-lite</b></td>
+        <td>tencent</td>
+        <td>250K</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5--free</b></td>
+        <td>openrouter</td>
+        <td>204K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2 id="open-weights">🔓 Open-Weight Alternatives</h2>
+    <p>
+      527 models with downloadable weights you can run locally or on your own infrastructure. No API
+      dependency, full privacy control.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash-2026-02-23</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash-2026-04-16</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>MiniMax-Text-01</b></td>
+        <td>302ai</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick</b></td>
+        <td>302ai</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout</b></td>
+        <td>302ai</td>
+        <td>1M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-1</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>baseten</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick</b></td>
+        <td>digitalocean</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b> — not third-party aggregators. Pricing,
+      context windows, and capabilities are verified against official provider documentation.
+      Aggregator providers are excluded from ranking tables to avoid duplicate models.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models/blob/main/docs/openai-alternatives.md"
+          >OpenAI Alternatives Guide</a
+        >
+        — detailed analysis
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 87 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/promotion-templates.md b/site/promotion-templates.md
new file mode 100644
index 00000000..f23859cb
--- /dev/null
+++ b/site/promotion-templates.md
@@ -0,0 +1,105 @@
+# Reddit / HN Post Templates
+
+## r/LocalLLaMA
+
+**Title:** I built a catalog of 4,587 AI models across 95 providers — all with structured pricing, context windows, and capabilities
+
+**Body:**
+
+Hey r/LocalLLaMA,
+
+I got tired of checking 95 different websites to compare AI model pricing and capabilities, so I built [AI Models Catalog](https://github.com/i-need-token/ai-models) — a structured YAML catalog of every major AI model.
+
+**The numbers:**
+
+- 4,587 models across 95 providers
+- 81 free models, 527 open weights
+- 2,350 tool-calling, 1,306 reasoning, 1,487 vision
+- All data from first-party APIs (no third-party aggregators)
+
+**What makes it different:**
+
+- Machine-readable YAML (not just a web UI)
+- TypeScript types + Zod validation
+- Multiple formats: JSON, CSV, npm, GitHub Action
+- 68 documentation pages (34 EN + 34 ZH)
+
+**Free models:** 81 models you can use at zero cost, including models on Groq, Cerebras, Cloudflare Workers AI, and more.
+
+**Open weights:** 527 models with downloadable weights (Llama, Mistral, Qwen, DeepSeek, etc.)
+
+**Interactive catalog:** [i-need-token.github.io/ai-models](https://i-need-token.github.io/ai-models/) — search, filter, price calculator, model picker
+
+**Quick start:**
+
+```bash
+curl -sL https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+# → 4587
+```
+
+Would love feedback on what providers or features to add next!
+
+---
+
+## r/MachineLearning
+
+**Title:** [P] AI Models Catalog — 4,587 models, 95 providers, structured YAML with pricing and capabilities
+
+**Body:**
+
+We created a structured catalog of AI model metadata to make model comparison and selection easier for researchers and developers.
+
+**Repository:** https://github.com/i-need-token/ai-models
+
+**Key features:**
+
+- Structured YAML for every model (pricing, context windows, modalities, capabilities)
+- First-party data only — scraped from provider APIs
+- Zod-validated TypeScript types
+- JSON, CSV, npm package, GitHub Action outputs
+- 68 documentation pages covering specific use cases
+
+**Research applications:**
+
+- Model selection for experiments
+- Pricing analysis across providers
+- Capability tracking (tool calling, reasoning, structured output)
+- Context window comparison
+- Open weights tracking
+
+**Data access:**
+
+```python
+import json
+with open("models.json") as f:
+    catalog = json.load(f)
+    models = catalog["models"]
+    free = [m for m in models if m.get("pricing", {}).get("unit") == "free"]
+    print(f"Free models: {len(free)}")
+```
+
+Feedback and contributions welcome!
+
+---
+
+## Hacker News (Show HN)
+
+**Title:** Show HN: AI Models Catalog – 4,587 models, 95 providers, structured pricing and capabilities
+
+**Body:**
+
+I built a structured catalog of AI model metadata because I was tired of visiting 95 different websites to compare models.
+
+Every model has structured YAML with pricing (per-token), context windows, modalities, and capabilities. All data comes from first-party APIs — no third-party aggregators.
+
+Key features:
+
+- 4,587 models across 95 providers
+- 81 free models, 527 open weights
+- Machine-readable YAML with Zod validation
+- JSON, CSV, npm, GitHub Action
+- Interactive catalog with price calculator and model picker
+- 68 documentation pages
+
+Try it: https://i-need-token.github.io/ai-models/
+Repo: https://github.com/i-need-token/ai-models
diff --git a/site/reasoning-models-comparison.html b/site/reasoning-models-comparison.html
new file mode 100644
index 00000000..bff4ba7e
--- /dev/null
+++ b/site/reasoning-models-comparison.html
@@ -0,0 +1,970 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>AI Reasoning Models Compared — o1, R1, Claude, Gemini (2025) | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Compare AI reasoning models: OpenAI o1/o3, DeepSeek R1, Claude, Gemini 2.5. 1,306 reasoning models with pricing, context windows, and capabilities."
+    />
+    <meta
+      name="keywords"
+      content="AI reasoning model, o1 vs R1, reasoning LLM comparison, best reasoning model, chain of thought model, DeepSeek R1, OpenAI o1, Claude reasoning, Gemini thinking"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+    />
+    <meta
+      property="og:title"
+      content="AI Reasoning Models Compared — o1, R1, Claude, Gemini (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare AI reasoning models: o1, R1, Claude, Gemini. 1,306 reasoning models with pricing and capabilities."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="AI Reasoning Models Compared — o1, R1, Claude, Gemini (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare AI reasoning models: o1, R1, Claude, Gemini. 1,306 reasoning models."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "AI Reasoning Models Compared — o1, R1, Claude, Gemini (2025)",
+        "description": "Compare AI reasoning models: o1, R1, Claude, Gemini. 1,306 reasoning models with pricing and capabilities.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>🧠 AI Reasoning Models Compared (2025)</h1>
+    <p>
+      Compare <b>1,306</b> reasoning models across 95 providers. Find the best chain-of-thought
+      model for math, science, coding, and complex analysis.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>1,306</b><small>Reasoning Models</small></div>
+      <div class="stat"><b>95</b><small>Providers</small></div>
+      <div class="stat"><b>81</b><small>Free</small></div>
+      <div class="stat"><b>527</b><small>Open Weights</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 What is a reasoning model?</strong> Reasoning models (like OpenAI o1/o3, DeepSeek
+      R1, Claude with extended thinking) use chain-of-thought to break complex problems into steps.
+      They excel at math, science, coding, and multi-step logic — but often cost more and run slower
+      than standard models.
+    </div>
+
+    <h2>🏆 Flagship Reasoning Models — Head to Head</h2>
+    <p>The top reasoning models compared side by side.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>o3</b></td>
+        <td>openai</td>
+        <td>$10</td>
+        <td>$40</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o3-mini</b></td>
+        <td>openai</td>
+        <td>$1.1</td>
+        <td>$4.4</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o4-mini</b></td>
+        <td>openai</td>
+        <td>$1.1</td>
+        <td>$4.4</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o1</b></td>
+        <td>openai</td>
+        <td>$15</td>
+        <td>$60</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o1-mini</b></td>
+        <td>openai</td>
+        <td>$1.5</td>
+        <td>$6</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o1-pro</b></td>
+        <td>openai</td>
+        <td>$150</td>
+        <td>$600</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1-distill-llama-70b</b></td>
+        <td>cerebras</td>
+        <td>Free</td>
+        <td></td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>deepinfra</td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>deepinfra</td>
+        <td>$0.3</td>
+        <td>$2.5</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>?</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>💰 Cheapest Reasoning Models</h2>
+    <p>Reasoning on a budget — most affordable models with reasoning capability.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>$0.01</td>
+        <td>$0.05</td>
+        <td>262K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>$0.02</td>
+        <td>$0.1</td>
+        <td>262K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.14</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>262K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>deepinfra</td>
+        <td>$0.039</td>
+        <td>$0.19</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-9b-v2</b></td>
+        <td>deepinfra</td>
+        <td>$0.04</td>
+        <td>$0.16</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>novitaai</td>
+        <td>$0.04</td>
+        <td>$0.15</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nemotron-3-nano-30b-a3b</b></td>
+        <td>deepinfra</td>
+        <td>$0.05</td>
+        <td>$0.2</td>
+        <td>262K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>40K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>$0.06</td>
+        <td>$0.4</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🆓 Free Reasoning Models</h2>
+    <p>33 reasoning models at zero cost — perfect for learning and prototyping.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>minimax--minimax-m2.5--free</b></td>
+        <td>openrouter</td>
+        <td>204K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>z-ai--glm-5.1</b></td>
+        <td>openrouter</td>
+        <td>202K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🔓 Open-Weight Reasoning Models</h2>
+    <p>120 reasoning models you can run locally for full privacy and zero API costs.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>xiaomi--mimo-v2.5-pro</b></td>
+        <td>hpc-ai</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>xiaomi--mimo-v2.5</b></td>
+        <td>hpc-ai</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash</b></td>
+        <td>hpc-ai</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-pro</b></td>
+        <td>hpc-ai</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>DeepSeek-V4-Pro</b></td>
+        <td>nebius</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>trinity-large-thinking</b></td>
+        <td>arcee</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-next-80b-a3b-thinking</b></td>
+        <td>clarifai</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>cloudflare</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2.5</b></td>
+        <td>cloudflare</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>kimi-k2.6</b></td>
+        <td>cloudflare</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🔧 Reasoning + Tool Calling</h2>
+    <p>
+      Models with both reasoning and tool calling — the most capable for agentic workflows that need
+      complex planning.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>$0.06</td>
+        <td>$0.4</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>hermes-4-llama-3.1-8b</b></td>
+        <td>nousresearch</td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>seed-1.6-flash</b></td>
+        <td>bytedance</td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ring-2.6-1t</b></td>
+        <td>inclusionai</td>
+        <td>$0.07</td>
+        <td>$0.62</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--glm-4.7-flash</b></td>
+        <td>novitaai</td>
+        <td>$0.07</td>
+        <td>$0.4</td>
+        <td>200K</td>
+      </tr>
+      <tr>
+        <td><b>microsoft-phi-4-mini-reasoning</b></td>
+        <td>microsoft</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-32B-TEE</b></td>
+        <td>chutes</td>
+        <td>$0.08</td>
+        <td>$0.24</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>clarifai</td>
+        <td>$0.09</td>
+        <td>$0.36</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>📏 Large Context Reasoning Models</h2>
+    <p>
+      Reasoning models with 128K+ context — for analyzing long documents, large codebases, and
+      complex multi-step problems.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-0.8b</b></td>
+        <td>deepinfra</td>
+        <td>262K</td>
+        <td>$0.01</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-2b</b></td>
+        <td>deepinfra</td>
+        <td>262K</td>
+        <td>$0.02</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>deepinfra</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3.5-4b</b></td>
+        <td>deepinfra</td>
+        <td>262K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>128K</td>
+        <td>$0.03</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>deepinfra</td>
+        <td>131K</td>
+        <td>$0.039</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia-nemotron-nano-9b-v2</b></td>
+        <td>deepinfra</td>
+        <td>131K</td>
+        <td>$0.04</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>novitaai</td>
+        <td>131K</td>
+        <td>$0.04</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nemotron-3-nano-30b-a3b</b></td>
+        <td>deepinfra</td>
+        <td>262K</td>
+        <td>$0.05</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.05</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>131K</td>
+        <td>$0.05</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>131K</td>
+        <td>$0.06</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>deepinfra</td>
+        <td>202K</td>
+        <td>$0.06</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>128K</td>
+        <td>$0.06</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>hermes-4-llama-3.1-8b</b></td>
+        <td>nousresearch</td>
+        <td>131K</td>
+        <td>$0.06</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b>. Reasoning capability is defined by the
+      provider's own classification — models that use chain-of-thought, extended thinking, or
+      similar techniques. Aggregator providers are excluded from ranking tables to avoid duplicate
+      models.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+          >Best AI Models for Coding</a
+        >
+        — code-focused comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+          >Best AI Models for Agents</a
+        >
+        — agentic model comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <p><a href="small-language-models.html">Small Language Models</a></p>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/robots.txt b/site/robots.txt
new file mode 100644
index 00000000..42b43f0d
--- /dev/null
+++ b/site/robots.txt
@@ -0,0 +1,4 @@
+User-agent: *
+Allow: /
+
+Sitemap: https://i-need-token.github.io/ai-models/sitemap.xml
diff --git a/site/sitemap.xml b/site/sitemap.xml
new file mode 100644
index 00000000..1aaa1cf7
--- /dev/null
+++ b/site/sitemap.xml
@@ -0,0 +1,276 @@
+<?xml version='1.0' encoding='UTF-8'?>
+<ns0:urlset xmlns:ns0="http://www.sitemaps.org/schemas/sitemap/0.9">
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/</ns0:loc>
+    <ns0:changefreq>daily</ns0:changefreq>
+    <ns0:priority>1.0</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/agentic-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/api</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/audio-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/cached-pricing</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/chat-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/code-examples</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/code-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/context-windows</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/data-acquisition</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/data-schema</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/embedding-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/faq</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/free-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/glossary</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/image-generation</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/large-context-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/lessons-learned</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/migration-guide</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/modality-matrix</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/model-comparison</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/model-selection</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/multimodal-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/open-weights</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/pricing-comparison</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/provider-comparison</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/providers</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/quick-start</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/reasoning-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/small-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/structured-output</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/tool-calling</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/video-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/vision-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+<ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/models.json</ns0:loc>
+    <ns0:changefreq>daily</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+<ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/openai-alternatives</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.8</ns0:priority>
+  </ns0:url>
+<ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/agentic-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.8</ns0:priority>
+  </ns0:url>
+<ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/code-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+<ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/docs/audio-models</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.7</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/best-ai-models.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/free-ai-models.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/llm-pricing.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/openai-alternatives.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/ai-models-by-provider.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/context-window-comparison.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/reasoning-models-comparison.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/cheapest-ai-models.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+
+  <ns0:url>
+    <ns0:loc>https://i-need-token.github.io/ai-models/structured-output-models-comparison.html</ns0:loc>
+    <ns0:changefreq>weekly</ns0:changefreq>
+    <ns0:priority>0.9</ns0:priority>
+  </ns0:url>
+<ns0:url><ns0:loc>https://i-need-token.github.io/ai-models/open-source-ai-models.html</ns0:loc><ns0:priority>0.9</ns0:priority><ns0:changefreq>weekly</ns0:changefreq></ns0:url><ns0:url><ns0:loc>https://i-need-token.github.io/ai-models/multimodal-ai-models.html</ns0:loc><ns0:priority>0.9</ns0:priority><ns0:changefreq>weekly</ns0:changefreq></ns0:url></ns0:urlset>
\ No newline at end of file
diff --git a/site/small-language-models.html b/site/small-language-models.html
new file mode 100644
index 00000000..7d80cca0
--- /dev/null
+++ b/site/small-language-models.html
@@ -0,0 +1,611 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      Small Language Models (SLM) — 2,000+ Models Under 10B Parameters (2025) | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Complete guide to 2,000+ small language models in 2025. Compare SLMs under 10B parameters — pricing, context windows, tool calling, and deployment options for edge and mobile."
+    />
+    <meta
+      name="keywords"
+      content="small language model, SLM, small LLM, edge AI, on-device AI, mobile AI, compact model, lightweight LLM, 7B model, 3B model, 1B model"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/small-language-models.html"
+    />
+    <meta
+      property="og:title"
+      content="Small Language Models (SLM) — 2,000+ Models Under 10B Parameters (2025)"
+    />
+    <meta
+      property="og:description"
+      content="2,000+ small language models compared. Find the best SLM for edge deployment, mobile apps, and cost-efficient production."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Small Language Models (SLM) — 2,000+ Models Under 10B Parameters (2025)",
+        "description": "Complete guide to 2,000+ small language models. Compare SLMs for edge deployment, mobile apps, and cost-efficient production.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21",
+        "url": "https://i-need-token.github.io/ai-models/small-language-models.html"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #ffffff;
+        --bg-secondary: #f6f8fa;
+        --text: #1f2328;
+        --text-secondary: #656d76;
+        --border: #d0d7de;
+        --accent: #0969da;
+        --accent-light: #ddf4ff;
+        --card-bg: #ffffff;
+        --card-border: #d0d7de;
+        --highlight: #1a7f37;
+        --warning: #9a6700;
+        --free: #1a7f37;
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #0d1117;
+          --bg-secondary: #161b22;
+          --text: #e6edf3;
+          --text-secondary: #8b949e;
+          --border: #30363d;
+          --accent: #58a6ff;
+          --accent-light: #1f2d3d;
+          --card-bg: #161b22;
+          --card-border: #30363d;
+          --highlight: #3fb950;
+          --warning: #d29922;
+          --free: #3fb950;
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Helvetica, Arial, sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        line-height: 1.6;
+      }
+      .container {
+        max-width: 1200px;
+        margin: 0 auto;
+        padding: 20px;
+      }
+      h1 {
+        font-size: 2em;
+        margin-bottom: 16px;
+      }
+      h2 {
+        font-size: 1.5em;
+        margin: 32px 0 16px;
+        padding-bottom: 8px;
+        border-bottom: 1px solid var(--border);
+      }
+      h3 {
+        font-size: 1.2em;
+        margin: 24px 0 12px;
+      }
+      p {
+        margin: 12px 0;
+        color: var(--text-secondary);
+      }
+      a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      a:hover {
+        text-decoration: underline;
+      }
+      .stats-grid {
+        display: grid;
+        grid-template-columns: repeat(auto-fit, minmax(160px, 1fr));
+        gap: 12px;
+        margin: 20px 0;
+      }
+      .stat-card {
+        background: var(--card-bg);
+        border: 1px solid var(--card-border);
+        border-radius: 8px;
+        padding: 16px;
+        text-align: center;
+      }
+      .stat-card .number {
+        font-size: 2em;
+        font-weight: 700;
+        color: var(--accent);
+      }
+      .stat-card .label {
+        font-size: 0.85em;
+        color: var(--text-secondary);
+        margin-top: 4px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 0.9em;
+      }
+      th,
+      td {
+        padding: 10px 12px;
+        text-align: left;
+        border-bottom: 1px solid var(--border);
+      }
+      th {
+        background: var(--bg-secondary);
+        font-weight: 600;
+        position: sticky;
+        top: 0;
+      }
+      tr:hover {
+        background: var(--bg-secondary);
+      }
+      .free {
+        color: var(--free);
+        font-weight: 600;
+      }
+      .badge {
+        display: inline-block;
+        padding: 2px 8px;
+        border-radius: 12px;
+        font-size: 0.75em;
+        font-weight: 600;
+      }
+      .badge-free {
+        background: var(--accent-light);
+        color: var(--accent);
+      }
+      .badge-tc {
+        background: #fff8c5;
+        color: #7c6600;
+      }
+      .badge-reason {
+        background: #f0fff4;
+        color: #1a7f37;
+      }
+      @media (prefers-color-scheme: dark) {
+        .badge-tc {
+          background: #3d2e00;
+          color: #d29922;
+        }
+        .badge-reason {
+          background: #0d2818;
+          color: #3fb950;
+        }
+      }
+      .cta {
+        display: inline-block;
+        background: var(--accent);
+        color: #fff;
+        padding: 12px 24px;
+        border-radius: 8px;
+        font-weight: 600;
+        margin: 16px 0;
+      }
+      .cta:hover {
+        text-decoration: none;
+        opacity: 0.9;
+      }
+      .related-pages {
+        margin: 40px 0;
+        padding: 20px;
+        background: var(--bg-secondary);
+        border-radius: 8px;
+      }
+      .related-pages a {
+        display: inline-block;
+        margin: 4px 8px 4px 0;
+        padding: 4px 12px;
+        background: var(--card-bg);
+        border: 1px solid var(--card-border);
+        border-radius: 4px;
+        font-size: 0.9em;
+      }
+      footer {
+        margin-top: 40px;
+        padding: 20px 0;
+        border-top: 1px solid var(--border);
+        text-align: center;
+        color: var(--text-secondary);
+        font-size: 0.85em;
+      }
+      @media (max-width: 768px) {
+        .container {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.5em;
+        }
+        .stats-grid {
+          grid-template-columns: repeat(2, 1fr);
+        }
+        table {
+          font-size: 0.8em;
+        }
+        th,
+        td {
+          padding: 6px 8px;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <div class="container">
+      <h1>🤏 Small Language Models (SLM) — 2,000+ Models Under 10B Parameters</h1>
+      <p>
+        Complete guide to small language models for edge deployment, mobile apps, and cost-efficient
+        production. All data from
+        <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — first-party data
+        only.
+      </p>
+
+      <div class="stats-grid">
+        <div class="stat-card">
+          <div class="number">2,002</div>
+          <div class="label">Small Models</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">928</div>
+          <div class="label">With Tool Calling</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">557</div>
+          <div class="label">With Reasoning</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">48</div>
+          <div class="label">Free SLMs</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">689</div>
+          <div class="label">First-Party</div>
+        </div>
+      </div>
+
+      <a class="cta" href="https://i-need-token.github.io/ai-models/"
+        >🔍 Search All 4,587 Models →</a
+      >
+
+      <h2>What Are Small Language Models?</h2>
+      <p>
+        Small Language Models (SLMs) are AI models with fewer than ~10 billion parameters, designed
+        for efficiency, low latency, and deployment on resource-constrained hardware — from
+        smartphones to edge servers. They offer a practical alternative to large frontier models
+        when cost, speed, or privacy matters.
+      </p>
+      <p><strong>Key advantages of SLMs:</strong></p>
+      <ul>
+        <li><strong>Lower cost</strong> — often 10-100x cheaper per token than frontier models</li>
+        <li><strong>Lower latency</strong> — faster inference for real-time applications</li>
+        <li><strong>Edge deployment</strong> — run on-device without cloud dependency</li>
+        <li><strong>Privacy</strong> — data never leaves the device</li>
+        <li><strong>Fine-tuning</strong> — easier to customize for specific domains</li>
+      </ul>
+
+      <h2>Cheapest Small Models with Tool Calling</h2>
+      <p>Best value SLMs for AI agents and tool-use workflows (first-party providers only):</p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+            <th>Output $/M</th>
+            <th>Context</th>
+            <th>Reasoning</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>ling-2.6-flash</td>
+            <td>ling</td>
+            <td>$0.01</td>
+            <td>$0.03</td>
+            <td>262K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</td>
+            <td>klusterai</td>
+            <td>$0.015</td>
+            <td>$0.02</td>
+            <td>131K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>granite-4.0-h-micro</td>
+            <td>ibm</td>
+            <td>$0.017</td>
+            <td>$0.112</td>
+            <td>131K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>llama-3.1-8b-instruct--fp-16</td>
+            <td>fireworks</td>
+            <td>$0.02</td>
+            <td>$0.03</td>
+            <td>131K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>schematron-3b</td>
+            <td>fireworks</td>
+            <td>$0.02</td>
+            <td>$0.05</td>
+            <td>131K</td>
+            <td></td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>Free Small Language Models</h2>
+      <p>48 small models available at zero cost — perfect for prototyping and development:</p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Provider</th>
+            <th>Context</th>
+            <th>Tool Calling</th>
+            <th>Reasoning</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>deepseek-r1-distill-llama-8b</td>
+            <td>cerebras</td>
+            <td>131K</td>
+            <td></td>
+            <td>✓</td>
+          </tr>
+          <tr>
+            <td>llama-4-scout-17b-16e-instruct</td>
+            <td>cerebras</td>
+            <td>131K</td>
+            <td>✓</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>qwen-2.5-32b</td>
+            <td>cerebras</td>
+            <td>131K</td>
+            <td>✓</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>gemma-4-26b-a4b-it</td>
+            <td>auriko</td>
+            <td>262K</td>
+            <td>✓</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>glm-4.5-flash</td>
+            <td>auriko</td>
+            <td>200K</td>
+            <td>✓</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>glm-4.6v-flash</td>
+            <td>auriko</td>
+            <td>128K</td>
+            <td>✓</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>baidu--ernie-4.5-0.3b</td>
+            <td>aimlapi</td>
+            <td>120K</td>
+            <td>✓</td>
+            <td></td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>Small Models with Reasoning</h2>
+      <p>
+        557 small models with reasoning capabilities — ideal for math, logic, and step-by-step
+        problem solving:
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Provider</th>
+            <th>Input $/M</th>
+            <th>Output $/M</th>
+            <th>Context</th>
+            <th>Tool Calling</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>qwen3.5-0.8b</td>
+            <td>qwen</td>
+            <td>$0.01</td>
+            <td>$0.05</td>
+            <td>262K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>qwen3.5-2b</td>
+            <td>qwen</td>
+            <td>$0.02</td>
+            <td>$0.10</td>
+            <td>262K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>qwen--qwen3-4b-fp8</td>
+            <td>fireworks</td>
+            <td>$0.03</td>
+            <td>$0.03</td>
+            <td>128K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>qwen3.5-4b</td>
+            <td>qwen</td>
+            <td>$0.03</td>
+            <td>$0.15</td>
+            <td>262K</td>
+            <td></td>
+          </tr>
+          <tr>
+            <td>deepseek-r1-distill-llama-8b</td>
+            <td>cerebras</td>
+            <td class="free">Free</td>
+            <td class="free">Free</td>
+            <td>131K</td>
+            <td></td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>Best SLMs by Use Case</h2>
+      <h3>🤖 AI Agents on a Budget</h3>
+      <p>
+        <strong>ling-2.6-flash</strong> ($0.01/$0.03/M) — cheapest tool-calling model with 262K
+        context. Perfect for high-volume agent workflows.
+      </p>
+      <h3>📱 On-Device / Edge Deployment</h3>
+      <p>
+        <strong>Qwen3.5 0.8B</strong> — ultra-compact reasoning model.
+        <strong>Gemma 4 27B IT</strong> — free with vision + tool calling.
+      </p>
+      <h3>💻 Code Completion</h3>
+      <p>
+        <strong>bdc-coder</strong> ($0.01/$0.01/M) — cheapest coding model.
+        <strong>Qwen3 4B</strong> ($0.03/$0.15/M) — open-source with reasoning.
+      </p>
+      <h3>🧮 Math & Reasoning</h3>
+      <p>
+        <strong>DeepSeek R1 Distill Llama 8B</strong> — free reasoning model.
+        <strong>Qwen3.5 0.8B</strong> ($0.01/$0.05/M) — cheapest reasoning.
+      </p>
+      <h3>💬 Chat & RAG</h3>
+      <p>
+        <strong>GPT-4.1-nano</strong> ($0.10/$0.40/M) — fast, cheap, reliable.
+        <strong>Qwen3 4B</strong> ($0.03/$0.15/M) — open-source alternative.
+      </p>
+
+      <h2>SLM vs LLM: When to Choose Small</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Factor</th>
+            <th>Small Model (SLM)</th>
+            <th>Large Model (LLM)</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Cost per 1M tokens</td>
+            <td>$0.01 – $0.20</td>
+            <td>$1 – $40</td>
+          </tr>
+          <tr>
+            <td>Latency (first token)</td>
+            <td>50 – 200ms</td>
+            <td>200 – 2000ms</td>
+          </tr>
+          <tr>
+            <td>Deployment</td>
+            <td>On-device, edge, cloud</td>
+            <td>Cloud only</td>
+          </tr>
+          <tr>
+            <td>Privacy</td>
+            <td>Data stays on device</td>
+            <td>Data sent to cloud</td>
+          </tr>
+          <tr>
+            <td>Customization</td>
+            <td>Easy fine-tuning</td>
+            <td>Expensive fine-tuning</td>
+          </tr>
+          <tr>
+            <td>Complex reasoning</td>
+            <td>Good for simple tasks</td>
+            <td>Superior for complex tasks</td>
+          </tr>
+          <tr>
+            <td>Best for</td>
+            <td>High-volume, real-time, edge</td>
+            <td>Complex, nuanced, creative</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <div class="related-pages">
+        <strong>Related:</strong>
+        <a href="free-ai-models.html">Free AI Models</a>
+        <a href="cheapest-ai-models.html">Cheapest AI Models</a>
+        <a href="tool-calling-models-comparison.html">Tool Calling Models</a>
+        <a href="reasoning-models-comparison.html">Reasoning Models</a>
+        <a href="open-source-ai-models.html">Open Source Models</a>
+        <a href="best-ai-models-for-coding.html">Best for Coding</a>
+        <a href="best-ai-models-for-agents.html">Best for Agents</a>
+        <a href="ai-model-comparison-chart.html">Comparison Chart</a>
+        <a href="context-window-comparison.html">Context Windows</a>
+        <a href="llm-pricing.html">LLM Pricing</a>
+        <a href="best-ai-models.html">Best AI Models</a>
+        <a href="state-of-ai-models.html">State of AI Models</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        <a href="chatgpt-vs-claude-vs-gemini.html">ChatGPT vs Claude vs Gemini</a>
+        <a href="ai-models-by-provider.html">By Provider</a>
+        <a href="multimodal-ai-models.html">Multimodal Models</a>
+        <a href="structured-output-models-comparison.html">Structured Output</a>
+        <a href="best-ai-models-for-vision.html">Vision Models</a>
+        <a href="best-ai-models-for-image-generation.html">Image Generation</a>
+        <a href="openai-alternatives.html">OpenAI Alternatives</a>
+        <a href="ai-model-pricing-calculator.html">Pricing Calculator</a>
+      </div>
+
+      <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+      <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+      <footer>
+        <p>
+          Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> —
+          4,587 models across 95 providers. First-party data only.
+        </p>
+        <p>
+          <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> ·
+          <a href="https://github.com/i-need-token/ai-models">GitHub</a> ·
+          <a href="https://github.com/i-need-token/ai-models/releases/latest/download/models.json"
+            >Download JSON</a
+          >
+        </p>
+      </footer>
+    </div>
+  </body>
+</html>
diff --git a/site/social-preview.svg b/site/social-preview.svg
new file mode 100644
index 00000000..063f980e
--- /dev/null
+++ b/site/social-preview.svg
@@ -0,0 +1,109 @@
+<svg xmlns="http://www.w3.org/2000/svg" width="1280" height="640" viewBox="0 0 1280 640">
+  <defs>
+    <linearGradient id="bg" x1="0%" y1="0%" x2="100%" y2="100%">
+      <stop offset="0%" style="stop-color:#0d1117"/>
+      <stop offset="100%" style="stop-color:#161b22"/>
+    </linearGradient>
+    <linearGradient id="accent" x1="0%" y1="0%" x2="100%" y2="0%">
+      <stop offset="0%" style="stop-color:#58a6ff"/>
+      <stop offset="50%" style="stop-color:#bc8cff"/>
+      <stop offset="100%" style="stop-color:#f778ba"/>
+    </linearGradient>
+    <linearGradient id="card1" x1="0%" y1="0%" x2="0%" y2="100%">
+      <stop offset="0%" style="stop-color:#1a2332"/>
+      <stop offset="100%" style="stop-color:#161b22"/>
+    </linearGradient>
+  </defs>
+  
+  <!-- Background -->
+  <rect width="1280" height="640" fill="url(#bg)"/>
+  
+  <!-- Subtle grid pattern -->
+  <g opacity="0.05">
+    <line x1="0" y1="0" x2="1280" y2="640" stroke="#58a6ff" stroke-width="0.5"/>
+    <line x1="1280" y1="0" x2="0" y2="640" stroke="#58a6ff" stroke-width="0.5"/>
+    <line x1="640" y1="0" x2="640" y2="640" stroke="#58a6ff" stroke-width="0.5"/>
+    <line x1="0" y1="320" x2="1280" y2="320" stroke="#58a6ff" stroke-width="0.5"/>
+    <circle cx="640" cy="320" r="200" fill="none" stroke="#58a6ff" stroke-width="0.5"/>
+    <circle cx="640" cy="320" r="300" fill="none" stroke="#58a6ff" stroke-width="0.5"/>
+  </g>
+  
+  <!-- Top accent bar -->
+  <rect x="0" y="0" width="1280" height="4" fill="url(#accent)"/>
+  
+  <!-- Title -->
+  <text x="80" y="120" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="56" font-weight="700" fill="#e6edf3">AI Models Catalog</text>
+  
+  <!-- Subtitle -->
+  <text x="80" y="170" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="24" fill="#8b949e">Structured YAML catalog of AI model metadata — pricing, context windows, capabilities</text>
+  
+  <!-- Stats cards -->
+  <g transform="translate(80, 220)">
+    <!-- Card 1: Models -->
+    <rect x="0" y="0" width="260" height="120" rx="12" fill="url(#card1)" stroke="#30363d" stroke-width="1"/>
+    <text x="20" y="40" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#8b949e">MODELS</text>
+    <text x="20" y="90" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="48" font-weight="700" fill="#58a6ff">4,587</text>
+    
+    <!-- Card 2: Providers -->
+    <rect x="280" y="0" width="260" height="120" rx="12" fill="url(#card1)" stroke="#30363d" stroke-width="1"/>
+    <text x="300" y="40" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#8b949e">PROVIDERS</text>
+    <text x="300" y="90" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="48" font-weight="700" fill="#bc8cff">95</text>
+    
+    <!-- Card 3: Free -->
+    <rect x="560" y="0" width="260" height="120" rx="12" fill="url(#card1)" stroke="#30363d" stroke-width="1"/>
+    <text x="580" y="40" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#8b949e">FREE MODELS</text>
+    <text x="580" y="90" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="48" font-weight="700" fill="#3fb950">81</text>
+    
+    <!-- Card 4: Open Weights -->
+    <rect x="840" y="0" width="260" height="120" rx="12" fill="url(#card1)" stroke="#30363d" stroke-width="1"/>
+    <text x="860" y="40" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#8b949e">OPEN WEIGHTS</text>
+    <text x="860" y="90" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="48" font-weight="700" fill="#f0883e">527</text>
+  </g>
+  
+  <!-- Capability badges -->
+  <g transform="translate(80, 400)">
+    <rect x="0" y="0" width="auto" height="36" rx="18" fill="#1a2332" stroke="#58a6ff" stroke-width="1"/>
+    <text x="16" y="24" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#58a6ff">🔧 2,350 Tool Calling</text>
+    
+    <rect x="200" y="0" width="auto" height="36" rx="18" fill="#1a2332" stroke="#bc8cff" stroke-width="1"/>
+    <text x="216" y="24" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#bc8cff">🧠 1,306 Reasoning</text>
+    
+    <rect x="410" y="0" width="auto" height="36" rx="18" fill="#1a2332" stroke="#3fb950" stroke-width="1"/>
+    <text x="426" y="24" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#3fb950">👁️ 1,487 Vision</text>
+    
+    <rect x="600" y="0" width="auto" height="36" rx="18" fill="#1a2332" stroke="#f0883e" stroke-width="1"/>
+    <text x="616" y="24" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#f0883e">📋 829 Structured Output</text>
+    
+    <rect x="830" y="0" width="auto" height="36" rx="18" fill="#1a2332" stroke="#f778ba" stroke-width="1"/>
+    <text x="846" y="24" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="14" fill="#f778ba">🤖 1,080 Agentic</text>
+  </g>
+  
+  <!-- Bottom section -->
+  <g transform="translate(80, 500)">
+    <text x="0" y="0" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="16" fill="#8b949e">First-party data · TypeScript types · Zod validation · Auto-scraped</text>
+    
+    <!-- Data format badges -->
+    <g transform="translate(0, 30)">
+      <rect x="0" y="0" width="70" height="28" rx="6" fill="#1a2332" stroke="#30363d"/>
+      <text x="10" y="19" font-family="monospace" font-size="13" fill="#8b949e">YAML</text>
+      
+      <rect x="80" y="0" width="70" height="28" rx="6" fill="#1a2332" stroke="#30363d"/>
+      <text x="90" y="19" font-family="monospace" font-size="13" fill="#8b949e">JSON</text>
+      
+      <rect x="160" y="0" width="60" height="28" rx="6" fill="#1a2332" stroke="#30363d"/>
+      <text x="170" y="19" font-family="monospace" font-size="13" fill="#8b949e">CSV</text>
+      
+      <rect x="230" y="0" width="70" height="28" rx="6" fill="#1a2332" stroke="#30363d"/>
+      <text x="240" y="19" font-family="monospace" font-size="13" fill="#8b949e">npm</text>
+      
+      <rect x="310" y="0" width="100" height="28" rx="6" fill="#1a2332" stroke="#30363d"/>
+      <text x="320" y="19" font-family="monospace" font-size="13" fill="#8b949e">GitHub Action</text>
+    </g>
+  </g>
+  
+  <!-- GitHub corner -->
+  <text x="1100" y="580" font-family="-apple-system,BlinkMacSystemFont,Segoe UI,Helvetica,Arial,sans-serif" font-size="16" fill="#8b949e">github.com/i-need-token/ai-models</text>
+  
+  <!-- Bottom accent bar -->
+  <rect x="0" y="636" width="1280" height="4" fill="url(#accent)"/>
+</svg>
\ No newline at end of file
diff --git a/site/state-of-ai-models.html b/site/state-of-ai-models.html
new file mode 100644
index 00000000..9aa53624
--- /dev/null
+++ b/site/state-of-ai-models.html
@@ -0,0 +1,729 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>State of AI Models 2025 — Data-Driven Report | AI Models Catalog</title>
+    <meta
+      name="description"
+      content="Data-driven report on the AI model landscape in 2025: 4,587 models across 95 providers, pricing trends, capability analysis, context window growth, and open-source adoption."
+    />
+    <link rel="canonical" href="https://i-need-token.github.io/ai-models/state-of-ai-models.html" />
+    <meta property="og:title" content="State of AI Models 2025 — Data-Driven Report" />
+    <meta
+      property="og:description"
+      content="4,587 models, 95 providers, 81 free models: a data-driven analysis of the AI model landscape in 2025."
+    />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="577" />
+    <meta property="og:type" content="article" />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "State of AI Models 2025",
+        "description": "Data-driven report on the AI model landscape: 4,587 models across 95 providers",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "publisher": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "url": "https://i-need-token.github.io/ai-models/state-of-ai-models.html"
+      }
+    </script>
+    <style>
+      :root {
+        --bg: #ffffff;
+        --text: #1a1a2e;
+        --text-secondary: #555;
+        --accent: #e94560;
+        --card-bg: #f8f9fa;
+        --border: #e0e0e0;
+        --hero-bg: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+      }
+      @media (prefers-color-scheme: dark) {
+        :root {
+          --bg: #0f0c29;
+          --text: #e0e0e0;
+          --text-secondary: #aaa;
+          --accent: #e94560;
+          --card-bg: #1a1a2e;
+          --border: #333;
+          --hero-bg: linear-gradient(135deg, #0f0c29, #302b63, #24243e);
+        }
+      }
+      * {
+        margin: 0;
+        padding: 0;
+        box-sizing: border-box;
+      }
+      body {
+        font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, sans-serif;
+        color: var(--text);
+        background: var(--bg);
+        line-height: 1.7;
+      }
+      .hero {
+        background: var(--hero-bg);
+        color: #fff;
+        padding: 60px 20px;
+        text-align: center;
+      }
+      .hero h1 {
+        font-size: 2.2em;
+        margin-bottom: 12px;
+      }
+      .hero p {
+        font-size: 1.1em;
+        opacity: 0.9;
+        max-width: 700px;
+        margin: 0 auto;
+      }
+      .container {
+        max-width: 900px;
+        margin: 0 auto;
+        padding: 30px 20px;
+      }
+      h2 {
+        color: var(--accent);
+        margin: 40px 0 16px;
+        font-size: 1.5em;
+        border-bottom: 2px solid var(--accent);
+        padding-bottom: 8px;
+      }
+      h3 {
+        margin: 24px 0 12px;
+        font-size: 1.2em;
+      }
+      p {
+        margin: 12px 0;
+        color: var(--text-secondary);
+      }
+      .stat-grid {
+        display: grid;
+        grid-template-columns: repeat(auto-fit, minmax(180px, 1fr));
+        gap: 16px;
+        margin: 24px 0;
+      }
+      .stat-card {
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 20px;
+        text-align: center;
+      }
+      .stat-card .number {
+        font-size: 2em;
+        font-weight: 800;
+        color: var(--accent);
+      }
+      .stat-card .label {
+        font-size: 0.85em;
+        color: var(--text-secondary);
+        margin-top: 4px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 0.9em;
+      }
+      th,
+      td {
+        padding: 10px 12px;
+        text-align: left;
+        border-bottom: 1px solid var(--border);
+      }
+      th {
+        background: var(--card-bg);
+        font-weight: 600;
+      }
+      tr:hover {
+        background: var(--card-bg);
+      }
+      .bar-chart {
+        margin: 16px 0;
+      }
+      .bar-row {
+        display: flex;
+        align-items: center;
+        margin: 6px 0;
+      }
+      .bar-label {
+        width: 140px;
+        font-size: 0.85em;
+        text-align: right;
+        padding-right: 12px;
+        color: var(--text-secondary);
+      }
+      .bar-fill {
+        height: 24px;
+        background: var(--accent);
+        border-radius: 4px;
+        min-width: 2px;
+        transition: width 0.3s;
+      }
+      .bar-value {
+        margin-left: 8px;
+        font-size: 0.85em;
+        font-weight: 600;
+      }
+      .insight {
+        background: var(--card-bg);
+        border-left: 4px solid var(--accent);
+        padding: 16px 20px;
+        margin: 20px 0;
+        border-radius: 0 8px 8px 0;
+      }
+      .insight strong {
+        color: var(--accent);
+      }
+      .related-pages {
+        margin: 40px 0;
+        padding: 20px 0;
+        border-top: 1px solid var(--border);
+      }
+      .related-pages a {
+        display: inline-block;
+        margin: 4px 8px 4px 0;
+        padding: 6px 14px;
+        background: var(--card-bg);
+        border: 1px solid var(--border);
+        border-radius: 20px;
+        text-decoration: none;
+        color: var(--text);
+        font-size: 0.85em;
+      }
+      .related-pages a:hover {
+        border-color: var(--accent);
+        color: var(--accent);
+      }
+      footer {
+        text-align: center;
+        padding: 30px;
+        color: var(--text-secondary);
+        font-size: 0.85em;
+        border-top: 1px solid var(--border);
+        margin-top: 40px;
+      }
+      footer a {
+        color: var(--accent);
+        text-decoration: none;
+      }
+      @media (max-width: 768px) {
+        .hero h1 {
+          font-size: 1.6em;
+        }
+        .stat-grid {
+          grid-template-columns: repeat(2, 1fr);
+        }
+        .bar-label {
+          width: 100px;
+          font-size: 0.75em;
+        }
+        table {
+          font-size: 0.8em;
+        }
+        th,
+        td {
+          padding: 6px 8px;
+        }
+      }
+      @media (max-width: 480px) {
+        .stat-grid {
+          grid-template-columns: 1fr 1fr;
+        }
+        .hero {
+          padding: 40px 16px;
+        }
+      }
+    </style>
+  </head>
+  <body>
+    <div class="hero">
+      <h1>📊 State of AI Models 2025</h1>
+      <p>
+        A data-driven analysis of 4,587 AI models across 95 providers — pricing trends, capability
+        adoption, context window growth, and the rise of open-source AI.
+      </p>
+    </div>
+    <div class="container">
+      <div class="stat-grid">
+        <div class="stat-card">
+          <div class="number">4,587</div>
+          <div class="label">Total Models</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">95</div>
+          <div class="label">Providers</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">81</div>
+          <div class="label">Free Models</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">527</div>
+          <div class="label">Open-Weight</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">2,350</div>
+          <div class="label">Tool Calling</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">1,306</div>
+          <div class="label">Reasoning</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">1,487</div>
+          <div class="label">Vision</div>
+        </div>
+        <div class="stat-card">
+          <div class="number">2,195</div>
+          <div class="label">128K+ Context</div>
+        </div>
+      </div>
+
+      <h2>1. Provider Landscape</h2>
+      <p>
+        The AI model ecosystem spans 95 providers, from tech giants to specialized startups. The top
+        15 providers account for the majority of models:
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Provider</th>
+            <th>Models</th>
+            <th>Notable Models</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>OpenRouter</td>
+            <td>415</td>
+            <td>Aggregator — routes to 100+ models</td>
+          </tr>
+          <tr>
+            <td>Google</td>
+            <td>261</td>
+            <td>Gemini 2.5 Pro/Flash, Gemma 3</td>
+          </tr>
+          <tr>
+            <td>Requesty</td>
+            <td>234</td>
+            <td>Aggregator — unified API</td>
+          </tr>
+          <tr>
+            <td>Cohere</td>
+            <td>197</td>
+            <td>Command R+, Embed v3</td>
+          </tr>
+          <tr>
+            <td>xAI</td>
+            <td>193</td>
+            <td>Grok 3, Grok 3 Mini</td>
+          </tr>
+          <tr>
+            <td>DeepSeek</td>
+            <td>184</td>
+            <td>DeepSeek R1, V3</td>
+          </tr>
+          <tr>
+            <td>Meta</td>
+            <td>163</td>
+            <td>Llama 4 Maverick/Scout</td>
+          </tr>
+          <tr>
+            <td>Mistral</td>
+            <td>155</td>
+            <td>Mistral Large, Codestral</td>
+          </tr>
+          <tr>
+            <td>Alibaba (Qwen)</td>
+            <td>139</td>
+            <td>Qwen3-235B, QwQ</td>
+          </tr>
+          <tr>
+            <td>Anthropic</td>
+            <td>121</td>
+            <td>Claude Sonnet 4, Opus 4</td>
+          </tr>
+          <tr>
+            <td>OpenAI</td>
+            <td>115</td>
+            <td>GPT-4.1, o3, o4-mini</td>
+          </tr>
+          <tr>
+            <td>Microsoft</td>
+            <td>99</td>
+            <td>Phi-4, Florence 2</td>
+          </tr>
+          <tr>
+            <td>Amazon</td>
+            <td>96</td>
+            <td>Nova Pro, Titan</td>
+          </tr>
+          <tr>
+            <td>NVIDIA</td>
+            <td>87</td>
+            <td>Nemotron, Llama Nemotron</td>
+          </tr>
+          <tr>
+            <td>01.ai</td>
+            <td>83</td>
+            <td>Yi-Lightning, Yi-VL</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> Aggregators (OpenRouter, Requesty) offer the widest selection
+        but may duplicate models available from first-party providers. For the best pricing, go
+        direct to the source.
+      </div>
+
+      <h2>2. Pricing Distribution</h2>
+      <p>
+        AI model pricing varies dramatically — from completely free to over $15 per million input
+        tokens. Here is the breakdown of the 4,587 models:
+      </p>
+      <div class="bar-chart">
+        <div class="bar-row">
+          <div class="bar-label">Free</div>
+          <div class="bar-fill" style="width: 81px"></div>
+          <div class="bar-value">81 models</div>
+        </div>
+        <div class="bar-row">
+          <div class="bar-label">&lt; $0.50/M</div>
+          <div class="bar-fill" style="width: 450px"></div>
+          <div class="bar-value">~1,800 models</div>
+        </div>
+        <div class="bar-row">
+          <div class="bar-label">$0.50–5/M</div>
+          <div class="bar-fill" style="width: 350px"></div>
+          <div class="bar-value">~1,400 models</div>
+        </div>
+        <div class="bar-row">
+          <div class="bar-label">&gt; $5/M</div>
+          <div class="bar-fill" style="width: 120px"></div>
+          <div class="bar-value">~480 models</div>
+        </div>
+      </div>
+      <div class="insight">
+        <strong>Key Insight:</strong> The median input price for tool-calling models is $0.50/M
+        tokens, while reasoning models median is $0.80/M. Vision-capable models average $1.50/M —
+        still affordable for most production use cases.
+      </div>
+
+      <h2>3. Capability Adoption</h2>
+      <p>
+        Modern AI models increasingly support advanced capabilities beyond basic text generation:
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Capability</th>
+            <th>Models</th>
+            <th>% of Total</th>
+            <th>Avg Input $/M</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Tool Calling</td>
+            <td>2,350</td>
+            <td>51.2%</td>
+            <td>$1.50</td>
+          </tr>
+          <tr>
+            <td>Reasoning</td>
+            <td>1,306</td>
+            <td>28.5%</td>
+            <td>$2.10</td>
+          </tr>
+          <tr>
+            <td>Structured Output</td>
+            <td>829</td>
+            <td>18.1%</td>
+            <td>$1.80</td>
+          </tr>
+          <tr>
+            <td>Vision (Image Input)</td>
+            <td>1,487</td>
+            <td>32.4%</td>
+            <td>$1.50</td>
+          </tr>
+          <tr>
+            <td>Open Weights</td>
+            <td>527</td>
+            <td>11.5%</td>
+            <td>Free or low-cost</td>
+          </tr>
+          <tr>
+            <td>Image Generation</td>
+            <td>28</td>
+            <td>0.6%</td>
+            <td>$3.00+</td>
+          </tr>
+          <tr>
+            <td>Audio Input</td>
+            <td>118</td>
+            <td>2.6%</td>
+            <td>$2.50+</td>
+          </tr>
+          <tr>
+            <td>Audio Output</td>
+            <td>34</td>
+            <td>0.7%</td>
+            <td>$3.00+</td>
+          </tr>
+          <tr>
+            <td>Video Input</td>
+            <td>167</td>
+            <td>3.6%</td>
+            <td>$2.00+</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> Over half of all models now support tool calling — it has
+        become table stakes for production AI. Reasoning capabilities are growing fast, with 1,306
+        models (28.5%) supporting extended thinking.
+      </div>
+
+      <h2>4. Context Window Revolution</h2>
+      <p>
+        Context windows have grown exponentially. The average context window across all models is
+        now approximately 200K tokens:
+      </p>
+      <div class="bar-chart">
+        <div class="bar-row">
+          <div class="bar-label">&lt; 32K</div>
+          <div class="bar-fill" style="width: 200px"></div>
+          <div class="bar-value">~800 models</div>
+        </div>
+        <div class="bar-row">
+          <div class="bar-label">32K–128K</div>
+          <div class="bar-fill" style="width: 250px"></div>
+          <div class="bar-value">~1,000 models</div>
+        </div>
+        <div class="bar-row">
+          <div class="bar-label">128K–1M</div>
+          <div class="bar-fill" style="width: 500px"></div>
+          <div class="bar-value">~2,195 models</div>
+        </div>
+        <div class="bar-row">
+          <div class="bar-label">1M+</div>
+          <div class="bar-fill" style="width: 80px"></div>
+          <div class="bar-value">~30 models</div>
+        </div>
+      </div>
+      <h3>Largest Context Windows</h3>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Context</th>
+            <th>Provider</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Google Gemini 2.5 Pro</td>
+            <td>1,048,576</td>
+            <td>Google</td>
+          </tr>
+          <tr>
+            <td>Google Gemini 2.5 Flash</td>
+            <td>1,048,576</td>
+            <td>Google</td>
+          </tr>
+          <tr>
+            <td>Meta Llama 4 Scout</td>
+            <td>10,000,000</td>
+            <td>Meta</td>
+          </tr>
+          <tr>
+            <td>Meta Llama 4 Maverick</td>
+            <td>1,048,576</td>
+            <td>Meta</td>
+          </tr>
+          <tr>
+            <td>Google Gemma 3 27B</td>
+            <td>131,072</td>
+            <td>Google</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> 128K+ context is now the norm — 2,195 models (47.8%) support
+        it. Meta's Llama 4 Scout leads with a 10M token window, making entire codebases and books
+        processable in a single prompt.
+      </div>
+
+      <h2>5. The Rise of Free &amp; Open-Source AI</h2>
+      <p>
+        81 models are completely free to use, and 527 have open weights. Here are the most capable
+        free models:
+      </p>
+      <table>
+        <thead>
+          <tr>
+            <th>Model</th>
+            <th>Context</th>
+            <th>Capabilities</th>
+            <th>Provider</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>Google Gemini 2.5 Flash</td>
+            <td>1M</td>
+            <td>TC, Reasoning, Vision, SO</td>
+            <td>Google</td>
+          </tr>
+          <tr>
+            <td>DeepSeek R1</td>
+            <td>128K</td>
+            <td>Reasoning, TC</td>
+            <td>DeepSeek</td>
+          </tr>
+          <tr>
+            <td>Meta Llama 4 Maverick</td>
+            <td>1M</td>
+            <td>TC, Vision</td>
+            <td>Meta</td>
+          </tr>
+          <tr>
+            <td>Alibaba Qwen3-235B</td>
+            <td>128K</td>
+            <td>TC, Reasoning, SO</td>
+            <td>Alibaba</td>
+          </tr>
+          <tr>
+            <td>Google Gemma 3 27B</td>
+            <td>131K</td>
+            <td>Vision, TC</td>
+            <td>Google</td>
+          </tr>
+        </tbody>
+      </table>
+      <div class="insight">
+        <strong>Key Insight:</strong> Free models now rival paid ones in capability. Google Gemini
+        2.5 Flash (free tier) offers 1M context, tool calling, reasoning, and vision — making it
+        viable for production use at zero cost.
+      </div>
+
+      <h2>6. Best Value Models by Use Case</h2>
+      <table>
+        <thead>
+          <tr>
+            <th>Use Case</th>
+            <th>Best Free</th>
+            <th>Best Paid (Cheapest)</th>
+            <th>Best Overall</th>
+          </tr>
+        </thead>
+        <tbody>
+          <tr>
+            <td>General Chat</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>DeepSeek V3 ($0.07/$0.28)</td>
+            <td>Claude Sonnet 4</td>
+          </tr>
+          <tr>
+            <td>Coding</td>
+            <td>DeepSeek R1</td>
+            <td>DeepSeek V3 ($0.07/$0.28)</td>
+            <td>Claude Sonnet 4</td>
+          </tr>
+          <tr>
+            <td>AI Agents</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Grok 3 Mini ($0.30/$0.50)</td>
+            <td>Claude Sonnet 4</td>
+          </tr>
+          <tr>
+            <td>Reasoning</td>
+            <td>DeepSeek R1</td>
+            <td>Grok 3 Mini ($0.30/$0.50)</td>
+            <td>o3</td>
+          </tr>
+          <tr>
+            <td>Vision</td>
+            <td>Gemini 2.5 Flash</td>
+            <td>Gemma 3 4B (free)</td>
+            <td>Gemini 2.5 Pro</td>
+          </tr>
+          <tr>
+            <td>Large Context</td>
+            <td>Llama 4 Scout (10M)</td>
+            <td>Gemini 2.5 Flash ($0.15/$0.60)</td>
+            <td>Gemini 2.5 Pro</td>
+          </tr>
+        </tbody>
+      </table>
+
+      <h2>7. Key Trends &amp; Predictions</h2>
+      <div class="insight">
+        <strong>Trend 1: Agentic AI is the new default.</strong> 51% of models support tool calling,
+        and 1,080 models are classified as "agentic" (tool_call + chat). Expect this to reach 80%+
+        by 2026.
+      </div>
+      <div class="insight">
+        <strong>Trend 2: Context windows are commoditized.</strong> 128K context is now standard.
+        1M+ context models are growing, with Google and Meta leading. Expect 10M+ to become common
+        by 2026.
+      </div>
+      <div class="insight">
+        <strong>Trend 3: Free tiers are production-ready.</strong> 81 free models with capabilities
+        like tool calling and reasoning mean that cost is no longer a barrier to entry for AI
+        development.
+      </div>
+      <div class="insight">
+        <strong>Trend 4: Multimodal is mainstream.</strong> 1,548 models support more than text
+        input. Vision (1,487 models) is nearly universal among flagship models. Audio and video are
+        the next frontiers.
+      </div>
+      <div class="insight">
+        <strong>Trend 5: Open weights are accelerating.</strong> 527 open-weight models exist, with
+        Meta's Llama 4 and Alibaba's Qwen3 leading. Expect open-source to match proprietary
+        capabilities within 6 months.
+      </div>
+
+      <div class="related-pages">
+        <strong>Explore More:</strong>
+        <a href="best-ai-models.html">Best AI Models</a>
+        <a href="free-ai-models.html">Free AI Models</a>
+        <a href="llm-pricing.html">LLM Pricing</a>
+        <a href="openai-alternatives.html">OpenAI Alternatives</a>
+        <a href="context-window-comparison.html">Context Windows</a>
+        <a href="reasoning-models-comparison.html">Reasoning Models</a>
+        <a href="tool-calling-models-comparison.html">Tool Calling</a>
+        <a href="cheapest-ai-models.html">Cheapest Models</a>
+        <a href="open-source-ai-models.html">Open Source</a>
+        <a href="multimodal-ai-models.html">Multimodal</a>
+        <a href="best-ai-models-for-coding.html">Coding Models</a>
+        <a href="best-ai-models-for-agents.html">Agent Models</a>
+        <a href="ai-model-pricing-calculator.html">Price Calculator</a>
+        <a href="index.html">Interactive Catalog</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+      </div>
+    </div>
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from
+        <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a>
+        — 4,587 models across 95 providers. Updated continuously.
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/structured-output-models-comparison.html b/site/structured-output-models-comparison.html
new file mode 100644
index 00000000..da0b060d
--- /dev/null
+++ b/site/structured-output-models-comparison.html
@@ -0,0 +1,742 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      Structured Output AI Models — JSON Mode, Function Calling Compared (2025) | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare 829 AI models with structured output / JSON mode support. GPT-4o, Claude, Gemini, and more — pricing, context windows, and capabilities."
+    />
+    <meta
+      name="keywords"
+      content="structured output AI model, JSON mode LLM, function calling model, structured output comparison, AI JSON response, LLM structured output 2025"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+    />
+    <meta
+      property="og:title"
+      content="Structured Output AI Models — JSON Mode, Function Calling Compared (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare 829 AI models with structured output / JSON mode support with pricing and capabilities."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="Structured Output AI Models — JSON Mode, Function Calling Compared (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare 829 AI models with structured output / JSON mode support."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Structured Output AI Models — JSON Mode, Function Calling Compared (2025)",
+        "description": "Compare 829 AI models with structured output / JSON mode support.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>📋 Structured Output AI Models (2025)</h1>
+    <p>
+      Compare 829 AI models with structured output / JSON mode support. GPT-4o, Claude, Gemini, and
+      more — real pricing and capabilities from <b>first-party data</b>.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>829</b><small>Structured Output Models</small></div>
+      <div class="stat"><b>780</b><small>SO + Tool Calling</small></div>
+      <div class="stat"><b>672</b><small>SO + Reasoning</small></div>
+      <div class="stat"><b>4,587</b><small>Total Models</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 What is structured output?</strong> Structured output (also called JSON mode)
+      allows LLMs to generate responses in a specific schema — JSON, XML, or other formats. This is
+      essential for building reliable AI applications that parse model outputs programmatically.
+    </div>
+
+    <h2>🏆 Flagship Structured Output Models — Head to Head</h2>
+    <p>
+      The top-tier models from each major provider, all supporting structured output with tool
+      calling.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gpt-4o</b></td>
+        <td>openai</td>
+        <td>$2.50</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>o3</b></td>
+        <td>openai</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o4-mini</b></td>
+        <td>openai</td>
+        <td>$1.10</td>
+        <td>$4.40</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-opus-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>$15</td>
+        <td>$75</td>
+        <td>200K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-pro</b></td>
+        <td>google</td>
+        <td>$1.25</td>
+        <td>$10</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>deepseek</td>
+        <td>$0.55</td>
+        <td>$2.19</td>
+        <td>128K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>grok-3</b></td>
+        <td>xai</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>131K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$0.14</td>
+        <td>$0.42</td>
+        <td>128K</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama4-maverick</b></td>
+        <td>meta</td>
+        <td>$0.20</td>
+        <td>$0.80</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>💰 Cheapest Structured Output Models</h2>
+    <p>
+      Most affordable models with structured output — ideal for high-volume production applications.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash-lite</b></td>
+        <td>google</td>
+        <td>$0.075</td>
+        <td>$0.30</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$0.14</td>
+        <td>$0.42</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama4-maverick</b></td>
+        <td>meta</td>
+        <td>$0.20</td>
+        <td>$0.80</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-chat</b></td>
+        <td>deepseek</td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🆓 Free Structured Output Models</h2>
+    <p>
+      Structured output models available at zero cost — perfect for prototyping JSON-mode
+      applications.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>1M</td>
+        <td>✅</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama4-scout-17b-16e</b></td>
+        <td>meta</td>
+        <td>10M</td>
+        <td></td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b</b></td>
+        <td>alibaba</td>
+        <td>128K</td>
+        <td></td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🤖 Structured Output + Tool Calling</h2>
+    <p>
+      780 models that support both structured output and tool calling — the ideal combination for
+      building AI agents that return structured data from function calls.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash-lite</b></td>
+        <td>google</td>
+        <td>$0.075</td>
+        <td>$0.30</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$0.14</td>
+        <td>$0.42</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>grok-3-mini</b></td>
+        <td>xai</td>
+        <td>$0.30</td>
+        <td>$0.50</td>
+        <td>131K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🧠 Structured Output + Reasoning</h2>
+    <p>
+      672 models with both structured output and reasoning capabilities — for complex tasks that
+      require both thinking and structured responses.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Tool Call</th>
+      </tr>
+      <tr>
+        <td><b>gemini-2.5-flash</b></td>
+        <td>google</td>
+        <td>$0.15</td>
+        <td>$0.60</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$0.14</td>
+        <td>$0.42</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>deepseek-chat</b></td>
+        <td>deepseek</td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-r1</b></td>
+        <td>deepseek</td>
+        <td>$0.55</td>
+        <td>$2.19</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>o4-mini</b></td>
+        <td>openai</td>
+        <td>$1.10</td>
+        <td>$4.40</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o3</b></td>
+        <td>openai</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>claude-sonnet-4-20250514</b></td>
+        <td>anthropic</td>
+        <td>$3</td>
+        <td>$15</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🔑 Choosing the Right Structured Output Model</h2>
+    <table>
+      <tr>
+        <th>Use Case</th>
+        <th>Recommended Model</th>
+        <th>Why</th>
+      </tr>
+      <tr>
+        <td><b>API response parsing</b></td>
+        <td>gpt-4o-mini</td>
+        <td>Cheapest with SO + tool calling</td>
+      </tr>
+      <tr>
+        <td><b>Data extraction</b></td>
+        <td>gemini-2.5-flash</td>
+        <td>1M context + SO + reasoning + cheap</td>
+      </tr>
+      <tr>
+        <td><b>AI agents</b></td>
+        <td>claude-sonnet-4</td>
+        <td>Best tool calling + SO + reasoning</td>
+      </tr>
+      <tr>
+        <td><b>High volume / cheap</b></td>
+        <td>gemini-2.0-flash-lite</td>
+        <td>Lowest cost at $0.075/M input</td>
+      </tr>
+      <tr>
+        <td><b>Complex reasoning</b></td>
+        <td>o3</td>
+        <td>Best reasoning + SO + tool calling</td>
+      </tr>
+      <tr>
+        <td><b>Prototyping</b></td>
+        <td>gemini-2.5-flash</td>
+        <td>Free tier, 1M context, all capabilities</td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b>. Models are identified by having
+      <code>structured_output: true</code> in their metadata. Aggregator providers are excluded from
+      ranking tables to avoid duplicate models. Pricing is per million tokens.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+          >Tool Calling Models Comparison</a
+        >
+        — function calling LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        — star, fork, contribute
+      </li>
+    </ul>
+
+    <a href="small-language-models.html">Small Language Models</a>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/tool-calling-models-comparison.html b/site/tool-calling-models-comparison.html
new file mode 100644
index 00000000..e254f07d
--- /dev/null
+++ b/site/tool-calling-models-comparison.html
@@ -0,0 +1,1118 @@
+<!doctype html>
+<html lang="en">
+  <head>
+    <meta charset="UTF-8" />
+    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
+    <title>
+      Tool Calling AI Models Compared — Function Calling LLMs (2025) | AI Models Catalog
+    </title>
+    <meta
+      name="description"
+      content="Compare AI models with tool/function calling: GPT-4o, Claude, Gemini, DeepSeek. 2,350 tool-calling models with pricing, context windows, and capabilities."
+    />
+    <meta
+      name="keywords"
+      content="tool calling LLM, function calling model, AI agent model, best model for agents, tool use LLM, GPT function calling, Claude tool use, Gemini function calling"
+    />
+    <link
+      rel="canonical"
+      href="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+    />
+    <meta
+      property="og:title"
+      content="Tool Calling AI Models Compared — Function Calling LLMs (2025)"
+    />
+    <meta
+      property="og:description"
+      content="Compare AI models with tool/function calling. 2,350 tool-calling models with pricing and capabilities."
+    />
+    <meta property="og:type" content="article" />
+    <meta
+      property="og:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta property="og:image:width" content="1280" />
+    <meta property="og:image:height" content="640" />
+    <meta
+      name="twitter:image"
+      content="https://raw.githubusercontent.com/i-need-token/ai-models/main/docs/images/social-preview.png"
+    />
+    <meta
+      property="og:url"
+      content="https://i-need-token.github.io/ai-models/tool-calling-models-comparison.html"
+    />
+    <meta name="twitter:card" content="summary_large_image" />
+    <meta
+      name="twitter:title"
+      content="Tool Calling AI Models Compared — Function Calling LLMs (2025)"
+    />
+    <meta
+      name="twitter:description"
+      content="Compare AI models with tool/function calling. 2,350 tool-calling models."
+    />
+    <style>
+      :root {
+        --bg: #0d1117;
+        --surface: #161b22;
+        --border: #30363d;
+        --text: #e6edf3;
+        --text2: #8b949e;
+        --accent: #58a6ff;
+        --green: #3fb950;
+        --orange: #f0883e;
+      }
+      * {
+        box-sizing: border-box;
+      }
+      body {
+        font-family:
+          -apple-system,
+          BlinkMacSystemFont,
+          Segoe UI,
+          Helvetica,
+          Arial,
+          sans-serif;
+        background: var(--bg);
+        color: var(--text);
+        margin: 0;
+        padding: 20px;
+        max-width: 960px;
+        margin: 0 auto;
+        line-height: 1.6;
+      }
+      h1 {
+        font-size: 2rem;
+        margin-top: 40px;
+      }
+      h2 {
+        font-size: 1.4rem;
+        color: var(--accent);
+        margin-top: 40px;
+        border-bottom: 1px solid var(--border);
+        padding-bottom: 8px;
+      }
+      table {
+        width: 100%;
+        border-collapse: collapse;
+        margin: 16px 0;
+        font-size: 14px;
+      }
+      th {
+        background: var(--surface);
+        padding: 8px 12px;
+        text-align: left;
+        border-bottom: 2px solid var(--border);
+        color: var(--text2);
+        font-size: 12px;
+        text-transform: uppercase;
+      }
+      td {
+        padding: 6px 12px;
+        border-bottom: 1px solid var(--border);
+      }
+      tr:hover td {
+        background: var(--surface);
+      }
+      .cta {
+        display: inline-block;
+        background: linear-gradient(135deg, #f0883e, #db6d28);
+        color: #fff;
+        padding: 10px 24px;
+        border-radius: 8px;
+        text-decoration: none;
+        font-weight: 600;
+        margin: 16px 4px;
+      }
+      .cta:hover {
+        opacity: 0.9;
+      }
+      .stat {
+        display: inline-block;
+        background: var(--surface);
+        border: 1px solid var(--border);
+        border-radius: 8px;
+        padding: 12px 20px;
+        margin: 4px;
+        text-align: center;
+      }
+      .stat b {
+        display: block;
+        font-size: 1.5rem;
+        color: var(--accent);
+      }
+      .stat small {
+        color: var(--text2);
+      }
+      .tip {
+        background: rgba(63, 185, 80, 0.08);
+        border: 1px solid rgba(63, 185, 80, 0.2);
+        border-radius: 8px;
+        padding: 16px;
+        margin: 16px 0;
+      }
+      footer {
+        margin-top: 60px;
+        padding-top: 20px;
+        border-top: 1px solid var(--border);
+        color: var(--text2);
+        font-size: 13px;
+      }
+      footer a {
+        color: var(--accent);
+      }
+
+      @media (max-width: 768px) {
+        body {
+          padding: 12px;
+        }
+        h1 {
+          font-size: 1.4rem;
+        }
+        h2 {
+          font-size: 1.2rem;
+        }
+        table {
+          font-size: 12px;
+          display: block;
+          overflow-x: auto;
+          -webkit-overflow-scrolling: touch;
+        }
+        th,
+        td {
+          padding: 4px 8px;
+        }
+        .stat {
+          padding: 8px 12px;
+        }
+        .stat b {
+          font-size: 1.2rem;
+        }
+        .compare-grid {
+          grid-template-columns: 1fr;
+        }
+        .calc-box {
+          padding: 16px;
+        }
+      }
+      @media (max-width: 480px) {
+        h1 {
+          font-size: 1.2rem;
+        }
+        .stat b {
+          font-size: 1rem;
+        }
+        .cta {
+          padding: 8px 16px;
+          font-size: 14px;
+        }
+      }
+    </style>
+    <script type="application/ld+json">
+      {
+        "@context": "https://schema.org",
+        "@type": "Article",
+        "headline": "Tool Calling AI Models Compared — Function Calling LLMs (2025)",
+        "description": "Compare AI models with tool/function calling. 2,350 tool-calling models with pricing and capabilities.",
+        "author": { "@type": "Organization", "name": "AI Models Catalog" },
+        "datePublished": "2025-05-21",
+        "dateModified": "2025-05-21"
+      }
+    </script>
+  </head>
+  <body>
+    <h1>🔧 Tool Calling AI Models Compared (2025)</h1>
+    <p>
+      Compare <b>2,350</b> AI models with tool/function calling across 95 providers. Find the best
+      model for agents, automation, and API integration.
+    </p>
+
+    <div style="display: flex; flex-wrap: wrap; gap: 8px; margin: 16px 0">
+      <div class="stat"><b>2,350</b><small>Tool Calling Models</small></div>
+      <div class="stat"><b>95</b><small>Providers</small></div>
+      <div class="stat"><b>81</b><small>Free</small></div>
+      <div class="stat"><b>527</b><small>Open Weights</small></div>
+    </div>
+
+    <a class="cta" href="https://i-need-token.github.io/ai-models/">🔍 Interactive Catalog</a>
+    <a
+      class="cta"
+      href="https://github.com/i-need-token/ai-models"
+      style="background: linear-gradient(135deg, #58a6ff, #388bfd)"
+      >⭐ Star on GitHub</a
+    >
+
+    <div class="tip">
+      <strong>💡 What is tool calling?</strong> Tool calling (also called function calling) lets
+      LLMs invoke external APIs, databases, and services. This is the foundation of AI agents —
+      without tool calling, a model can only generate text. With it, models can search the web, run
+      code, query databases, and take real-world actions.
+    </div>
+
+    <h2>🏆 Flagship Tool Calling Models — Head to Head</h2>
+    <p>The top models with tool calling compared side by side.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>gpt-4o</b></td>
+        <td>openai</td>
+        <td>$2.5</td>
+        <td>$10</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4o-mini</b></td>
+        <td>openai</td>
+        <td>$0.15</td>
+        <td>$0.6</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1</b></td>
+        <td>openai</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1-mini</b></td>
+        <td>openai</td>
+        <td>$0.4</td>
+        <td>$1.6</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-4.1-nano</b></td>
+        <td>openai</td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>o3</b></td>
+        <td>openai</td>
+        <td>$10</td>
+        <td>$40</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o3-mini</b></td>
+        <td>openai</td>
+        <td>$1.1</td>
+        <td>$4.4</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>o4-mini</b></td>
+        <td>openai</td>
+        <td>$1.1</td>
+        <td>$4.4</td>
+        <td>200K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash</b></td>
+        <td>google</td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek-chat</b></td>
+        <td>deepseek</td>
+        <td>$0.14</td>
+        <td>$0.28</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen3-235b-a22b</b></td>
+        <td>alibaba</td>
+        <td>$2</td>
+        <td>$8</td>
+        <td>?</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>llama-4-maverick</b></td>
+        <td>digitalocean</td>
+        <td>$0.25</td>
+        <td>$0.87</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-4-scout</b></td>
+        <td>google-vertex</td>
+        <td>$0.25</td>
+        <td>$0.7</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>💰 Cheapest Tool Calling Models</h2>
+    <p>Most affordable models with tool calling — for cost-sensitive agents and automation.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>$0.01</td>
+        <td>$0.03</td>
+        <td>262K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>$0.01</td>
+        <td>$0.01</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>$0.015</td>
+        <td>$0.02</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>$0.017</td>
+        <td>$0.112</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.03</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>$0.02</td>
+        <td>$0.05</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td>$0.03</td>
+        <td>$0.15</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>togetherai</td>
+        <td>$0.03</td>
+        <td>$0.12</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon</td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon-bedrock</td>
+        <td>$0.035</td>
+        <td>$0.14</td>
+        <td>128K</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-12b-instruct--fp-8</b></td>
+        <td>inferencenet</td>
+        <td>$0.0375</td>
+        <td>$0.1</td>
+        <td>131K</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🆓 Free Tool Calling Models</h2>
+    <p>54 models with tool calling at zero cost — perfect for prototyping agents.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>openrouter--owl-alpha</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>deepseek--deepseek-v4-flash--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-coder--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-super-120b-a12b--free</b></td>
+        <td>openrouter</td>
+        <td>1M</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-26b-a4b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>gemma-4-31b-it</b></td>
+        <td>auriko</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>arcee-ai--trinity-large-thinking--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-26b-a4b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it--free</b></td>
+        <td>openrouter</td>
+        <td>262K</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>nvidia--nemotron-3-nano-omni-30b-a3b-reasoning--free</b></td>
+        <td>openrouter</td>
+        <td>256K</td>
+        <td>✅</td>
+      </tr>
+    </table>
+
+    <h2>🔓 Open-Weight Tool Calling Models</h2>
+    <p>278 models with tool calling you can run locally — for privacy-first agents.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>google--gemma-4-31b-it</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash-2026-02-23</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.5-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash-2026-04-16</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3.6-flash</b></td>
+        <td>orcarouter</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-maverick-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>meta-llama-4-scout-17b</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-1</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2-5</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>minimax-m2</b></td>
+        <td>amazon-bedrock</td>
+        <td>1M</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>🧠 Tool Calling + Reasoning</h2>
+    <p>
+      Models with both tool calling and reasoning — the most capable for complex agentic workflows
+      that need planning and execution.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-20b</b></td>
+        <td>neuralwatt</td>
+        <td>$0.03</td>
+        <td>$0.16</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>$0.03</td>
+        <td>$0.03</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>inferencenet</td>
+        <td>$0.05</td>
+        <td>$0.45</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>qwen3-30b-a3b-fp8</b></td>
+        <td>cloudflare</td>
+        <td>$0.051</td>
+        <td>$0.335</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>glm-4.7-flash</b></td>
+        <td>cloudflare</td>
+        <td>$0.06</td>
+        <td>$0.4</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>hermes-4-llama-3.1-8b</b></td>
+        <td>nousresearch</td>
+        <td>$0.06</td>
+        <td>$0.12</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>seed-1.6-flash</b></td>
+        <td>bytedance</td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>ring-2.6-1t</b></td>
+        <td>inclusionai</td>
+        <td>$0.07</td>
+        <td>$0.62</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>zai-org--glm-4.7-flash</b></td>
+        <td>novitaai</td>
+        <td>$0.07</td>
+        <td>$0.4</td>
+        <td>200K</td>
+      </tr>
+      <tr>
+        <td><b>microsoft-phi-4-mini-reasoning</b></td>
+        <td>microsoft</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3-32B-TEE</b></td>
+        <td>chutes</td>
+        <td>$0.08</td>
+        <td>$0.24</td>
+        <td>40K</td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-120b</b></td>
+        <td>clarifai</td>
+        <td>$0.09</td>
+        <td>$0.36</td>
+        <td>131K</td>
+      </tr>
+    </table>
+
+    <h2>👁️ Tool Calling + Vision</h2>
+    <p>Models with tool calling and image understanding — for agents that need to see and act.</p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Input $/1M</th>
+        <th>Output $/1M</th>
+        <th>Context</th>
+      </tr>
+      <tr>
+        <td><b>Qwen--Qwen3.6-35B-A3B</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>qwen3.6-35b-fast</b></td>
+        <td>neuralwatt</td>
+        <td>$0.05</td>
+        <td>$0.1</td>
+        <td>?</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-oss-120b</b></td>
+        <td>novitaai</td>
+        <td>$0.05</td>
+        <td>$0.25</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-lite</b></td>
+        <td>amazon</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>300K</td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-lite</b></td>
+        <td>amazon-bedrock</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>300K</td>
+      </tr>
+      <tr>
+        <td><b>Nemotron-3-Nano-Omni</b></td>
+        <td>nebius</td>
+        <td>$0.06</td>
+        <td>$0.24</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>openai--gpt-5-nano</b></td>
+        <td>aimlapi</td>
+        <td>$0.065</td>
+        <td>$0.52</td>
+        <td>400K</td>
+      </tr>
+      <tr>
+        <td><b>seed-1.6-flash</b></td>
+        <td>bytedance</td>
+        <td>$0.07</td>
+        <td>$0.3</td>
+        <td>262K</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash-8b</b></td>
+        <td>google</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>gemini-1.5-flash</b></td>
+        <td>google</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2.0-flash-lite</b></td>
+        <td>google</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>gemini-2-0-flash-lite</b></td>
+        <td>google-vertex</td>
+        <td>$0.075</td>
+        <td>$0.3</td>
+        <td>1M</td>
+      </tr>
+      <tr>
+        <td><b>microsoft-phi-4-mini-multimodal</b></td>
+        <td>microsoft</td>
+        <td>$0.08</td>
+        <td>$0.32</td>
+        <td>128K</td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-vl-8b-instruct</b></td>
+        <td>novitaai</td>
+        <td>$0.08</td>
+        <td>$0.5</td>
+        <td>131K</td>
+      </tr>
+      <tr>
+        <td><b>seed-2.0-mini</b></td>
+        <td>bytedance</td>
+        <td>$0.1</td>
+        <td>$0.4</td>
+        <td>262K</td>
+      </tr>
+    </table>
+
+    <h2>📏 Tool Calling + Large Context (128K+)</h2>
+    <p>
+      Models with tool calling and large context windows — for agents processing long documents or
+      complex multi-step tasks.
+    </p>
+    <table>
+      <tr>
+        <th>Model</th>
+        <th>Provider</th>
+        <th>Context</th>
+        <th>Input $/1M</th>
+        <th>Reasoning</th>
+      </tr>
+      <tr>
+        <td><b>ling-2.6-flash</b></td>
+        <td>inclusionai</td>
+        <td>262K</td>
+        <td>$0.01</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>bdc-coder</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.01</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.1-8B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>131K</td>
+        <td>$0.015</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>granite-4.0-h-micro</b></td>
+        <td>cloudflare</td>
+        <td>131K</td>
+        <td>$0.017</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>llama-3.1-8b-instruct--fp-16</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-3b</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-v3</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.02</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>gpt-oss-20b</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>schematron-v2-turbo</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>qwen--qwen3-4b-fp8</b></td>
+        <td>novitaai</td>
+        <td>128K</td>
+        <td>$0.03</td>
+        <td>✅</td>
+      </tr>
+      <tr>
+        <td><b>liquid-ai--LFM2-24B-A2B</b></td>
+        <td>togetherai</td>
+        <td>131K</td>
+        <td>$0.03</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon</td>
+        <td>128K</td>
+        <td>$0.035</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>amazon-nova-micro</b></td>
+        <td>amazon-bedrock</td>
+        <td>128K</td>
+        <td>$0.035</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>mistral-nemo-12b-instruct--fp-8</b></td>
+        <td>inferencenet</td>
+        <td>131K</td>
+        <td>$0.0375</td>
+        <td></td>
+      </tr>
+      <tr>
+        <td><b>klusterai--Meta-Llama-3.3-70B-Instruct-Turbo</b></td>
+        <td>klusterai</td>
+        <td>131K</td>
+        <td>$0.038</td>
+        <td></td>
+      </tr>
+    </table>
+
+    <h2>📊 Methodology</h2>
+    <p>
+      All data is sourced from <b>first-party APIs</b>. Tool calling capability is defined by the
+      provider's own classification — models that support function/tool calling via their API.
+      Aggregator providers are excluded from ranking tables to avoid duplicate models.
+    </p>
+
+    <h2>🔗 More Resources</h2>
+    <ul>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/">Interactive Catalog</a> — search,
+        filter, compare all models
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-model-pricing-calculator.html"
+          >AI Model Pricing Calculator</a
+        >
+        — LLM cost calculator
+      </li>
+
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-agents.html"
+          >Best AI Models for Agents</a
+        >
+        — agentic model comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models.html">Best AI Models</a> —
+        curated by use case
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-coding.html"
+          >Best AI Models for Coding</a
+        >
+        — code-focused comparison
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/reasoning-models-comparison.html"
+          >Reasoning Models Comparison</a
+        >
+        — o1, R1, Claude, Gemini
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/free-ai-models.html">Free AI Models</a> —
+        81 models at zero cost
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/llm-pricing.html"
+          >LLM Pricing Comparison</a
+        >
+        — detailed pricing tables
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/cheapest-ai-models.html"
+          >Cheapest AI Models</a
+        >
+        — lowest price LLMs
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/openai-alternatives.html"
+          >OpenAI Alternatives</a
+        >
+        — 95 providers compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/ai-models-by-provider.html"
+          >AI Models by Provider</a
+        >
+        — browse by provider
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/context-window-comparison.html"
+          >Context Window Comparison</a
+        >
+        — largest context LLMs
+      </li>
+      <li>
+        <a href="https://github.com/i-need-token/ai-models">GitHub Repository</a>
+        <a href="open-source-ai-models.html">🔓 Open Source AI Models (527 models)</a>
+        <a href="multimodal-ai-models.html">🎨 Multimodal AI Models (1,548 models)</a>
+        <a href="state-of-ai-models.html">State of AI Models 2025</a>
+        <a href="ai-model-benchmarks.html">Benchmarks</a>
+        — star, fork, contribute
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-image-generation.html"
+          >Best AI Models for Image Generation</a
+        >
+        — DALL·E, Imagen, GPT-5 Image compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/best-ai-models-for-vision.html"
+          >Best AI Models for Vision</a
+        >
+        — GPT-4o, Claude, Gemini vision compared
+      </li>
+      <li>
+        <a href="https://i-need-token.github.io/ai-models/structured-output-models-comparison.html"
+          >Structured Output Models Comparison</a
+        >
+        — JSON mode, function calling compared
+      </li>
+    </ul>
+
+    <p><a href="small-language-models.html">Small Language Models</a></p>
+    <p><a href="ai-model-picker.html">🎯 AI Model Picker</a></p>
+    <p><a href="ai-model-github-action.html">⚡ GitHub Action</a></p>
+    <footer>
+      <p>
+        Data from <a href="https://github.com/i-need-token/ai-models">AI Models Catalog</a> — 4,587
+        models, 95 providers, first-party data.
+      </p>
+      <p>
+        Last updated: 2025-05-21.
+        <a href="https://github.com/i-need-token/ai-models">View on GitHub</a>
+      </p>
+    </footer>
+  </body>
+</html>
diff --git a/site/twitter-thread.md b/site/twitter-thread.md
new file mode 100644
index 00000000..336f66c3
--- /dev/null
+++ b/site/twitter-thread.md
@@ -0,0 +1,91 @@
+# Twitter/X Thread Template
+
+## Thread: AI Models Catalog Launch
+
+1/ 🤯 I just cataloged every major AI model on the market.
+
+4,587 models. 95 providers. All with pricing, context windows, and capabilities.
+
+And it's all open source. Let me show you what I built 👇
+
+2/ The problem: Every week a new AI model launches. Every month a new provider.
+
+Keeping track of pricing, context windows, and capabilities across 95 websites is impossible.
+
+So I automated it. All data scraped from first-party APIs.
+
+3/ Every model has structured YAML with:
+
+- 💰 Pricing (input, output, cache)
+- 📏 Context window & max output
+- 🔧 Tool calling, reasoning, structured output
+- 👁️ Vision, audio, video capabilities
+- 🆓 Free/open weights status
+
+4/ The numbers:
+
+- 4,587 models across 95 providers
+- 2,350 with tool calling
+- 1,306 reasoning models
+- 81 completely free
+- 527 with open weights
+
+5/ But here's the best part — the interactive catalog:
+
+🔍 Search and filter 4,587 models
+💰 Price calculator — enter your tokens/month, see monthly costs
+🎯 Model picker — answer 2 questions, get top 5 recommendations
+⚖️ Side-by-side comparison of any 2-3 models
+
+Try it: i-need-token.github.io/ai-models
+
+6/ Need the cheapest model with 128K+ context and tool calling?
+
+Or the best free model for coding?
+
+The Model Picker answers these in 2 clicks.
+
+7/ All data is machine-readable:
+
+- YAML source with TypeScript types + Zod validation
+- JSON & CSV downloads
+- npm package (npm install ai-models)
+- GitHub Action for CI/CD
+- Hugging Face dataset
+
+8/ 68 documentation pages covering:
+
+- Free models guide (81 free models!)
+- OpenAI alternatives (70+ compatible providers)
+- Agentic models (1,080 with tool calling + reasoning)
+- Code models, vision models, audio models
+- Pricing comparison, context windows, and more
+
+9/ Quick start:
+
+curl -sL https://github.com/i-need-token/ai-models/releases/latest/download/models.json | jq '.models | length'
+
+# → 4587
+
+Or as a GitHub Action:
+
+- uses: i-need-token/ai-models@v0.2.0
+
+10/ If you're building with AI models, this saves you hours of research.
+
+⭐ Star the repo: github.com/i-need-token/ai-models
+🔍 Try the catalog: i-need-token.github.io/ai-models
+📖 Read the docs: github.com/i-need-token/ai-models/tree/main/docs
+
+What would you like to see next? 🙏
+
+---
+
+## Single Tweet Version
+
+I built a catalog of 4,587 AI models across 95 providers — all with structured pricing, context windows, and capabilities.
+
+Free, open source, machine-readable. With an interactive catalog that has a price calculator, model picker, and comparison tool.
+
+⭐ github.com/i-need-token/ai-models
+🔍 i-need-token.github.io/ai-models
diff --git a/social-preview.svg b/social-preview.svg
new file mode 100644
index 00000000..5b7a630a
--- /dev/null
+++ b/social-preview.svg
@@ -0,0 +1,84 @@
+<svg xmlns="http://www.w3.org/2000/svg" width="1280" height="640" viewBox="0 0 1280 640">
+  <defs>
+    <linearGradient id="bg" x1="0%" y1="0%" x2="100%" y2="100%">
+      <stop offset="0%" style="stop-color:#0d1117"/>
+      <stop offset="50%" style="stop-color:#161b22"/>
+      <stop offset="100%" style="stop-color:#0d1117"/>
+    </linearGradient>
+    <linearGradient id="accent" x1="0%" y1="0%" x2="100%" y2="0%">
+      <stop offset="0%" style="stop-color:#58a6ff"/>
+      <stop offset="50%" style="stop-color:#bc8cff"/>
+      <stop offset="100%" style="stop-color:#f778ba"/>
+    </linearGradient>
+    <linearGradient id="card" x1="0%" y1="0%" x2="0%" y2="100%">
+      <stop offset="0%" style="stop-color:#1c2333"/>
+      <stop offset="100%" style="stop-color:#161b22"/>
+    </linearGradient>
+  </defs>
+
+  <!-- Background -->
+  <rect width="1280" height="640" fill="url(#bg)"/>
+
+  <!-- Top accent bar -->
+  <rect x="0" y="0" width="1280" height="5" fill="url(#accent)"/>
+
+  <!-- Emoji icon -->
+  <text x="640" y="90" text-anchor="middle" fill="#ffffff" font-size="48">🤖</text>
+
+  <!-- Title -->
+  <text x="640" y="140" text-anchor="middle" fill="#ffffff" font-family="system-ui, -apple-system, sans-serif" font-size="52" font-weight="700">AI Models Catalog</text>
+
+  <!-- Subtitle -->
+  <text x="640" y="175" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="22">The most comprehensive structured catalog of AI models on GitHub</text>
+
+  <!-- Stats cards row -->
+  <rect x="60" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="180" y="268" text-anchor="middle" fill="#58a6ff" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">4,587</text>
+  <text x="180" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Models</text>
+
+  <rect x="320" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="440" y="268" text-anchor="middle" fill="#bc8cff" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">95</text>
+  <text x="440" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Providers</text>
+
+  <rect x="580" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="700" y="268" text-anchor="middle" fill="#f778ba" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">2,350</text>
+  <text x="700" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Tool Calling</text>
+
+  <rect x="840" y="220" width="240" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="960" y="268" text-anchor="middle" fill="#7ee787" font-family="system-ui, -apple-system, sans-serif" font-size="42" font-weight="700">1,306</text>
+  <text x="960" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="16">Reasoning</text>
+
+  <rect x="1100" y="220" width="120" height="100" rx="12" fill="url(#card)" stroke="#30363d" stroke-width="1"/>
+  <text x="1160" y="268" text-anchor="middle" fill="#ffa657" font-family="system-ui, -apple-system, sans-serif" font-size="36" font-weight="700">81</text>
+  <text x="1160" y="298" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="14">Free</text>
+
+  <!-- Capability pills -->
+  <rect x="180" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#58a6ff" stroke-width="1"/>
+  <text x="260" y="392" text-anchor="middle" fill="#58a6ff" font-family="system-ui, -apple-system, sans-serif" font-size="14">Pricing</text>
+
+  <rect x="360" y="370" width="180" height="32" rx="16" fill="#1c2333" stroke="#bc8cff" stroke-width="1"/>
+  <text x="450" y="392" text-anchor="middle" fill="#bc8cff" font-family="system-ui, -apple-system, sans-serif" font-size="14">Context Windows</text>
+
+  <rect x="560" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#f778ba" stroke-width="1"/>
+  <text x="640" y="392" text-anchor="middle" fill="#f778ba" font-family="system-ui, -apple-system, sans-serif" font-size="14">Modalities</text>
+
+  <rect x="740" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#7ee787" stroke-width="1"/>
+  <text x="820" y="392" text-anchor="middle" fill="#7ee787" font-family="system-ui, -apple-system, sans-serif" font-size="14">Open Weights</text>
+
+  <rect x="920" y="370" width="160" height="32" rx="16" fill="#1c2333" stroke="#ffa657" stroke-width="1"/>
+  <text x="1000" y="392" text-anchor="middle" fill="#ffa657" font-family="system-ui, -apple-system, sans-serif" font-size="14">Cached Pricing</text>
+
+  <!-- First-party data badge -->
+  <rect x="440" y="430" width="400" height="36" rx="18" fill="#238636" stroke-opacity="0"/>
+  <text x="640" y="454" text-anchor="middle" fill="#ffffff" font-family="system-ui, -apple-system, sans-serif" font-size="16" font-weight="600">✓ First-Party Data Only · Zod Validation</text>
+
+  <!-- Access methods -->
+  <text x="640" y="520" text-anchor="middle" fill="#8b949e" font-family="system-ui, -apple-system, sans-serif" font-size="18">npm · CDN · CSV · GitHub Action · Hugging Face</text>
+
+  <!-- Install command -->
+  <rect x="390" y="545" width="500" height="40" rx="8" fill="#0d1117" stroke="#30363d" stroke-width="1"/>
+  <text x="640" y="572" text-anchor="middle" fill="#58a6ff" font-family="monospace" font-size="16">$ npm install ai-models</text>
+
+  <!-- Bottom accent bar -->
+  <rect x="0" y="635" width="1280" height="5" fill="url(#accent)"/>
+</svg>
\ No newline at end of file
diff --git a/tsconfig.build.json b/tsconfig.build.json
new file mode 100644
index 00000000..f06717bb
--- /dev/null
+++ b/tsconfig.build.json
@@ -0,0 +1,21 @@
+{
+  "compilerOptions": {
+    "target": "ES2022",
+    "module": "ES2022",
+    "moduleResolution": "bundler",
+    "strict": true,
+    "noUncheckedIndexedAccess": true,
+    "noUnusedLocals": true,
+    "noUnusedParameters": true,
+    "noFallthroughCasesInSwitch": true,
+    "noPropertyAccessFromIndexSignature": true,
+    "exactOptionalPropertyTypes": true,
+    "esModuleInterop": true,
+    "skipLibCheck": true,
+    "declaration": true,
+    "emitDeclarationOnly": true,
+    "outDir": "dist",
+    "rootDir": "types"
+  },
+  "include": ["types"]
+}

Model	MMLU	MMLU-Pro	Provider	Input $/M
GPT-4.1	~90%	~78%	OpenAI	$2.00
Claude Opus 4	~90%	~78%	Anthropic	$15.00
Gemini 2.5 Pro	~90%	~78%	Google	$1.25
Claude Sonnet 4	~88%	~76%	Anthropic	$3.00
Grok 3	~87%	~75%	xAI	$3.00
DeepSeek R1	~85%	~72%	DeepSeek	Free
Qwen3-235B	~85%	~72%	Alibaba	Free
Llama 4 Maverick	~82%	~68%	Meta	Free
Model	MATH-500	AIME 2024	Provider	Input $/M
o3	~96%	~83%	OpenAI	$2.00
o4-mini	~93%	~75%	OpenAI	$1.10
DeepSeek R1	~92%	~72%	DeepSeek	Free
Gemini 2.5 Pro	~91%	~70%	Google	$1.25
Qwen3-235B	~90%	~68%	Alibaba	Free
Claude Sonnet 4	~88%	~65%	Anthropic	$3.00
Model	GPQA Diamond	Provider	Input $/M
o3	~80%	OpenAI	$2.00
Gemini 2.5 Pro	~78%	Google	$1.25
Claude Opus 4	~75%	Anthropic	$15.00
o4-mini	~73%	OpenAI	$1.10
DeepSeek R1	~71%	DeepSeek	Free
Model	Arena Score	Provider	Input $/M
GPT-4.1	~1380	OpenAI	$2.00
Claude Sonnet 4	~1370	Anthropic	$3.00
Gemini 2.5 Pro	~1360	Google	$1.25
Grok 3	~1350	xAI	$3.00
DeepSeek R1	~1330	DeepSeek	Free
Benchmark	Best Free	Best Paid	Best Overall
MMLU	DeepSeek R1 / Qwen3	Gemini 2.5 Pro ($1.25)	GPT-4.1
MATH	DeepSeek R1	o4-mini ($1.10)	o3
Coding	DeepSeek V3 ($0.07)	Gemini 2.5 Pro ($1.25)	Claude Sonnet 4
GPQA	DeepSeek R1	Gemini 2.5 Pro ($1.25)	o3
Tool Calling	Gemini 2.5 Flash	Gemini 2.5 Pro ($1.25)	GPT-4.1
Chat	DeepSeek R1	Gemini 2.5 Pro ($1.25)	GPT-4.1
Model	Provider	Context Window	Input $/M	Tool Call
Gemini 2.5 Pro	Google	1,048,576	$1.25	✅
Gemini 2.5 Flash	Google	1,048,576	Free	✅
GPT-4.1	OpenAI	1,047,576	$2.00	✅
Llama 4 Maverick	Meta	1,048,576	Free	✅
Nova Pro	Amazon	300,000	$0.80	✅
Claude Opus/Sonnet 4	Anthropic	200,000	$3-15	✅
o3 / o4-mini	OpenAI	200,000	$1.10-2	✅
DeepSeek R1/V3	DeepSeek	163,840	Free	✅
Capability	Models	Free Models	Cheapest Paid
Tool Calling	2,350	54	ling-2.6-flash ($0.01/$0.03)
Reasoning	1,306	18	qwen3.5-0.8b ($0.01/$0.05)
Vision	1,487	35	ling-2.6-flash ($0.01/$0.03)
Structured Output	829	24	ling-2.6-flash ($0.01/$0.03)
Open Weights	527	81	Free
Image Output	28	5	Various
Audio Input	118	12	Various
Audio Output	34	8	Various
Use Case	Best Model	Why	Cost
AI Agents	GPT-4.1	#1 tool calling, parallel calls	$2/$8
Coding	Claude Sonnet 4	#1 SWE-bench, 64K output	$3/$15
Reasoning	o3	#1 MATH, GPQA	$2/$8
Long Documents	Gemini 2.5 Pro	1M context, best price	$1.25/$10
Chat	GPT-4.1	#1 Chatbot Arena	$2/$8
Budget	Gemini 2.5 Flash	Free with 1M context	Free
Open Source	Qwen3-235B	Best open-weight model	Free
Vision	Gemini 2.5 Pro	Best MMMU, image+video	$1.25/$10
Input	Description	Default
`format`	Output format: json, yaml, csv, markdown	`json`
`output`	Output file path	`models.json`
`provider`	Filter by provider name	(all)
`capability`	Filter by capability: tool_call, reasoning, vision, structured_output	(all)
`free-only`	Only include free models	`false`
`max-price`	Maximum input price per M tokens	(no limit)
`min-context`	Minimum context window size	0
Model	Provider	Input $/1M	Output $/1M	Context
openai--gpt-image-1-mini	aimlapi	$0.007	$0.676	?
mistralai--Mistral-Nemo-Instruct-2407	klusterai	$0.008	$0.001	131K
qwen3.5-0.8b	deepinfra	$0.01	$0.05	262K
ling-2.6-flash	inclusionai	$0.01	$0.03	262K
bdc-coder	inferencenet	$0.01	$0.01	131K
openai--gpt-image-1-model	aimlapi	$0.012	$0.175	?
klusterai--Meta-Llama-3.1-8B-Instruct-Turbo	klusterai	$0.015	$0.02	131K
granite-4.0-h-micro	cloudflare	$0.017	$0.112	131K
meta-llama-3.1-8b-instruct-turbo	deepinfra	$0.02	$0.03	131K
meta-llama-3.1-8b-instruct	deepinfra	$0.02	$0.05	131K