输入一个想法,自动完成关键词扩展 → 社媒数据抓取 → 竞品分析 → 生成可追踪验证报告
🌐 ideascan.lovable.app
| 能力 | 说明 |
|---|---|
| 端到端验证 | 从想法到报告一键完成:关键词扩展 → 多平台抓取 → 数据清洗 → AI 摘要 → 评分报告 |
| 多平台数据源 | 小红书、抖音自爬 + TikHub 第三方兜底,双路由自动降级 |
| AI 深度分析 | 多维评分(需求热度、竞争格局、可行性)、情感分析、痛点提取、用户画像 |
| 热点雷达 | 基于验证历史与定时扫描发现市场机会,气泡图可视化,个性化推荐 |
| 需求验证实验 | 自动生成 MVP 落地页,追踪 CTA 点击、Waitlist 提交等真实需求信号 |
| 实时进度流 | SSE 实时推送验证进度,失败自动重试,支持断点续传 |
| 报告可溯源 | 证据等级(A/B/C/D)、数据质量评分、成本拆解,每个结论可回溯原始数据 |
| 多 LLM 兜底 | 用户自配模型优先,Lovable AI 作为最终安全网,确保验证不因模型故障中断 |
┌─────────────────────────────────────────────────────────────┐
│ 前端 (Vite + React + TS) │
│ Tailwind CSS · shadcn/ui · Recharts · Framer │
└──────────────────────┬──────────────────────────────────────┘
│ SSE / REST
┌──────────────────────▼──────────────────────────────────────┐
│ Lovable Cloud (Backend) │
│ ┌──────────┐ ┌────────────┐ ┌──────────┐ ┌──────────┐ │
│ │ Postgres │ │Edge Funcs │ │ Auth │ │ RLS │ │
│ │ + RLS │ │(Deno) │ │ │ │ Policies │ │
│ └──────────┘ └─────┬──────┘ └──────────┘ └──────────┘ │
└──────────────────────┼──────────────────────────────────────┘
│
┌──────────────┼──────────────┐
▼ ▼ ▼
┌─────────┐ ┌──────────┐ ┌─────────┐
│ Crawler │ │ TikHub │ │ LLM │
│ Service │ │ API │ │ (多源) │
│(Python) │ │(兜底) │ │ │
└─────────┘ └──────────┘ └─────────┘
| 层 | 技术 |
|---|---|
| 前端 | Vite · React 18 · TypeScript · Tailwind CSS · shadcn/ui · Recharts · Framer Motion |
| 后端 | Lovable Cloud — Postgres · Edge Functions (Deno) · Auth · RLS |
| 爬虫 | Python 3.11 · FastAPI · Playwright · Redis(独立 crawler-service) |
| AI | 多 LLM 路由(用户自配 + Lovable AI 兜底) |
| 测试 | Vitest |
| 国际化 | i18next(中/英双语) |
src/
├── components/
│ ├── report/ # 验证报告页组件(评分、维度、AI分析、竞品等)
│ ├── discover/ # 热点雷达页组件(趋势卡片、气泡图、筛选器)
│ ├── dashboard/ # 对比分析组件
│ ├── social/ # 社交证明组件(VC 圆桌、分享卡片)
│ ├── shared/ # 通用组件(导航、加载、错误边界等)
│ └── ui/ # shadcn/ui 基础组件
├── pages/ # 路由页面(首页、验证、报告、历史、发现、定价等)
├── services/ # 业务服务层(验证、发现、社交、MVP、猎手)
├── hooks/ # 自定义 Hooks(认证、配额、设置、验证)
├── i18n/ # 国际化资源(中/英)
├── lib/ # 工具函数(导出、PDF、报告生成等)
└── integrations/ # 后端客户端(自动生成,勿修改)
supabase/
├── functions/ # Edge Functions(30+ 个后端函数)
│ ├── validate-idea-stream/ # 核心:流式验证主函数
│ ├── validate-idea/ # 验证引擎(含多平台适配器)
│ ├── discover-topics/ # 热点发现与回填
│ ├── crawler-*/ # 爬虫调度与认证系列
│ ├── generate-mvp/ # MVP 落地页生成
│ └── _shared/ # 共享模块(LLM、搜索、限流等)
└── migrations/ # 数据库迁移(勿手动修改)
crawler-service/ # Python 爬虫服务
├── app/
│ ├── adapters/ # 平台适配器(小红书、抖音)
│ ├── main.py # FastAPI 入口
│ ├── worker.py # 异步任务 Worker
│ └── ...
└── scripts/ # 运维脚本
💡 不想折腾后端? 直接访问线上版本:https://ideascan.lovable.app 以下教程适用于本地开发或二次开发。
| 工具 | 用途 | 验证命令 |
|---|---|---|
| Node.js 18+ | 运行前端 | node -v |
| Git | 代码管理 | git -v |
| Python 3.11+ | 爬虫服务(可选) | python3 --version |
| Redis | 爬虫队列(可选) | redis-cli ping |
git clone <你的仓库地址>
cd project-ideascannpm install
cp .env.example .env
# 编辑 .env,填入后端连接信息(Lovable Cloud 用户无需修改)
npm run dev浏览器打开 http://localhost:5173 即可看到页面。
方式 A:本地 Docker 模式(需 Docker Desktop)
./scripts/bootstrap.sh local方式 B:远端模式(已完成 supabase link)
DEPLOY_FUNCTIONS=true ./scripts/bootstrap.sh remote方式 C:Lovable Cloud(最简单)— 数据库和后端函数已自动配置,直接跳到第四步。
至少配置一个 LLM 服务(在后端 Secrets 中设置):
| Secret 名称 | 值 | 说明 |
|---|---|---|
LLM_BASE_URL |
https://api.openai.com/v1 |
OpenAI 或兼容服务商 |
LLM_MODEL |
gpt-4o-mini |
模型名称 |
LLM_API_KEY |
sk-xxx... |
API Key |
💡 兼容服务商推荐:DeepSeek、SiliconFlow、Moonshot
可选搜索增强:
| Secret 名称 | 用途 |
|---|---|
TAVILY_API_KEY |
Web 搜索 |
BOCHA_API_KEY |
中文搜索增强 |
TIKHUB_TOKEN |
小红书/抖音数据兜底 |
不启动爬虫也能用——系统会自动降级到 TikHub 或 Web 搜索。
cd crawler-service
python3 -m venv .venv && source .venv/bin/activate
pip install -r requirements.txt
playwright install chromium
uvicorn app.main:app --reload --port 8100用户输入想法
↓
关键词扩展(LLM 生成 3-5 个搜索词)
↓
多源数据采集
├── 自爬小红书/抖音(Playwright + 扫码登录)
├── TikHub API(第三方兜底)
└── Web 搜索(Jina Reader 清洗)
↓
数据清洗 & 去重(Context Budgeter 控制成本)
↓
分层摘要(L1 快速摘要 → L2 深度分析)
↓
AI 综合评分 & 报告生成
├── 多维评分:需求热度、竞争格局、可行性
├── 情感分析 & 痛点提取
├── 用户画像 & 目标客群
├── 竞品对标分析
└── 证据等级 & 成本拆解
- 数据来源:用户验证结果自动回填 + 定时扫描
- 质量评分:热度 × 0.45 + 验证分数 × 0.4 + 样本量 × 0.15
- 个性化推荐:基于用户历史验证 tags 匹配相关热点
- 从验证报告一键生成 MVP 产品落地页
- 内置 Waitlist 表单与 CTA 追踪
- 需求验证实验:追踪真实用户行为信号
- 端到端需求验证(关键词扩展 → 多平台抓取 → AI 评分报告)
- 热点雷达与个性化推荐
- MVP 落地页一键生成 + Waitlist 线索收集
- AI 专家团圆桌讨论(多角色模拟 VC/PM/用户/分析师视角)
- 竞品透视分析
- 多 LLM 三级回退(用户自配 → 服务端默认 → Lovable AI)
- 数据导入/导出 & PDF 报告
- 中英双语国际化
| 方向 | 说明 |
|---|---|
| 社媒数据库 | 将每次验证抓取的社媒数据(小红书、抖音帖子/评论)持久化为结构化数据资产,支持跨验证复用、趋势回溯,不再用完即弃 |
| MVP 原型增强 | 从静态落地页升级为可交互原型(多页面、表单流、模拟支付),更真实地测试用户意愿 |
| 社媒发布闭环 | 验证完成后一键生成适配小红书、抖音等平台格式的推广内容(图文笔记、短视频脚本),直接发布或导出素材包 |
| 邮件通知 | Waitlist 提交后自动发送确认邮件给用户,同时通知创业者 |
| 方向 | 说明 |
|---|---|
| 狩猎雷达 (The Hunter) | 24h 定时扫描特定圈层讨论,自动发现未被满足的需求,构建"潜在需求库" |
| 智能匹配 | 将发现的市场机会一键导入 MVP 生成器,直接生成落地页验证 |
| 增长飞轮 (Growth Pilot) | 利用社媒发布能力自动为 MVP 导流,形成"发现 → 验证 → 落地 → 增长"完整闭环 |
| 高级主题与 SEO | 动态 OG Image、多主题模板、搜索引擎优化 |
# 前端开发
npm run dev # 启动开发服务器
npm run build # 生产构建
npm run test # 运行测试
# 数据库
supabase db push # 推送迁移到远端
supabase db reset # 重置本地数据库
# Edge Functions
supabase functions deploy validate-idea-stream # 部署单个函数
DEPLOY_FUNCTIONS=true ./scripts/bootstrap.sh remote # 部署全部
# 爬虫服务
cd crawler-service && source .venv/bin/activate
uvicorn app.main:app --reload --port 8100
python run_worker.py❓ npm install 报错
- 确保 Node.js ≥ 18:
node -v - 清理缓存:
rm -rf node_modules package-lock.json && npm install
❓ 页面白屏
打开浏览器开发者工具(F12)查看控制台。最常见原因:.env 文件缺失或后端配置错误。
❓ 点击验证后一直转圈
- 未配置 LLM — 至少配置一个 AI 服务(见第四步)
- 后端函数未部署 — 运行
DEPLOY_FUNCTIONS=true ./scripts/bootstrap.sh remote - 查看后端日志排查具体错误
❓ 扫码登录成功但抓取失败
- 确认
crawler-service正在运行 - 可能触发平台风控,等待 5-10 分钟后重试
- 配置
TIKHUB_TOKEN作为兜底
❓ 报错 SELF_CRAWLER_EMPTY 或样本不足
常见原因:账号触发风控 / 关键词过窄 / 会话冷却期。建议启用 TikHub 兜底。
在 Lovable 上运行项目,前端/数据库/后端函数全部自动部署,点击 Publish 即可上线。
- 数据库:执行迁移
supabase db push,部署 Edge Functions - 前端:
npm run build→ 将dist/部署到 Vercel / Netlify / Cloudflare Pages - 爬虫服务:Docker / PM2 / systemd 常驻
- LLM 冗余:配置用户自有模型 + Lovable AI 双路兜底
欢迎参与以下方向的共建:
- 爬虫稳定性:风控对抗、重试策略、会话健康检测
- 数据质量:去重清洗、异常识别、置信度评估
- 数据源扩展:新平台接入、字段标准化
- 工程质量:监控告警、测试覆盖、文档完善
⚠️ 严禁提交任何真实密钥、Cookie 或敏感数据
IdeaScan 的诞生离不开以下开源项目的启发与支撑:
-
XHS_Business_Idea_Validator — 本项目的灵感原点。其基于多 Agent + MCP 架构的小红书商业验证方案,奠定了"关键词扩展 → 社媒抓取 → AI 分析 → 报告生成"的核心工作流范式。IdeaScan 在此基础上演化为云原生架构,扩展了多平台、实时流、热点雷达等能力,但始终铭记这一优秀的起点。
-
crawler-service — 项目自研的独立爬虫服务。从零构建了扫码登录、会话池管理、风控对抗、异步队列、多平台适配器等完整能力栈。它是 IdeaScan 数据采集层的核心引擎,让"自爬优先 + 第三方兜底"的双路数据策略成为可能。
感谢所有为社媒数据分析和需求验证领域贡献智慧的开发者们。
内部项目,按团队规范使用。