iCourse Subscriber

自动监控复旦大学 iCourse 智慧教学平台的课程更新，对新课次的录播视频进行语音转文字 + AI 摘要，并通过邮件推送到你的邮箱。

部署在 GitHub Actions 上，每天定时运行，零成本、免服务器、全自动。

本项目仅供学习交流与个人复习使用，不可用于侵犯知识产权等非法目的，否则后果自负。

它能做什么？

假设你选了「摸鱼学导论」和「躺平学原理」两门课。每天晚上 22:00，iCourse Subscriber 会自动：

登录你的复旦 iCourse 账号（通过 WebVPN）
检查这两门课是否有新的录播视频
如果有：下载视频 → 语音识别 → AI 生成课程笔记
将所有新课次的笔记汇总成一封邮件发送给你

邮件包含专业排版的 Markdown 渲染内容，覆盖课程重点、讲解内容、例子讲解等。如果老师提到了作业、考试、签到、组队等重要课程事项，会在笔记开头醒目标注。

快速部署（5 分钟）

第 1 步：Fork 本仓库

点击页面右上角的 Fork 按钮，将仓库复制到你的 GitHub 账号下。

第 2 步：配置 Secrets

进入你 Fork 后的仓库，点击 Settings → Secrets and variables → Actions → New repository secret，逐个添加以下 7 个 Secret：

Secret 名称	说明	示例
`STUID`	复旦学号	`22307110000`
`UISPSW`	UIS 统一身份认证密码	`your_password`
`COURSE_IDS`	要监控的课程 ID，多个用英文逗号分隔	`35472,30251`
`DASHSCOPE_API_KEY`	ModelScope 平台 API Key	`ms-xxxxxxxx`
`SMTP_EMAIL`	用于发送邮件的 QQ 邮箱	`123456@qq.com`
`SMTP_PASSWORD`	QQ 邮箱 SMTP 授权码（不是登录密码）	`abcdefghijklmnop`
`RECEIVER_EMAIL`	接收摘要邮件的邮箱（可以和发件邮箱相同）	`you@m.fudan.edu.com`

不知道这些secrets是什么意思？见如下讲解：

第 3 步：获取课程 ID

登录 iCourse 网页版，进入你要监控的课程页面，URL 中的数字就是课程 ID：

多门课用英文逗号隔开：35472,30251,40123

第 4 步：获取 ModelScope API Key

注册 ModelScope
进入 API 密钥管理页面
创建一个 API Key，复制到 DASHSCOPE_API_KEY

魔搭社区提供每天两千次的免费API调用额度，无需付费即可调用大模型api生成课程笔记。

第 5 步：获取 QQ 邮箱 SMTP 授权码

登录 QQ 邮箱 → 设置 → 账户与安全 → 安全设置
找到「POP3/IMAP/SMTP/Exchange/CardDAV/CalDAV 服务」
开启 SMTP 服务，按提示获取授权码（16 位字母）
将授权码填入 SMTP_PASSWORD

SMTP授权码的作用是以你邮箱的名义给你自己发送邮件通知。

第 6 步：运行

自动运行：每天北京时间 22:00 自动执行（可在 check.yml 中修改 cron）
手动触发：进入仓库 → Actions → iCourse Check → Run workflow

首次运行会处理所有已有录播，后续只处理新增课次。

本地运行（Linux环境）

# 克隆仓库
git clone https://github.com/你的用户名/Fudan_iCourse_Subscriber.git
cd Fudan_iCourse_Subscriber

# 安装依赖
pip install -r requirements.txt
sudo apt install ffmpeg   # Ubuntu/Debian
# brew install ffmpeg     # macOS

# 下载 ASR 模型（约 200MB，首次需要）
wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2
tar xf sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2
rm sherpa-onnx-sense-voice-zh-en-ja-ko-yue-2024-07-17.tar.bz2
wget https://github.com/k2-fsa/sherpa-onnx/releases/download/asr-models/silero_vad.onnx

# 配置环境变量（复制 .env.example 并编辑）
cp .env.example .env
# 编辑 .env 填入你的信息，然后:
export $(cat .env | xargs)

# 运行
python main.py

数据安全与知识产权

不保留视频：视频下载后立即通过 ffmpeg 管道转录，转录完成立即删除
数据库加密存储：SQLite 数据库在提交到仓库前使用 AES-256-CBC 加密，密钥由你的多个 Secret 拼接派生，即使仓库公开，他人也无法解密
隐私日志：所有控制台输出已审计，不会打印 token、密码、URL 等敏感信息到 Actions 日志
Fork 安全：他人 Fork 你的仓库后，因 Secret 不同会解密失败，程序会自动从空数据库开始，不会报错

技术实现

以下内容面向对实现细节感兴趣的开发者。

项目结构

├── main.py                 # 主流程编排：登录 → 检测 → 处理 → 邮件
├── src/
│   ├── config.py           # 环境变量与常量配置
│   ├── webvpn.py           # WebVPN AES 加密 + 7 步 IDP 认证
│   ├── icourse.py          # iCourse API 客户端 + CDN 视频签名
│   ├── transcriber.py      # ffmpeg 管道 + silero VAD + SenseVoice ASR
│   ├── summarizer.py       # ModelScope GLM-5 LLM 摘要生成
│   ├── emailer.py          # 批量邮件：Markdown → HTML 渲染 + CSS 排版
│   └── database.py         # SQLite 课次追踪与状态管理
├── .github/workflows/
│   └── check.yml           # GitHub Actions 定时任务 + 加密数据库持久化
├── requirements.txt
└── .env.example

整体流程

flowchart TD
    %% GitHub Actions 层级
    subgraph Cron ["GitHub Actions Cron (每天 22:00 UTC+8)"]
        A1["1. 解密 data/icourse.db.enc → data/icourse.db"]
        A2["2. python main.py"]
        A3["3. 加密 data/icourse.db → git commit + push"]
    end

    %% Python 脚本层级
    subgraph Main ["main.py: run()"]
        B1["WebVPN 登录 + iCourse CAS 认证<br/>(5 次重试)"]
        
        %% 课程循环
        subgraph CourseLoop ["for each course_id in COURSE_IDS"]
            C1["检查 session → 获取课程详情<br/>对比 DB → 筛选未处理的课次<br/>(playback_status=1 且未处理)"]
            
            %% 课次循环
            subgraph LectureLoop ["for each new lecture"]
                D1["检查 session (防过期)"]
                D2["get_video_url → 签名 CDN URL"]
                D3["download_video (流式下载)"]
                D4["transcribe_video (管道转录)"]
                D5["删除视频文件"]
                D6["summarize (LLM 摘要)"]
                D7["存入 DB, 标记 processed<br/>收集到 email_items"]
                
                D1 --> D2 --> D3 --> D4 --> D5 --> D6 --> D7
            end
            
            C1 --> D1
        end
        
        E1["批量发送邮件 (1 封包含所有摘要)<br/>标记 emailed"]
        
        B1 --> C1
        D7 --> E1
    end

    %% 定义跨模块的执行流转连线
    A1 --> A2
    A2 -->|触发脚本执行| B1
    E1 -->|执行完毕返回| A3
    
    %% 可选：给循环框加一点虚线样式以区分普通模块
    classDef loopBlock fill:#f0f8ff,stroke:#00509E,stroke-width:1.5px,stroke-dasharray: 5 5;
    class CourseLoop,LectureLoop loopBlock;

WebVPN 认证（`src/webvpn.py`）

我们逆向了复旦的WebVPN和UIS登录的完整流程，以便在线定时登录。以下是流程说明：

复旦 WebVPN 使用 AES-128-CFB 对目标 URL 的主机名进行加密，IV 固定为 wrdvpnisthebest!。例如：

原始 URL:  https://icourse.fudan.edu.cn/courseapi/v3/...
WebVPN URL: https://webvpn.fudan.edu.cn/https/[32字节IV hex][密文hex]/courseapi/v3/...

IDP 登录是一个 7 步流程：

步骤	操作	关键数据
1	GET `/idp/authCenter/authenticate`	提取 `lck` 参数（跟随重定向链）
2	POST `/idp/authn/queryAuthMethods`	获取 `authChainCode`（userAndPwd 模块）
3	GET `/idp/authn/getJsPublicKey`	获取 RSA 公钥（Base64）
4	本地加密	RSA PKCS1_v1.5 加密密码
5	POST `/idp/authn/authExecute`	提交加密密码，获取 `loginToken`
6	POST `/idp/authCenter/authnEngine`	用 loginToken 换取 CAS ticket URL
7	GET ticket URL	跟随重定向建立 session（设置 cookie）

iCourse CAS 认证复用相同的 7 步流程，但所有请求都通过 WebVPN 代理发送。程序在每次处理课次前检查 session 存活性，过期则自动重新执行完整登录。

CDN 视频签名（`src/icourse.py`）

iCourse 的视频 CDN 需要签名参数才能下载。签名算法通过逆向前端 JS 获得：

# 签名参数 t 的生成
pathname  = urlparse(video_url).path
timestamp = server_now   # 来自 get-sub-info API 的 now 字段
hash_input = f"{pathname}{user_id}{tenant_id}{reversed_phone}{timestamp}"
md5_hash  = md5(hash_input)
t = f"{user_id}-{timestamp}-{md5_hash}"

# 最终 URL
signed_url = f"{video_url}?clientUUID={uuid4()}&t={t}"

其中 reversed_phone 是用户手机号字符串的反转（如 "13812345678" → "87654321831"）。这些用户信息通过 /userapi/v1/infosimple API 获取并缓存。

视频 URL 的提取有三级回退：video_list[*].preview_url → playurl[*] → get-sub-detail fallback。

语音转文字管道（`src/transcriber.py`）

采用流式管道架构，避免将整个视频加载到内存：

Video File
    │
    ▼
 ffmpeg (子进程)
    │  -ar 16000 -ac 1 -f f32le  (16kHz 单声道 PCM float32)
    │
    ▼ stdout pipe (每次读 1 秒 = 64KB)
    │
 silero VAD
    │  512 样本窗口 (32ms), 最小静音 0.25s
    │  检测语音边界，输出语音片段
    │
    ▼
 SenseVoice (sherpa-onnx)
    │  OfflineRecognizer, int8 量化, 2 线程
    │  支持中/英/日/韩/粤语
    │
    ▼
 拼接文本 → 写入数据库

模型懒加载：首次转录时才初始化 SenseVoice + VAD，后续复用实例。视频转录完成后立即删除视频文件，节省 GitHub Actions 磁盘空间。

数据库持久化（GitHub Actions）

GitHub Actions 每次运行在全新容器中，无法保留文件。本项目通过以下方式持久化 SQLite 数据库：

运行前：从仓库解密 data/icourse.db.enc → data/icourse.db
运行后：比较 MD5，如果数据库有变化则加密并 git commit + push
加密密钥：由 STUID + UISPSW + DASHSCOPE_API_KEY + SMTP_PASSWORD 拼接，确保只有 Secret 持有者能解密
Fork 兼容：解密失败时自动从空数据库开始，输出 GitHub warning 提示

依赖

包	用途
`requests`	HTTP 客户端
`pycryptodome`	WebVPN AES-128-CFB 加密 + RSA 密码加密
`sherpa-onnx`	SenseVoice 语音识别 + silero VAD
`numpy`	PCM 音频采样处理
`openai`	ModelScope OpenAI 兼容 API 调用
`markdown`	Markdown → HTML 转换（邮件渲染）

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

iCourse Subscriber

它能做什么？

快速部署（5 分钟）

第 1 步：Fork 本仓库

第 2 步：配置 Secrets

第 3 步：获取课程 ID

第 4 步：获取 ModelScope API Key

第 5 步：获取 QQ 邮箱 SMTP 授权码

第 6 步：运行

本地运行（Linux环境）

数据安全与知识产权

技术实现

项目结构

整体流程

WebVPN 认证（`src/webvpn.py`）

CDN 视频签名（`src/icourse.py`）

语音转文字管道（`src/transcriber.py`）

数据库持久化（GitHub Actions）

依赖

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.github/workflows		.github/workflows
data		data
docs		docs
src		src
.env.example		.env.example
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

iCourse Subscriber

它能做什么？

快速部署（5 分钟）

第 1 步：Fork 本仓库

第 2 步：配置 Secrets

第 3 步：获取课程 ID

第 4 步：获取 ModelScope API Key

第 5 步：获取 QQ 邮箱 SMTP 授权码

第 6 步：运行

本地运行（Linux环境）

数据安全与知识产权

技术实现

项目结构

整体流程

WebVPN 认证（src/webvpn.py）

CDN 视频签名（src/icourse.py）

语音转文字管道（src/transcriber.py）

数据库持久化（GitHub Actions）

依赖

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

WebVPN 认证（`src/webvpn.py`）

CDN 视频签名（`src/icourse.py`）

语音转文字管道（`src/transcriber.py`）

Packages