mirror of https://github.com/JefferyHcool/BiliNote.git synced 2026-06-26 02:01:38 +08:00

Go to file

voidborne-d 3ff7086491 fix(backend): UniversalGPT.create_messages emit string content when no images

DeepSeek deepseek-chat 等非多模态模型只接受 ``content`` 为字符串。旧实现在
没有 ``video_img_urls`` 输入时也把 ``content`` 拼成
``[{"type":"text","text":...}]`` 多模态数组，导致 DeepSeek API 返回
``Failed to deserialize the JSON body into the target type: messages[0]:
unknown variant `image_url`, expected `text```，整个笔记生成流程随之崩溃。

修复方式：``create_messages`` 在没有截图时退回 string content；有截图时维持
原多模态数组形态，多模态模型功能不退化。同时把 ``_build_merge_messages`` 也
改为 string content —— 合并阶段从不带图片，旧的数组形态会让长视频 chunk
之后的合并阶段同样命中 DeepSeek 400。

新增 ``backend/tests/test_universal_gpt_content_format.py`` (6 cases)：

- 无图片 / 显式空 image 列表都走 string content
- 有图片仍输出多模态数组（含 ``image_url`` + ``detail: auto``）
- 纯文本响应里完全不含 ``image_url`` 字段
- ``_build_merge_messages`` 用 string content + 仍带入 partials 文本

红基线：在不打补丁的 ``universal_gpt.py`` 上跑这 6 个 case，3 个 string-
content 断言会失败（命中 issue #282 的同一根因），打补丁后 6/6 通过。

Closes #282

2026-05-07 13:50:59 +08:00

.github

fix(ci): 移除 pnpm install 的 --frozen-lockfile 标志

2026-03-23 18:50:48 +08:00

.vscode

🐞 fix: 增加错误之后对已解析段落的缓存功能,再次重试时不再重头开始

2026-02-12 18:28:11 +08:00

backend

fix(backend): UniversalGPT.create_messages emit string content when no images

2026-05-07 13:50:59 +08:00

BillNote_extension

feat(extension+backend): 插件直接在浏览器里抓 B 站字幕，跳过后端 download_subtitles

2026-05-07 12:23:16 +08:00

BillNote_frontend

fix: 修复 AILogo 噪音、设置页滚动与供应商批量伪内置脏数据

2026-05-07 11:10:15 +08:00

doc

…

nginx

fix: 性能优化、前端转写器配置、任务进度丢失及 MLX Whisper 回退问题修复

2026-03-23 14:09:34 +08:00

.dockerignore

feat(build): 全面优化打包流程，Docker 镜像自动发布到 GHCR

2026-03-23 17:48:34 +08:00

.env.example

fix: update bilibili timestamp link format to - [MM:SS](URL#t=MM:SS)

2026-02-25 11:57:16 +08:00

.gitignore

chore: 删除 ffmpeg 二进制文件并更新 .gitignore

2026-03-23 18:31:32 +08:00

CHANGELOG.md

docs: v2.1.0 CHANGELOG + README 版本更新

2026-05-07 13:06:31 +08:00

CLAUDE.md

feat(extension): 浏览器插件 P1 MVP

2026-05-07 11:40:15 +08:00

CONTRIBUTING.md

docs(contributing): 新增贡献指南，落地简化 Git Flow 分支管理

2026-05-07 13:13:32 +08:00

docker-compose.gpu.yml

feat(build): 全面优化打包流程，Docker 镜像自动发布到 GHCR

2026-03-23 17:48:34 +08:00

docker-compose.yml

feat(build): 全面优化打包流程，Docker 镜像自动发布到 GHCR

2026-03-23 17:48:34 +08:00

Dockerfile.complete

fix(docker): 优化 Vite 配置以支持 Docker 构建环境

2026-03-23 18:54:16 +08:00

LICENSE

…

README.md

docs: v2.1.0 CHANGELOG + README 版本更新

2026-05-07 13:06:31 +08:00

run.bat

🐞 fix: 增加错误之后对已解析段落的缓存功能,再次重试时不再重头开始

2026-02-12 18:28:11 +08:00

README.md

BiliNote v2.1.0

AI 视频笔记生成工具让 AI 为你的视频做笔记

✨ 项目简介

BiliNote 是一个开源的 AI 视频笔记助手，支持通过哔哩哔哩、YouTube、抖音等视频链接，自动提取内容并生成结构清晰、重点明确的 Markdown 格式笔记。支持插入截图、原片跳转、AI 问答等功能。

📝 使用文档

详细文档可以查看这里

体验地址

可以通过访问这里进行体验，速度略慢，不支持长视频。

📦 桌面版下载

本项目提供了 Windows 和 macOS 桌面客户端，可在 Releases 页面下载最新版本。

Windows 用户请注意：一定要在没有中文路径的环境下运行。

🔧 功能特性

支持多平台：Bilibili、YouTube、本地视频、抖音、快手
支持返回笔记格式选择
支持笔记风格选择
支持多模态视频理解
支持多版本记录保留
支持自行配置 GPT 大模型（OpenAI、DeepSeek、Qwen 等）
本地模型音频转写（支持 Fast-Whisper、MLX-Whisper、Groq、BCut）
GPT 大模型总结视频内容
自动生成结构化 Markdown 笔记
可选插入截图（自动截取）
可选内容跳转链接（关联原视频）
任务记录与历史回看
基于 RAG 的笔记内容 AI 问答（支持 Function Calling）
笔记顶部视频封面 Banner 展示
工作区和生成历史面板支持折叠/展开

v2.1.0 新增

浏览器插件（Chrome / Edge / Firefox MV3）—— 工具栏 popup、视频页悬浮按钮、右键菜单、侧边栏（Markdown / 思维导图 / AI 问答）四件套
插件设置页五大块：模型供应商 CRUD、音频转写配置、下载配置（含浏览器 Cookie 一键同步）、部署监控
B 站字幕优先：插件在用户浏览器里直接抓字幕（带本地登录态 cookie），跳过后端音频转写
后端 BilibiliSubtitleFetcher：非插件场景下走 player API 拿字幕，作为 yt-dlp 兜底
mlx-whisper 仓库 ID 修正（修复模型 404）
后端 CORS 改用 regex，兼容浏览器扩展源
详见 CHANGELOG.md

v2.0.0 新增

基于 RAG 的笔记内容 AI 问答功能，支持半屏/全屏模式
AI 问答支持 Function Calling，模型可主动查询原文数据
RAG 索引支持视频元信息（标题、作者、简介、标签等）
AI 回复支持 Markdown 渲染
笔记顶部新增视频封面 Banner
工作区和生成历史面板支持折叠/展开
笔记开头添加来源链接功能
YouTube 字幕优先获取，有字幕时跳过音频下载
性能优化与转写器配置改进

📸 截图预览

🚀 快速开始

方式一：Docker 部署（推荐）

确保已安装 Docker，直接拉取预构建镜像运行：

docker pull ghcr.io/jefferyhcool/bilinote:latest

docker run -d -p 80:80 \
  -v bilinote-data:/app/backend/data \
  --name bilinote \
  ghcr.io/jefferyhcool/bilinote:latest

访问：http://localhost

也可以使用 docker-compose 本地构建：

# 标准部署
docker-compose up -d

# GPU 加速部署（需要 NVIDIA GPU）
docker-compose -f docker-compose.gpu.yml up -d

方式二：源码部署

1. 克隆仓库

git clone https://github.com/JefferyHcool/BiliNote.git
cd BiliNote
mv .env.example .env

2. 启动后端（FastAPI）

cd backend
pip install -r requirements.txt
python main.py

3. 启动前端（Vite + React）

cd BillNote_frontend
pnpm install
pnpm dev

访问：http://localhost:3015

⚙️ 依赖说明

🎬 FFmpeg

本项目依赖 ffmpeg 用于音频处理与转码，源码部署时必须安装：

# Mac (brew)
brew install ffmpeg

# Ubuntu / Debian
sudo apt install ffmpeg

# Windows
# 请从官网下载安装：https://ffmpeg.org/download.html

⚠️ 若系统无法识别 ffmpeg，请将其加入系统环境变量 PATH

Docker 部署已内置 FFmpeg，无需额外安装。

🚀 CUDA 加速（可选）

若你希望更快地执行音频转写任务，可使用具备 NVIDIA GPU 的机器，并启用 fast-whisper + CUDA 加速版本：

具体 fast-whisper 配置方法，请参考：fast-whisper 项目地址

🐳 使用 Docker 一键部署

确保你已安装 Docker，然后直接拉取预构建镜像运行：

# 拉取最新镜像
docker pull ghcr.io/jefferyhcool/bilinote:latest

# 运行容器
docker run -d -p 80:80 \
  -v bilinote-data:/app/backend/data \
  --name bilinote \
  ghcr.io/jefferyhcool/bilinote:latest

访问：http://localhost

也可以使用 docker-compose 本地构建：

# 标准部署
docker-compose up -d

# GPU 加速部署（需要 NVIDIA GPU）
docker-compose -f docker-compose.gpu.yml up -d

🧠 TODO

支持抖音及快手等视频平台
支持前端设置切换 AI 模型切换、语音转文字模型
AI 摘要风格自定义（学术风、口语风、重点提取等）
加入更多模型支持
加入更多音频转文本模型支持
基于 RAG 的笔记内容 AI 问答
笔记导出为 PDF / Word / Notion

Contact and Join-联系和加入社区

年会恢复更新以后放出最新社区地址

🔎代码参考

本项目中的 抖音下载功能 部分代码参考引用自：Evil0ctal/Douyin_TikTok_Download_API

📜 License

MIT License

💬 你的支持与反馈是我持续优化的动力！欢迎 PR、提 issue、Star ⭐️

Buy Me a Coffee / 捐赠

如果你觉得项目对你有帮助，考虑支持我一下吧

⭐ Star History

Languages

Python 43.8%

TypeScript 42.8%

Vue 8.7%

Rust 2.4%

CSS 1.2%

Other 1.1%

README.md Unescape Escape

BiliNote v2.1.0

✨ 项目简介

📝 使用文档

体验地址

📦 桌面版下载

🔧 功能特性

v2.1.0 新增

v2.0.0 新增

📸 截图预览

🚀 快速开始

方式一：Docker 部署（推荐）

方式二：源码部署

1. 克隆仓库

2. 启动后端（FastAPI）

3. 启动前端（Vite + React）

⚙️ 依赖说明

🎬 FFmpeg

🚀 CUDA 加速（可选）

🐳 使用 Docker 一键部署

🧠 TODO

Contact and Join-联系和加入社区

🔎代码参考

📜 License

Buy Me a Coffee / 捐赠

⭐ Star History

README.md