BiliNote

GithubBackup/BiliNote

Fork 0

mirror of https://github.com/JefferyHcool/BiliNote.git synced 2026-06-12 03:00:09 +08:00

Commit Graph

Author	SHA1	Message	Date
huangjianwu	58d992f28f	feat(transcriber): 可配置 whisper 模型 + 名称映射（自定义 HF repo / 本地路径）此前 fast-whisper 把「size → Systran/faster-whisper-{size}」的约定隐式散落在加载/下载/检测三处，用户想用命名不符该约定的模型（社区微调版、或自己下到本地的模型）接不上。本功能把映射显式化 + 可配置（对齐已有的 MLX_MODEL_MAP 模式）。后端： - 新增 app/transcriber/whisper_models.py 注册表：内置映射 + 用户自定义（config/whisper_models.json 持久化，Docker 下随 config 卷保留）；resolve 优先级自定义 > 内置 > 直通（含 / 的 repo_id / 已存在本地目录）。 - whisper.py / config.py 的加载、下载、完整性检测统一走 resolve；HF cache 目录从任意 repo_id 推导（models--{org}--{name}）不再写死 Systran；本地路径跳过下载， _purge_cache 绝不删用户本地模型。 - 新增 /whisper_models 增删查 API；/transcriber_config 返回内置+自定义列表；下载校验放开到「已登记/可解析」的模型。前端：transcriber.tsx 新增「自定义模型」卡片（增删 + 下载状态），模型下拉自动含自定义。 Docker：自定义 HF 模型下到 /app/backend/models（v2.3.3 models 卷已持久化）；本地模型走挂载目录 + 配置路径，UI 已提示挂载。测试：tests/test_whisper_models.py 13 个单测全过；并在 v2.3.3 镜像真实后端环境做了 import 链 + resolve + 真实模型检测的集成冒烟，均通过。 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-22 15:09:06 +08:00
voidborne-d	3ff7086491	fix(backend): UniversalGPT.create_messages emit string content when no images DeepSeek deepseek-chat 等非多模态模型只接受 ``content`` 为字符串。旧实现在没有 ``video_img_urls`` 输入时也把 ``content`` 拼成 ``[{"type":"text","text":...}]`` 多模态数组，导致 DeepSeek API 返回 ``Failed to deserialize the JSON body into the target type: messages[0]: unknown variant `image_url`, expected `text```，整个笔记生成流程随之崩溃。修复方式：``create_messages`` 在没有截图时退回 string content；有截图时维持原多模态数组形态，多模态模型功能不退化。同时把 ``_build_merge_messages`` 也改为 string content —— 合并阶段从不带图片，旧的数组形态会让长视频 chunk 之后的合并阶段同样命中 DeepSeek 400。新增 ``backend/tests/test_universal_gpt_content_format.py`` (6 cases)： - 无图片 / 显式空 image 列表都走 string content - 有图片仍输出多模态数组（含 ``image_url`` + ``detail: auto``） - 纯文本响应里完全不含 ``image_url`` 字段 - ``_build_merge_messages`` 用 string content + 仍带入 partials 文本红基线：在不打补丁的 ``universal_gpt.py`` 上跑这 6 个 case，3 个 string- content 断言会失败（命中 issue #282 的同一根因），打补丁后 6/6 通过。 Closes #282	2026-05-07 13:50:59 +08:00
CyanAutumn	d9a7b89e7d	🐞 fix: 增加错误之后对已解析段落的缓存功能,再次重试时不再重头开始解析长视频时,当附件大小过大时不再调用后进行报错,而是将附件进行分批次发送在每篇笔记开头默认增加地址来源链接,对模糊处可溯源	2026-02-12 18:28:11 +08:00

Author

SHA1

Message

Date

huangjianwu

58d992f28f

feat(transcriber): 可配置 whisper 模型 + 名称映射（自定义 HF repo / 本地路径）

此前 fast-whisper 把「size → Systran/faster-whisper-{size}」的约定隐式散落在
加载/下载/检测三处，用户想用命名不符该约定的模型（社区微调版、或自己下到本地
的模型）接不上。本功能把映射显式化 + 可配置（对齐已有的 MLX_MODEL_MAP 模式）。

后端：
- 新增 app/transcriber/whisper_models.py 注册表：内置映射 + 用户自定义
  （config/whisper_models.json 持久化，Docker 下随 config 卷保留）；resolve
  优先级 自定义 > 内置 > 直通（含 / 的 repo_id / 已存在本地目录）。
- whisper.py / config.py 的加载、下载、完整性检测统一走 resolve；HF cache 目录从
  任意 repo_id 推导（models--{org}--{name}）不再写死 Systran；本地路径跳过下载，
  _purge_cache 绝不删用户本地模型。
- 新增 /whisper_models 增删查 API；/transcriber_config 返回内置+自定义列表；
  下载校验放开到「已登记/可解析」的模型。

前端：transcriber.tsx 新增「自定义模型」卡片（增删 + 下载状态），模型下拉自动含自定义。

Docker：自定义 HF 模型下到 /app/backend/models（v2.3.3 models 卷已持久化）；本地模型
走挂载目录 + 配置路径，UI 已提示挂载。

测试：tests/test_whisper_models.py 13 个单测全过；并在 v2.3.3 镜像真实后端环境做了
import 链 + resolve + 真实模型检测的集成冒烟，均通过。

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-22 15:09:06 +08:00

voidborne-d

3ff7086491

fix(backend): UniversalGPT.create_messages emit string content when no images

DeepSeek deepseek-chat 等非多模态模型只接受 ``content`` 为字符串。旧实现在
没有 ``video_img_urls`` 输入时也把 ``content`` 拼成
``[{"type":"text","text":...}]`` 多模态数组，导致 DeepSeek API 返回
``Failed to deserialize the JSON body into the target type: messages[0]:
unknown variant `image_url`, expected `text```，整个笔记生成流程随之崩溃。

修复方式：``create_messages`` 在没有截图时退回 string content；有截图时维持
原多模态数组形态，多模态模型功能不退化。同时把 ``_build_merge_messages`` 也
改为 string content —— 合并阶段从不带图片，旧的数组形态会让长视频 chunk
之后的合并阶段同样命中 DeepSeek 400。

新增 ``backend/tests/test_universal_gpt_content_format.py`` (6 cases)：

- 无图片 / 显式空 image 列表都走 string content
- 有图片仍输出多模态数组（含 ``image_url`` + ``detail: auto``）
- 纯文本响应里完全不含 ``image_url`` 字段
- ``_build_merge_messages`` 用 string content + 仍带入 partials 文本

红基线：在不打补丁的 ``universal_gpt.py`` 上跑这 6 个 case，3 个 string-
content 断言会失败（命中 issue #282 的同一根因），打补丁后 6/6 通过。

Closes #282

2026-05-07 13:50:59 +08:00

CyanAutumn

d9a7b89e7d

🐞 fix: 增加错误之后对已解析段落的缓存功能,再次重试时不再重头开始

解析长视频时,当附件大小过大时不再调用后进行报错,而是将附件进行分批次发送

在每篇笔记开头默认增加地址来源链接,对模糊处可溯源

2026-02-12 18:28:11 +08:00

3 Commits