[重要安全性通知] 发现假冒 Qfinder Pro 网站。了解详情 >

本内容经过机器翻译。请参见机器翻译免责声明
切换为英语

Frequently Asked Questions about Qsirch On-Premises LLM
关于 Qsirch 本地 LLM 的常见问题


最后修订日期: 2025-10-01

适用产品

Qsirch 6.0.0

应用的固件:

  • QTS 5.1.0 或以上
  • QuTS hero 5.1.0 或以上
  • QuTScloud 5.1.0 或以上

概述

Qsirch 是专为 QNAP NAS 设计的强大搜索引擎,使用户能够快速定位文件和信息。

Qsirch 6.0引入了对本地 LLM 模型的支持,结合 RAG 搜索和RAG 多轮对话,提供更智能、上下文感知的搜索功能,同时确保您的数据安全和隐私。


常见问题

Q1:Qsirch 本地 LLM 会将数据发送到外部吗?

不会。所有数据处理、分析和 LLM 推理均在 NAS 系统内本地进行。没有内容被上传或传输到外部,确保数据隐私和安全。

Q2:如果我的 NAS 没有 GPU,我可以使用本地 LLM 吗?

不能。本地 LLM 推理需要 GPU 计算。如果没有 GPU,您可以通过 API 连接到云 LLM 进行 RAG 搜索,仍然可以体验 AI 驱动的搜索。

Q3:本地 LLM 和云 LLM 可以一起使用吗?

是的。如果您的 NAS 符合本地 LLM 的硬件要求并且模型已下载,同时通过 API 连接到云 LLM,您可以在 RAG 搜索期间自由切换模型来源。

Q4:部署模型需要多少 NAS 存储空间?

这取决于模型的大小。LLM 模型文件通常在几个到几十 GB 之间。建议将模型存储在 SSD 上,以减少加载和推理延迟。

Q5:什么是 RAG 多轮对话?

RAG 多轮对话允许 AI 保留当前对话上下文,并根据之前的搜索结果提供后续分析和响应,而无需用户每次重新输入完整查询。

Q6:多轮对话历史保留多久?

系统保留一定数量的多轮对话历史以供未来参考和搜索。当超过存储限制时,旧记录会根据较后修改日期自动删除,以确保性能和流畅的用户体验。

Q7:多轮对话是否影响性能?

对话越多、上下文越长,系统资源需求越大。在典型使用场景下,影响较小。然而,如果同时处理大量文件或多次搜索,响应时间可能会变慢。我们建议在有足够的硬件资源(尤其是 GPU/VRAM)时使用多轮对话,以确保良好的体验。

Q8:我可以在 RAG 搜索中切换搜索范围吗?

可以。默认搜索范围是“全局搜索”。如果选择“指定文件夹搜索”,您必须选择至少 1 个文件夹,较多可以选择 50 个文件夹。

Q9:本地 LLM 可以在多个 NAS 设备之间共享吗?

不能。每个 NAS 必须独立部署和下载模型。模型文件不能在 NAS 设备之间直接共享。

Q10:模型更新是自动进行的吗?

云模型会随着 Qsirch 版本更新而更新。本地模型会定期与 LLM 核心一起更新。用户必须下载新版本的 Qsirch 或 LLM 核心,以避免因版本变化导致的性能或兼容性问题。

Q11:加密文件夹可以作为 RAG 搜索的数据源吗?

可以,但加密文件夹必须在搜索前解锁,否则系统无法访问其内容。任何在 Qsirch 中可访问的文件夹都可以用作 RAG 搜索的来源。

Q12:使用 API 集成云 LLM 需要额外费用吗?

是的。云 LLM 服务(如 OpenAI、Google Gemini 等)根据提供商的 API 定价政策收费。QNAP 不收取此集成的额外费用。

Q13:为什么本地 LLM 无法启动?是否与 GPU VRAM 有关?

是的。如果本地模型的大小超过可用的 GPU 内存(VRAM),系统将无法成功加载模型,从而无法启动该功能。为确保正常运行,请检查您的 GPU VRAM 是否足够支持所选模型。如果资源不足,请考虑切换到较小的模型或升级您的 GPU 硬件。

这篇文章有帮助吗?

谢谢您,我们已经收到您的意见。

请告诉我们如何改进这篇文章:

如果您想提供其他意见,请于下方输入。

选择规格

      显示更多 隐藏更多
      open menu
      back to top