滚水科技
官网English预约方案沟通
Production-ready / 私有化

GSAI · 2026 · 06 · 0024

AI Solution Brief

把企业散落的知识,变成 可问、可信、可追溯 的私有 AI 专家

基于 RAG 架构整合 Confluence / SharePoint / Notion / 共享盘 / 业务库等多源数据,提供 私有化部署 + 答案全量可追溯 + 权限继承 的企业知识问答平台。让员工像问专家一样问公司。

预约方案沟通了解技术架构
10 分钟阅读 · v1.0 · 更新于 2026 年 6 月
92.4%
检索准确率
Top-3 Hit · 混合检索
< 2.5s
端到端响应
P95 ≤ 4.0s
-68%
专家咨询量
上线 90 天对比
100%
答案引用率
每条回答可溯源
知识库 RAG · Live
实时索引
数据源
Confluence
Wiki · 8.2K
SharePoint
文档 · 21.0K
Notion
团队 · 4.6K
共享盘
PDF/Word · 56.0K
业务库
MySQL · 32.4K
工单系统
Ticket · 2.2K
6 源 · 12.4 万文档
RAG Hub
Pipeline
01 Parse02 Chunk03 Embed04 Retrieve05 Generate
回答 · 带引用
Q: 新员工怎么申请 VPN?
A: IT 服务台 → 提交《远程访问申请》→ 主管批准 → 自动开通
[1][2]
Q: Q3 销售返点政策?
A: 标准客户 3-5% · 战略客户最高 8%,详见返点矩阵
[1][2][3]
Q: 客户合同里能加这条款吗?
A: 可加。参照模板第 14.2 条 · 已通过 2024 法务评审
[1][2]
100% 可溯源
Top-3 命中
92%
响应 P50
2s
引用/答
3+
00/BACKGROUND

企业知识管理,正在从「文档堆」走向「专家系统」

过去 20 年,企业把知识塞进 Wiki、SharePoint、共享盘 —— 但搜得到 ≠ 用得上。员工依然问老员工、问群,90% 的内部知识在工具里安静地积灰。RAG(Retrieval-Augmented Generation)把检索能力和大模型理解能力组合起来,让企业知识第一次具备「被问答」的能力。

知识载体PDF / Word / PPT / Excel / Confluence / 邮件 / 聊天
现状流程全文搜索 + 人工筛选 + 老员工兜底
失败模式搜不到 / 搜错 / 看不懂 / 没人讲
我们的目标可问答 + 可追溯 + 可治理
01/PROBLEM

企业知识管理的 4 个老问题,通用大模型解决不了

ChatGPT / 通义 / 文心一类通用模型对企业私有知识完全不了解,但回答时不会承认。在法务、合规、技术决策场景下,这种'自信的胡说'是致命的。

P-01 · Pain

知识散在十几个系统里

一个完整流程的资料可能横跨 Confluence(规范)+ SharePoint(模板)+ 群文件(变更)+ 老员工记忆(隐性知识)。单点搜索找不全,跨系统搜索找不到。新员工 onboarding 要踩 3 个月的坑。

P-02 · Pain

老员工是搜索引擎,流失即知识流失

流程怎么走、客户为什么这么对接、上次那个 bug 怎么 fix —— 都在几个老员工脑子里。一个人离职,带走的不只是经验,还有公司的'问答能力'。

P-03 · Pain

通用大模型会自信地胡说

通用模型对企业私有知识一无所知,但回答时不会承认 —— 它会'幻觉'出听起来合理但完全错误的内容。一旦真信了,合规、客户、决策风险全都来。

P-04 · Pain

私有数据上云是合规死区

客户数据、合同、技术方案、人员档案不能上公有云。但内部又确实需要 AI 能力 —— 这两条诉求过去几乎不可调和,现在必须有第三条路。

Industry
通用 · 不限行业
Volume
10 万 - 数百万文档
Current flow
全文搜索 + 找人问
Goal
私有化 RAG + 可追溯
02/SCENARIOS

一套架构,五个能直接落地的场景

RAG 不是一个 chatbot,是企业知识层的基础设施。下面 5 个场景是同一套底座可以串起来的典型落地点。

S-01

员工 onboarding 助手

HR · 新员工

onboarding 文档 + 制度手册 + 流程图全部喂进 RAG,新员工'问公司'得到答案

Metric
平均上手时间 -60%
S-02

IT / 流程自助问答

全员

报销怎么报、VPN 怎么连、设备申请走哪个流程 — 不再为日常问题占用 IT 资源

Metric
IT 工单量 -55%
S-03

销售知识助手

售前 · BD

产品手册 + 标准回答 + 竞品对比 + 历史案例,售前现场问答现拿现用

Metric
首响应时间 -70%
S-04

客户支持 Tier-1 自动应答

客服

接入工单系统,客户问题先由 RAG 起草答案,人工审核 / 直接回复

Metric
工单解决率 +40%
S-05

法务 / 合规知识查询

法务 · 合规

合同模板 + 历史判例 + 法规库,问'这条款 OK 吗'得到引用具体条文的回答

Metric
合规审查耗时 -50%
03/CAPABILITIES

三大核心能力,逐一可视化拆解

从员工'问'到系统'答',从答案到来源,从权限到审计 —— 我们把 RAG 的三个最高价值环节拆开,让每一步都可以被看见、被验证、被追责。

请问:Q3 销售返点政策怎么算? RAG
AI 回答可信度 87%

标准客户 3-5% 返点 [1],战略客户最高 8% [2]。详见返点矩阵 v2026.Q3 [3]。

引用来源 (3)
[1]Confluence · 销售返点制度2026.06
[2]SharePoint · 战略客户清单2026.05
[3]Notion · 返点矩阵 v2026.Q32026.07
12下一步:起草客户邮件
Top-3 命中
92.4%
平均响应
2.1s
C-0103-A · Q&A + Citation Chain

跨源问答 + 100% 引用回答

每条事实都可点开看原文

员工用自然语言提问,系统在 Confluence / SharePoint / Notion / 共享盘等多源中做混合检索,LLM 生成回答时强制每个事实点带 [n] 引用,可悬浮看原文。低置信度查询自动降级为'未找到'而不是'编一个'。

  • 跨源混合检索(Confluence + SharePoint + Notion + 共享盘 + 业务库)
  • 100% 强制引用,每条事实点带 [n] 引用 chip
  • 引用悬浮显示原文段落 + 文档路径 + 最后更新时间
  • 答案置信度评分(retrieval quality + LLM 自评)
  • 反馈闭环(👍 👎)注入持续学习,周度迭代
查询:EVA 估值法详解 filters: dept=fin
01 · BM25 全文检索
1财务规范-EVA章节hit 0.84
2估值方法论hit 0.71
3案例-EVA法应用hit 0.66
02 · 向量检索(BGE-M3)
1财务规范-EVA章节sim 0.89
2估值方法论sim 0.76
3案例-EVA法应用sim 0.71
03 · 合并去重45 候选
04 · Cross-Encoder Rerank+24pp
①EVA 模型详解
0.96
②财务规范-EVA章节
0.91
③案例-EVA法应用
0.84
Rerank 精度提升
+24pp
幻觉率
< 2%
C-0203-B · Hybrid Retrieval + Rerank

混合检索 + Cross-Encoder 重排

看得见的召回管线,而不是黑盒

一次查询并行打 BM25 全文检索和向量语义检索,候选合并去重后由 Cross-Encoder 重排校准相关性。诊断面板可视化每一步的 hit 分、score、过滤项,任何一次召回失败都能定位到具体环节。

  • BM25 关键词检索 + BGE-M3 向量语义检索并行
  • Cross-Encoder 重排,Top-K 精度 +24pp
  • 多语言 Embedding 中英术语对齐,跨语言可问可答
  • 元数据过滤(部门 / 时间 / 权限 / 文档类型)
  • 召回诊断面板,可回放每一次查询的全过程
权限继承面板
员工 A · 销售部
12,400
可见文档
✓Confluence:营销
✗Confluence:法务
✓SharePoint:Sales
✗SharePoint:Legal
✓Notion:客户线索
员工 B · 法务部
8,200
可见文档
✗Confluence:营销
✓Confluence:法务
✗SharePoint:Sales
✓SharePoint:Legal
✗Notion:客户线索
审计日志 · 最近 1h共 47 条
14:32用户 A客户名单答 · 引用 2 篇
14:28用户 B合同模板 v3.1答 · 引用 3 篇
14:21用户 C薪酬清单越权拦截
14:18用户 A客户支持流程反馈 👍
越权事件
0
审计覆盖
100%
C-0303-C · ACL Inheritance + Audit

权限继承到字段 + 全量审计

数据不出企业,谁问了什么都留痕

RAG 从源系统(Confluence Space / SharePoint Site / Notion Workspace)实时继承 ACL,用户在 RAG 里看到的内容严格等于他在源系统里能看到的;越权访问自动拦截 + 告警;所有问答全量留痕,可追溯到用户 / 问题 / 引用文档 / 模型版本。

  • 源系统 ACL 实时继承(Confluence / SharePoint / Notion)
  • 部门 / 角色 / 字段级细粒度权限
  • 全量问答审计,可追溯到用户 / 文档 / 模型版本
  • 越权访问自动拦截 + 实时告警
  • 合规导出(等保三级 / GDPR / ISO 27001)
03/ARCHITECTURE

一条可解释、可演进的 RAG 管线 + 私有化部署架构

我们坚持把 RAG 当作管线而不是黑盒:每一步都有明确职责、明确输入输出、明确兜底策略。下面是 5 层架构 + 5 阶段处理管线。

5 阶段处理管线

从文档拉取到答案返回,管线每一步都可观测、可干预、可回放。任何一步质量下降都能定位到具体环节。

01
Ingestion · 多源拉取
实时增量同步

通过原生 connector 拉取 Confluence / SharePoint / Notion / 共享盘 / 业务库等多源数据,支持全量初始化 + 增量同步 + Webhook 推送,文档生命周期与源系统对齐。

Confluence APIGraph APINotion APIS3 / FTPWebhook
输出归一化文档对象 + 元数据 + 权限继承标签
02
Parsing & Chunking · 结构化解析
语义分块

PDF / Word / PPT / Excel / 扫描件等异构文档统一解析为结构化对象;分块不是固定字数切,而是按章节、段落、表格等语义边界切,保留上下文。

PaddleOCRUnstructuredMarkdown 化语义分块
输出带语义边界的 chunk + 章节路径 + 元数据
03
Embedding & Indexing · 向量化
多语言 + 业务调优

多语言 Embedding 模型(BGE-M3 / text-embedding-3),覆盖中英文及垂直业务术语;chunk + 元数据存入向量库,同时建 BM25 全文索引,为混合检索做准备。

BGE-M3Milvus / QdrantBM25倒排索引
输出向量 + 全文双索引 + 元数据图谱
04
Retrieval & Rerank · 混合检索
Hybrid + Cross-Encoder

查询同时打向量检索 + BM25 全文,候选合并后通过 Cross-Encoder 重排;支持元数据过滤(部门 / 时间 / 权限)和查询改写。

Vector SearchBM25Cross-Encoder Rerank元数据 filter
输出Top-K 高相关 chunk + 召回解释
05
Generation & Citation · 生成与引用
强制引用 + 幻觉过滤

LLM 基于检索结果生成回答,强制每个事实点引用 chunk 来源;Self-RAG 校验回答是否被检索支撑;不确定时返回'未找到'而不是'编一个'。

DeepSeek / Qwen / LlamaSelf-RAG引用强制置信度评分
输出可追溯回答 + 来源引用 + 置信度
5 层架构

5 层架构

五层各司其职、可独立替换演进。任何一层都可以从云服务切到自部署,从 SaaS 模型切到自训练模型。

应用层
Web 问答 · 企业微信 / 钉钉 / Slack 集成 · Open API · 管理后台
生成层
LLM 推理 · 强制引用 · Self-RAG 校验 · 答案置信度 · 幻觉过滤
检索层
Vector DB(Milvus / Qdrant)· Hybrid Search · Cross-Encoder Rerank · 元数据过滤
处理层
PDF / Word / PPT / Excel 解析 · OCR · 语义分块 · 多语言 Embedding(BGE-M3)
接入层
Confluence / SharePoint / Notion / S3 / MySQL / 飞书 · 实时增量同步 · Webhook
04/SCENARIOS IN ACTION

三个代表性场景,看 RAG 在企业里实际跑起来是什么样

下面是三个代表性场景化呈现(已抽象与脱敏),帮助你判断在自己组织里 RAG 能解决什么、落地后是什么样。

法律服务

中型律所 · 合规与判例库

接入 12 万份历史合同 + 法规条文 + 行业判例。律师问'这条款在 X 行业有没有过判例支持',RAG 返回具体判例号 + 关键引文 + 风险等级,审查耗时从平均 4 小时压到 2.2 小时。

首轮审查耗时
-45%
引用率
100%
条款查全率
+38%
高端制造

制造业集团 · 工艺与设备文档库

8 万份工艺规范 + 设备说明书 + 故障案例。一线工程师扫码即问'这台设备报 E-217 怎么处理',RAG 拿出处置 SOP + 历史案例 + 责任人。新工程师 onboarding 周期从 90 天压至 35 天。

Onboarding 周期
-61%
故障平均解决时间
-42%
重复求助率
-58%
互联网 / SaaS

中型 SaaS 公司 · 全员 IT 自助

把 IT 制度、流程、常见问题、历史工单全部喂入。员工在飞书内 @RAG 助手问'换电脑怎么走流程',RAG 一次答清楚 + 自动起草 OA 申请。月均 IT 工单从 1200 单降到 540 单。

IT 工单量
-55%
首响应时间
30s → 即时
员工满意度
+22 NPS

上述场景为代表性呈现,实际项目数据按合作客户脱敏后另行交付。

05/SECURITY

数据不出企业,权限继承到字段

RAG 是企业的'神经中枢',它的安全性等于企业数字资产的安全性。我们把安全设计放在和功能同等优先级,而不是上线后补丁。

S-01

私有化部署

支持完全私有云 / 混合云 / 国产化适配(信创 · 鲲鹏 · 飞腾)。所有处理、向量库、模型推理都在企业内网完成,数据全程不出企业。

S-02

权限继承

从源系统(Confluence / SharePoint / Notion)继承 ACL,RAG 不会让人看到他在源系统里看不到的内容;支持部门 / 角色 / 字段级权限。

S-03

审计与可追溯

所有问答全量留痕,可追溯到具体用户 / 问题 / 引用文档 / 模型版本。每条回答的引用链都可点开看原文。

S-04

全链路加密

传输 TLS 1.3,存储 AES-256;向量库与文档库独立加密;支持企业 KMS 接入,密钥不出企业。

S-05

合规支持

等保三级 / GDPR / ISO 27001 / 金融行业监管要求全面支持;提供合规检查清单与渗透测试报告。

S-06

模型隔离

可选 100% 自部署 LLM(DeepSeek / Qwen / Llama),不依赖任何第三方 API;模型与检索全部在企业内运行,无外发请求。

Related solutions

更多滚水科技解决方案

覆盖 AI、金融文档、OCR、安防、IoT 与会员运营等场景,按行业组合落地。

  • AI 金融文件自动化

    AI 金融文件自动化

    招股书、年报、通函、Offering Circular 等高价值文件的中英文术语一致性、版本差异比对与项目流转端到端自动化方案。

    • AI
    • 金融文档
    • 自动化
    了解方案→
  • AI 订单识别 OCR

    AI 订单识别 OCR

    面向供应链与电商团队的订单 OCR 自动化方案:手写图片识别、字段提取、ERP 对接,准确率 96%+。

    • AI
    • OCR
    • ERP 集成
    了解方案→
  • AI 安防识别系统

    AI 安防识别系统

    边缘计算 + 多模态大模型的智能安防方案:99.7% 准确率、<50ms 响应、7×24h 在线,覆盖公共安全与智慧交通等场景。

    • AI
    • 边缘计算
    • 安防
    了解方案→
Let's Talk

如果你有一个还没解决的具体场景,我们一起看看 AI 是不是合适的解法。

我们会和你一起把场景拆开,判断这个问题是否值得用 AI 来做、用哪一种 AI 做最划算,并在 5 个工作日内给你一份可落地的初步方案与报价。

商务邮箱
contact@boilingwater.cn
公司地址
深圳市龙岗区京基御景时代大厦南塔 10 层

请先完成 Cloudflare 验证后再提交。

点击提交即代表你同意我们仅就本次咨询使用你的信息。我们承诺不会用于任何营销骚扰。

滚水科技

私有化部署的企业知识 RAG 平台,整合 Confluence / SharePoint / Notion / 共享盘 — 答案可追溯、权限继承、数据不出企业。

联系我们
© 2026 滚水科技 Wavesteam Technology. 保留所有权利。
邮箱:contact@boilingwater.cn地址:深圳市龙岗区龙城街道黄阁坑社区京基御景时代大厦南塔 10 层