与我的网站私密对话(Local RAG)是什么?
有时候你只想快速提问一个具体网站,比如文档站、价格页、帮助中心或政策页。把页面内容一段段复制进聊天工具很麻烦,而为了这种轻量场景去用托管式抓取服务也往往太重。
这个工具把这类流程留在浏览器里。浏览器直接抓取可访问页面,提取可读文本,用 LangChain 做分段,建立本地索引,保存在 IndexedDB 里,再用检索到的页面片段在设备上生成答案,不需要把页面内容存到应用服务器。
网站问答很有用,但托管抓取往往不是你真正想要的
很多网站问题本身并不复杂,比如文档里怎么写额度、价格页有没有退款条款、政策页怎么说数据保留。
手工复制页面既重复又慢,而每次重新打开同一个站点又从头翻一遍也很浪费。
同时,并不是每一次站点问答都值得接入一个远程抓取器或托管索引系统。
当目标是在一台设备上做轻量、私密、可回溯来源的网站问答时,浏览器侧 local website RAG 很合适。
浏览器抓取、本地切块、本地 Voyager 检索、本地回答
工具从一个 URL 开始,抓取根页面,并在需要时跟随少量同源链接,再把可读内容转成可检索 chunk。
这些 chunk、向量和序列化后的 Voyager 索引会保存在 IndexedDB 中,方便同一设备以后继续使用。
当你提问时,浏览器会先从本地向量库中找出最相关的网站 chunk,再把它们送进端侧回答生成步骤。
如何使用与我的网站私密对话(Local RAG)
- 1输入根 URL - 从你想提问的 docs、pricing、help 或 policy 页面开始。
- 2选择抓取范围 - 设置适度的页面数量和同源深度,只扫描真正需要的页面。
- 3建立本地网站索引 - 让浏览器抓取页面、提取文本、生成向量并把 Voyager 索引写入 IndexedDB。
- 4