내 웹사이트와 비공개로 대화하는 AI (Local RAG)란 무엇인가요?
문서 사이트, 가격 페이지, 도움말 센터, 정책 페이지처럼 특정 웹사이트에 빠르게 질문하고 싶은 경우가 많습니다. 페이지 내용을 매번 복사해 챗봇에 붙여넣는 일은 번거롭고, 그렇다고 이런 가벼운 목적을 위해 호스팅형 크롤러를 쓰는 것도 과할 수 있습니다.
이 도구는 그 흐름을 브라우저 안에 둡니다. 브라우저가 접근 가능한 페이지를 직접 가져오고, 읽기 쉬운 텍스트를 추출하고, LangChain 으로 내용을 나누고, 로컬 인덱스를 만들어 IndexedDB 에 저장한 뒤, 검색된 페이지 구절로 기기 안에서 답변을 생성합니다. 페이지 내용을 앱 서버에 보관할 필요는 없습니다.
웹사이트 Q&A 는 유용하지만, 호스팅 크롤링은 과할 때가 많습니다
궁금한 내용은 보통 좁습니다. docs 의 제한, 가격 페이지의 환불 조항, 정책 페이지의 보관 설명처럼 특정한 질문인 경우가 많습니다.
손으로 복사하는 방식은 반복적이고, 나중에 같은 사이트를 다시 볼 때도 같은 수고를 반복하게 됩니다.
그렇다고 몇 가지 질문을 위해 원격 인덱스나 호스팅 크롤러를 붙이는 것이 늘 적절한 것은 아닙니다.
한 기기 안에서 비공개로, 출처를 확인하면서 웹사이트에 질문하고 싶을 때 local website RAG 가 잘 맞습니다.
브라우저 fetch, 로컬 chunk 분할, 로컬 Voyager 검색, 로컬 답변
이 도구는 URL 에서 시작해 루트 페이지와 필요할 경우 소수의 동일 origin 링크를 가져오고, 읽기 쉬운 내용을 검색 가능한 chunk 로 바꿉니다.
chunk, 임베딩, 직렬화된 Voyager 인덱스는 IndexedDB 에 저장되므로 같은 기기에서 나중에 다시 열 수 있습니다.
질문 시 브라우저는 로컬 벡터 스토어에서 가장 관련 높은 사이트 chunk 를 꺼내 기기 내 답변 생성 단계에 전달합니다.
내 웹사이트와 비공개로 대화하는 AI (Local RAG) 사용 방법
- 1루트 URL 입력 - 질문하려는 docs, pricing, help, policy 시작 페이지부터 넣습니다.
- 2크롤 범위 선택 - 정말 필요한 페이지 위주로 스캔되도록 페이지 수와 동일 origin 깊이를 작게 잡습니다.
- 3로컬 사이트 인덱스 생성 - 브라우저가 페이지를 가져오고 텍스트를 추출하고 임베딩을 만들고 Voyager 인덱스를 저장하게 합니다.
- 4구체적으로 질문 - 가격, 약관, 문서, 도움말, 제품 세부사항처럼 구체적인 질문을 입력합니다.
- 5답변과 URL 확인 - 검색된 chunk 와 원본 URL 을 보고 어떤 페이지가 근거였는지 확인합니다.
핵심 기능
- 무료 사용
- 로그인 불필요
- 브라우저 내 처리
- 즉시 결과 제공
- 간단한 UI
장점
- 빠른 작업 처리
- 개인정보 보호
- 어떤 기기에서든 사용
- 설치 불필요
활용 사례
docs 조회
제한, 기능, 설정 요구사항, 설치 단계를 빠르게 확인합니다.
가격 및 정책 검토
환불, 플랜 차이, 보관 설명, 해지 조항을 몇 페이지에서 요약합니다.
헬프 센터 확인
지원 글과 FAQ 를 페이지별 복사 없이 질문합니다.
비공개 사이트 요약
접근 가능한 페이지의 로컬 스냅샷을 한 기기에 저장해 반복 질문합니다.
팁과 흔한 실수
팁
- 먼저 작게 크롤링해 가장 중요한 페이지부터 인덱싱하세요.
- 질문은 구체적으로 하고 실제 페이지 내용에 닿게 하세요.
- 답변이 지나치게 압축되거나 자신만만하면 source chunk 를 확인하세요.
- 핵심은 서버 크롤러 능력이 아니라 브라우저 직접 접근 가능 여부입니다.
흔한 실수
- CORS 나 bot 보호와 상관없이 어떤 사이트든 스캔된다고 생각하는 것.
- 완전한 기술 SEO 크롤러처럼 다루는 것.
- 필요한 건 몇 페이지인데 처음부터 너무 많은 페이지를 스캔하는 것.
- 참조 URL 을 보지 않고 맨 위 답변만 믿는 것.
설명 노트
- 브라우저 측 website RAG 는 브라우저가 페이지를 직접 가져올 수 있는지에 제약됩니다.
- 벡터 검색이 유용한 이유는 답이 여러 docs, pricing, policy 페이지에 흩어져 있기 쉽기 때문입니다.
- Voyager 는 가벼운 로컬 벡터 스토어를 제공하지만, 품질은 추출 텍스트와 임베딩에 달려 있습니다.
- 이런 도구는 대규모 크롤링이나 정식 감사보다는 목표가 뚜렷한 웹사이트 Q&A 와 요약에 강합니다.
자주 묻는 질문
제한 우회를 위한 프록시를 쓰나요?
아니요. 브라우저 전용 설계이므로 브라우저가 직접 가져올 수 있는 페이지에서만 작동합니다.
무엇이 로컬에 저장되나요?
페이지 metadata, 추출 chunk, 임베딩, 직렬화된 Voyager 인덱스, 로컬 채팅 기록이 IndexedDB 에 저장됩니다.
여러 도메인을 넘나들 수 있나요?
아니요. 특정 사이트 흐름을 전제로 하고, 제한된 동일 origin 링크만 따라갑니다.
호스팅 크롤러나 엔터프라이즈 사이트 검색을 대체하나요?
아니요. 한 기기에서 쓰는 가벼운 로컬 웹사이트 Q&A 도구입니다.
이미 사이트를 열 수 있는데 왜 유용한가요?
여러 페이지에서 관련 chunk 를 빠르게 모으고, 인덱스를 저장하고, 반복 수작업을 줄여주기 때문입니다.
관련 도구
더 알아보기 로컬 AI 도구
내 웹사이트와 비공개로 대화하는 AI (Local RAG)는 로컬 AI 도구 카테고리에 포함됩니다. 다른 무료 온라인 도구도 함께 확인해 보세요.
전체 보기 로컬 AI 도구