Open WebUI를 활용한 딥 리서치 방법
Open WebUI를 활용한 딥 리서치 방법 (feat. 네이티브 툴 콜링 파이프)
Deep Research for FREE: Open-WebUI can already do it (kinda)
유튜브 영상 "Deep Research for FREE: Open-WebUI can already do it (kinda)"를 참고하여 Open WebUI 환경에서 딥 리서치를 수행하는 방법을 설명합니다. Open WebUI는 Chat GPT의 딥 리서치 기능을 어느 정도 모방할 수 있으며, 특히 네이티브 툴 콜링 파이프 기능을 활용하면 더욱 효과적인 연구가 가능합니다.
1. 딥 리서치 데모 및 기본 개념
영상에서는 Gemini Flash Experimental 모델을 사용하여 니코틴 보충제의 인지적 이점에 대한 심층 연구 및 보고서를 작성하는 데모를 보여줍니다. 핵심은 모델에게 문제 해결 방식에 대한 구체적인 지침을 제공하는 것입니다. 예를 들어 인터넷 검색, 웹사이트 읽기, 요약, 모순 또는 누락된 정보 확인 등의 단계를 안내합니다. 또한, 검색 횟수 제한 및 보고서 형식 (마크다운)과 같은 추가 지침을 제공합니다.
2. 네이티브 툴 콜링 파이프 (Native Tool Calling Pipe)
Open WebUI의 기본 기능은 도구 호출을 한 번만 허용하므로, LLM이 웹 검색 결과에 따라 추가 검색 여부를 결정하는 등의 추론 능력을 제한합니다. 네이티브 툴 콜링 파이프는 이러한 제한을 극복하기 위해 LLM이 여러 도구를 순차적으로 호출하고 실행할 수 있도록 합니다. 이는 Open AI, Anthropic, Deep Sea와 같은 LLM의 내장 기능을 활용합니다.
네이티브 툴 콜링 파이프 설치 및 설정:
- Open WebUI 관리자 패널로 이동합니다.
- "함수 (Functions)" 섹션으로 이동합니다.
- "+" 아이콘을 클릭하여 새 함수를 추가합니다.
- 제공된 URL에서 코드를 복사하거나 직접 코드를 붙여넣습니다.
- Open AI 엔드포인트 API 키를 다시 설정하고 사용하는 모델 목록을 입력합니다 (설정 톱니바퀴 아이콘 클릭).
3. 리서치 도구 (Research Tool)
영상 제작자는 웹 검색 및 웹 스크래핑 도구를 결합한 "리서치 (Research)"라는 사용자 정의 도구를 만들었습니다. 이 도구는 웹 검색을 수행하고 Gina Reader API를 사용하여 웹사이트의 주요 콘텐츠를 추출합니다.
리서치 도구 활성화 및 사용:
- 새 채팅을 시작합니다.
- "네이티브 툴 (Native Tool)"을 지원하는 모델을 선택합니다.
- "더보기 (More)"를 클릭하고 "리서치 (Research)" 도구를 활성화합니다.
- 심층 연구를 위한 프롬프트를 입력합니다.
4. Open AI Deep Research와의 차이점 및 개선 방향
Open WebUI를 사용한 딥 리서치는 Open AI의 공식 Chat GPT 딥 리서치만큼 강력하지 않습니다. 주요 차이점은 다음과 같습니다.
- 모델 성능: Chat GPT 딥 리서치는 더 강력한 모델 (예: GPT-4)을 사용합니다.
- 백엔드 코드: Chat GPT는 컨텍스트 압축 및 병렬 처리와 같은 고급 기능을 제공합니다.
Open WebUI 딥 리서치 개선을 위한 아이디어:
- 더 강력한 모델 (예: DeepSeek Coder-V2)을 사용합니다.
- 컨텍스트 창 관리를 위한 사용자 정의 함수를 개발하여 웹 페이지 콘텐츠 요약 및 관련 정보 유지를 최적화합니다.
- 병렬 처리를 구현하여 검색 및 요약 작업을 동시에 수행합니다.
5. 단계별 사용 방법 (30단계)
- Open WebUI를 설치하고 설정합니다.
- 관리자 패널에 로그인합니다.
- "함수 (Functions)" 섹션으로 이동합니다.
- "+" 아이콘을 클릭하여 새 함수를 추가합니다.
- 네이티브 툴 콜링 파이프 코드를 복사하여 붙여넣습니다.
- 함수를 저장합니다.
- "모델 (Models)" 또는 "API 설정 (API Settings)" 섹션으로 이동합니다.
- Open AI 엔드포인트 API 키를 설정합니다.
- 사용하려는 모델 (예: Gemini Flash Experimental, DeepSeek Coder-V2)을 선택합니다.
- "도구 (Tools)" 섹션으로 이동합니다.
- 웹 검색 도구 및 웹 스크래핑 도구를 확인합니다 (또는 "리서치" 도구를 직접 구현).
- 필요에 따라 웹 스크래핑 도구 API 키 (예: Gina Reader API)를 설정합니다.
- 새 채팅을 시작합니다.
- "네이티브 툴 (Native Tool)"을 지원하는 모델을 선택합니다.
- "더보기 (More)"를 클릭하여 사용 가능한 도구 목록을 엽니다.
- "리서치 (Research)" 또는 웹 검색 및 웹 스크래핑 도구를 활성화합니다.
- 연구 주제에 대한 구체적인 프롬프트를 작성합니다 (예: "니코틴 보충제의 인지적 이점에 대한 심층 연구 및 보고서를 작성하십시오.").
- 모델이 문제 해결 단계를 이해하도록 자세한 지침을 제공합니다 (예: "인터넷 검색, 웹사이트 읽기, 요약, 모순 또는 누락된 정보 확인").
- 검색 횟수 제한을 설정합니다 (예: "최대 5번의 웹 검색").
- 보고서 형식을 지정합니다 (예: "마크다운 형식").
- 프롬프트를 제출하고 모델이 응답을 생성하도록 합니다.
- 모델이 웹 검색을 수행하고 결과를 요약하는 과정을 관찰합니다.
- 필요에 따라 프롬프트를 조정하여 검색 범위를 좁히거나 특정 측면에 집중합니다.
- 모델이 생성한 보고서를 검토합니다.
- 인용된 출처를 확인하고 정보의 정확성을 검증합니다.
- 보고서 형식을 편집하고 필요한 수정을 수행합니다.
- Open WebUI의 컨텍스트 창 관리를 모니터링합니다.
- 컨텍스트 창이 가득 차기 시작하면 이전 검색 결과 또는 요약을 제거합니다.
- 컨텍스트 압축을 위한 사용자 정의 함수를 개발하여 컨텍스트 창을 최적화합니다.
- 필요에 따라 다른 모델 또는 도구를 실험하여 결과를 개선합니다.
프롬프트 예시
Please perform in-depth research and write a report about the cognitive benefits – both long-term and short-term – of nicotine supplementation, including details about dosages. I need you to do a search on the internet, and then read these websites, and then summarize what you find and see contradictory information or missing information. I want you to do that for each of the sources you find, and when you still need some more information, do another web search and just continue with a maximum of five web searches. After this, write out a markdown-formatted report including citations.