RAG Day 6: 프로덕션 배포와 최적화 – 실서비스 준비
RAG 시스템을 프로덕션에 배포하기 위한 RAG 평가 지표, 비용 최적화, 모니터링 방법을 알아봅니다. 실서비스 준비를 위한 완벽 가이드입니다.
RAG 시스템을 프로덕션에 배포하기 위한 RAG 평가 지표, 비용 최적화, 모니터링 방법을 알아봅니다. 실서비스 준비를 위한 완벽 가이드입니다.
RAG 시스템에서 컨텍스트 주입과 프롬프트 엔지니어링으로 답변 생성 품질을 높이는 방법을 알아봅니다. Claude 통합부터 출처 표시까지 실습합니다.
RAG 시스템의 검색 품질을 높이는 방법을 알아봅니다. 시맨틱 검색, 키워드 검색, 하이브리드 검색을 비교하고 리랭킹으로 검색 결과를 개선합니다.
RAG 시스템의 핵심인 임베딩과 벡터 데이터베이스를 알아봅니다. Voyage AI로 텍스트를 벡터로 변환하고, Supabase Vector와 pgvector로 벡터 데이터베이스를 구축합니다.
RAG 시스템의 첫 단계인 문서 처리와 청킹 전략을 알아봅니다. PDF 파싱, 마크다운 처리, 텍스트 분할 기법으로 RAG 전처리 파이프라인을 구축하고 검색 품질을 높이는 방법을 TypeScript로 구현합니다.
RAG(Retrieval Augmented Generation)란 무엇인가? LLM의 환각 문제를 해결하고 벡터 데이터베이스를 활용해 내 문서 기반으로 답변하는 AI 챗봇 시스템의 RAG 아키텍처를 TypeScript로 구현합니다.