beomanro.com - 넓고 싶은 지식의 블로그

RAG Day 6: 프로덕션 배포와 최적화 – 실서비스 준비

RAG 시스템을 프로덕션에 배포하기 위한 RAG 평가 지표, 비용 최적화, 모니터링 방법을 알아봅니다. 실서비스 준비를 위한 완벽 가이드입니다.

RAG 시스템에서 컨텍스트 주입과 프롬프트 엔지니어링으로 답변 생성 품질을 높이는 방법을 알아봅니다. Claude 통합부터 출처 표시까지 실습합니다.

RAG 시스템의 검색 품질을 높이는 방법을 알아봅니다. 시맨틱 검색, 키워드 검색, 하이브리드 검색을 비교하고 리랭킹으로 검색 결과를 개선합니다.

RAG 시스템의 핵심인 임베딩과 벡터 데이터베이스를 알아봅니다. Voyage AI로 텍스트를 벡터로 변환하고, Supabase Vector와 pgvector로 벡터 데이터베이스를 구축합니다.

RAG 시스템의 첫 단계인 문서 처리와 청킹 전략을 알아봅니다. PDF 파싱, 마크다운 처리, 텍스트 분할 기법으로 RAG 전처리 파이프라인을 구축하고 검색 품질을 높이는 방법을 TypeScript로 구현합니다.

RAG(Retrieval Augmented Generation)란 무엇인가? LLM의 환각 문제를 해결하고 벡터 데이터베이스를 활용해 내 문서 기반으로 답변하는 AI 챗봇 시스템의 RAG 아키텍처를 TypeScript로 구현합니다.

AI Agent를 프로덕션 환경에 배포하는 방법과 최적화 전략을 알아봅니다. Claude Agent SDK를 활용한 에러 처리, 모니터링, 비용 최적화, 보안 고려사항을 실제 코드로 구현합니다.

여러 AI Agent가 협업하는 멀티 에이전트 시스템을 구축합니다. Claude Agent SDK로 Supervisor, Pipeline, Peer-to-Peer 오케스트레이션 패턴을 구현하고 코드 리뷰 멀티 에이전트 시스템을 만들어봅니다.

AI Agent의 메모리 시스템과 컨텍스트 관리 전략을 알아봅니다. Claude Agent SDK로 대화 히스토리, 장기 메모리, 상태 관리를 구현하여 개인화된 AI 에이전트를 만들어봅니다.

AI Agent가 도구를 사용하는 Tool Use 기능을 구현합니다. Function Calling의 개념부터 커스텀 Tool 구현, MCP 서버를 Agent 도구로 연동하는 방법까지 단계별로 알아봅니다.