섹션 1: RAG의 기본 개념과 LangChain 소개

LangChain은 RAG 구현에 필요한 컴포넌트를 제공하며, LLM(대규모 언어 모델)을 다양한 데이터 소스와 결합하여 지능형 애플리케이션을 구축하도록 돕습니다.


LangChain 설치 및 환경 설정 (개요)


# LangChain 설치
pip install langchain openai tiktoken gradio

환경변수 설정방법 (.env) 및 OpenAI API 인증키 등록

  1. .env 파일 생성:

OPENAI_API_KEY=your_openai_api_key

  1. Python에서 환경변수 로드:

from dotenv import load_dotenv
import os

load_dotenv()
api_key = os.getenv("OPENAI_API_KEY")
print(api_key)  # 환경 변수 확인


섹션 2: LangChain의 주요 RAG 컴포넌트 소개

1. 문서 로더 (Document Loaders)

문서를 다양한 형식에서 읽어와 LangChain에 전달합니다.


from langchain.document_loaders import TextLoader

loader = TextLoader("sample.txt")
documents = loader.load()
print(documents[0].page_content)


2. 텍스트 분할기 (Text Splitters)

긴 텍스트를 처리 가능한 단위로 분할합니다.


from langchain.text_splitter import CharacterTextSplitter

splitter = CharacterTextSplitter(chunk_size=200, chunk_overlap=20)
chunks = splitter.split_text("긴 텍스트 예제...")
print(chunks)