LangChain은 RAG 구현에 필요한 컴포넌트를 제공하며, LLM(대규모 언어 모델)을 다양한 데이터 소스와 결합하여 지능형 애플리케이션을 구축하도록 돕습니다.
# LangChain 설치
pip install langchain openai tiktoken gradio
.env
파일 생성:
OPENAI_API_KEY=your_openai_api_key
from dotenv import load_dotenv
import os
load_dotenv()
api_key = os.getenv("OPENAI_API_KEY")
print(api_key) # 환경 변수 확인
문서를 다양한 형식에서 읽어와 LangChain에 전달합니다.
from langchain.document_loaders import TextLoader
loader = TextLoader("sample.txt")
documents = loader.load()
print(documents[0].page_content)
긴 텍스트를 처리 가능한 단위로 분할합니다.
from langchain.text_splitter import CharacterTextSplitter
splitter = CharacterTextSplitter(chunk_size=200, chunk_overlap=20)
chunks = splitter.split_text("긴 텍스트 예제...")
print(chunks)