1. 다양한 문서 형식 처리하기

1.1 PDF 문서 가져오기 (PyPDFLoader 활용)

from langchain.document_loaders import PyPDFLoader

loader = PyPDFLoader("example.pdf")
documents = loader.load()
print(documents[0].page_content)

1.2 웹 문서 가져오기 (WebBaseLoader 활용)

from langchain.document_loaders import WebBaseLoader

loader = WebBaseLoader("<https://example.com>")
documents = loader.load()
print(documents[0].page_content)

1.3 JSON 문서 가져오기 (JSONLoader 활용)

from langchain.document_loaders import JSONLoader

loader = JSONLoader("example.json")
documents = loader.load()
print(documents[0].page_content)

1.4 CSV 문서 가져오기 (CSVLoader 활용)

from langchain.document_loaders import CSVLoader

loader = CSVLoader("example.csv")
documents = loader.load()
print(documents[0].page_content)