08 - 检索增强（RAG）：文档问答系统

约 228 字小于 1 分钟

LangChain

2026-03-08

一、什么是 RAG？

RAG（Retrieval-Augmented Generation） = 检索 + 生成

\
用户问题 → 检索相关文档 → 组合 Prompt → LLM 生成回答 \\

\\python from langchain_community.document_loaders import PyPDFLoader

loader = PyPDFLoader("document.pdf") pages = loader.load() \\

\\python from langchain_community.document_loaders import TextLoader

loader = TextLoader("file.txt") documents = loader.load() \\

\\python from langchain_community.vectorstores import Chroma from langchain_openai import OpenAIEmbeddings

vectorstore = Chroma.from_documents( documents=pages, embedding=OpenAIEmbeddings(), persist_directory="./chroma_db" )

results = vectorstore.similarity_search("查询内容", k=3) \\

\\python from langchain.chains import RetrievalQA from langchain_openai import ChatOpenAI

qa = RetrievalQA.from_chain_type( llm=ChatOpenAI(), chain_type="stuff", retriever=vectorstore.as_retriever() )

answer = qa.run("文档的主要观点是什么？") \\

下一课：09 - 工具