构建私有RAG知识库的完整流程-迪斯科星球

目标：用本地LLM（如Ollama运行的开源模型）加载你的Markdown知识库，实现快速查询。

预处理：PDF → Markdown（如上）。
分块与嵌入
- 用LangChain或LlamaIndex加载Markdown文件。
- 分块策略：按标题/段落分（MarkdownNodeParser），chunk_size 约500-1000 token。
- 嵌入模型：本地用nomic-embed-text（Ollama支持）或bge-m3（中英文强）。
向量数据库（本地持久化）
- ChromaDB（最简单，轻量）。
- 或Milvus（更专业，支持大规模）。
本地私有LLM
- 用Ollama运行开源模型：如Qwen2（中文强）、Llama3、DeepSeek等。
- 完全本地，无需API，隐私保障。
RAG框架与界面
- 简单版：LangChain + Streamlit/Gradio建聊天界面。
- 开箱即用推荐：
  - AnythingLLM：一键本地部署，支持上传PDF/Markdown，直接建知识库，集成Ollama。
  - RAGFlow：深度文档解析，适合学术文献。
  - LangChain-Chatchat：中文优化强，支持多知识库。

企业官网建设流程全解析