使用 Dify + DeepSeek 打造自己的本地知识库问答

前言

扣子大家大部分同学应该不会太陌生，可能有的同学或多或少都已经用过了，但是总觉得把一些信息源放到上面会泄漏（特别是公司内部使用，有一些内容可能涉密），此时我们便可以自己部署一个类似 Coze 的开源项目 - Dify。

术语

知识库：知识库在大模型中指的是能够存储、检索和传播大量知识信息的系统结构或数据库形式。大模型通过学习丰富的上下文对话数据，可以理解、处理和生成自然语言，从而构建了一个动态的知识库。这个知识库包含了大量的语料数据，如文本、图片、视频等，为模型在不同场景下提供参考，并帮助模型进行理解和推理。在训练过程中，模型会不断更新和扩展这个知识库的内容，使其能够更好地理解用户意图并生成相关回应。

工作流：工作流是大模型中的一个概念，它通常用于描述模型在处理输入数据时的流程步骤。具体来说，工作流可能指的是从输入到输出的计算过程，其中包含各个阶段的数据处理和信息整合。这可以帮助我们理解大模型是如何将各种信息组织起来并逐步转化为输出结果的过程。

安装 Dify

1. 安装 Docker

安装 Docker Desktop
从 Docker 官网下载 macOS 版本的安装包（.dmg），双击运行并拖拽至应用文件夹。首次启动需接受服务协议，并选择“推荐设置”以自动配置环境。

2. 克隆 Dify 代码并配置环境

克隆仓库
在终端中执行以下命令，将 Dify 代码克隆到本地：
bash
```
git clone https://github.com/langgenius/dify.git
```
复制环境变量文件
进入 Docker 目录并复制示例配置文件：
bash
```
cd dify/docker
cp .env.example .env
```
根据需求修改 .env 文件（如调整端口或密钥）。

3. 启动 Dify 容器

一键启动服务
根据 Docker Compose 版本选择命令：
bash
```
# Docker Compose V2
docker compose up -d
```
成功启动后，会创建多个容器，包括数据库（PostgreSQL）、缓存（Redis）、向量引擎（Weaviate）等。
检查容器状态
运行 docker compose ps 确认所有容器处于“Up”状态，尤其是 api、web、worker 等核心服务。

如果看到图下几个服务均运行完成，即可开始下一步。

4. 初始化与访问 Dify

完成管理员设置
浏览器访问 http://localhost/install，设置管理员账号和密码。

如果打开后，一直是如下图的情况，不要着急，可以打开 F12，在 Network 中，找到 setup 请求，看看是否已经正常返回 200（我这边大约1分钟左右）。请求成功后刷新页面即可看到图二中的设置账户密码页面。

登录主界面
访问 http://localhost 进入 Dify 工作台，可开始创建 AI 应用或配置大模型。

Dify 添加模型

在首页右上角，找到个人信息处（右上角），点击设置。切换到模型供应商 Tab 页签。

找到 Ollama，点击添加应用。

添加聊天模型

填写添加模型的对应表单内容

添加文本模型

表单填写参考

模型名称：

在终端，执行 ollama list 查看自己在 Ollama 中已经下载的模型。

如果还没有安装，请查阅这个文档《五分钟让你本地部署一个 DeepSeek （快速指北）》https://giao.club/posts/1739113066711.html

➜  ~ ollama list
NAME                  ID              SIZE      MODIFIED
deepseek-r1:latest    0a8c26691023    4.7 GB    About an hour ago
deepseek-r1:1.5b      a42b25d8c10a    1.1 GB    5 days ago