2026-06-25·灿海星图指南

Dify零代码搭AI应用：30分钟和一个502报错

金

金柘

#Dify#AI应用#低代码#教程#Benchmark

想做AI聊天机器人但不会写代码。或者会写代码但不想从头搭RAG管道、管向量库、写前后端。每次想做个东西光环境就得折腾半天——Dify解决的就是这个。

本文是一篇实操指南，预计20分钟完成全部操作。

核心操作

用户输入 → Dify(工作流引擎+知识库+RAG管道) → 灿海星图API → 模型返回
                                        ↓
                                  向量库(Milvus/Qdrant)

Dify管理整个LLM应用的逻辑——你定义"干什么"，它自动编排底层调用。

bash

git clone https://github.com/langgenius/dify
cd dify/docker
cp .env.example .env
# 编辑.env设置数据库密码
docker compose up -d

启动后访问 http://你的IP，初始化管理员账号。

Step 1：接入灿海星图

设置 → 模型供应商 → 添加 OpenAI 兼容提供商。填入灿海星图 API 地址和 Key。默认模型选 DeepSeek-V4-Flash（性价比最高）。

Step 2：创建知识库

上传 PDF/Markdown 文件。选 Embedding 模型（推荐 BGE-large-zh，中文文档首选）。向量化后你的文档就可以被 AI"读懂"了。

Step 3：创建应用

选"对话型应用"→ 关联知识库 → 配置 Prompt 模板。一个 AI 客服/知识库就完成了。

测试条件：300份PDF合同，512 chunk，BGE-large-zh + DeepSeek-V4-Flash[¹]。

Dify适合快速验证和原型。日调用量超5000次或需要毫秒级检索时，该考虑自建RAG。

看场景。内部知识库问答78%够用——员工查不到会多问。面向客户的客服，78%意味着每5个问题错1个。上生产做三件事：PDF先转Markdown消除格式损耗、top_k控制在5-8、加"检索结果置信度阈值"让低分结果走人工兜底。

中文文档用 BGE-large-zh，但内存开销大（约1.3GB）。2C4G小服务器用 BGE-small-zh（约120MB），准确率降5-8个点但不OOM。中英混合或带代码片段的文档用 text-embedding-3-large 更通用。

社区版代码全开源，没有商业限制。真正的瓶颈在服务器——2C4G约支撑5-10个并发用户。另外默认用Weaviate内置模式，生产环境建议单独部署Milvus或Qdrant，否则向量库和数据共享磁盘IO，检索慢到不可用。

Dify省的不是写代码的时间——是改需求的时间。原型阶段需求5天改3次，每次改代码要重新搭管道。Dify拖拽式修改5分钟搞定。但如果需求稳定、调用量高（日5000+），手写RAG的4小时初始投入很快被更高的检索准确率和并发能力赚回来。

数据来源：[¹] 作者实测数据，测试环境为Dify社区版v0.15 + DeepSeek-V4-Flash + BGE-large-zh，300份中文PDF合同文档（平均8页/份）；MinerU为PDF预处理工具。