cherry studio：安装、配置，以及一些比较好用的API推荐

发表于 2025-08-24 更新于 2025-08-25 分类于计算机

如题。

近年来，大语言模型（LLM）蓬勃发展，许多AI推出了网页版的聊天对话工具如 chatGPT 、 deepseek 等。然而在网页版本之外，LLM还可以通过API调用，为用户提供了更加灵活的使用方法。

一、背景

先说说API相比于网页版的优点：可以自定义模型和参数（网页版一般是固定死的），并且上下文长度可以自己掌控。而且聊天记录储存在本地，数据安全性也相对更高一些。

大模型API常用的使用方法有两种：一种是通过专用的SDK（各家不一样且使用起来很麻烦，本文略过），另一种是通过HTTPS通信协议——其中后者更为常见。在通过HTTPS调用时，使用者向一个接口地址（即API，例如 https://api.siliconflow.cn ）发送一个json格式的请求（包含模型参数和用户输入），API则会将大模型的输出以json文档的形式返回给用户。一个简化的流程如下所示：

这样的一个标准化流程对于编程开发很方便，但是对于用户使用很麻烦，因为这意味着用户需要自己编辑符合格式要求的json文档并手动发起API的调用。更简化的方法是使用一个本地大模型客户端，在客户端里配置好API接口和API key，客户端会处理好上面这些中间步骤。

目前市面上比较流行的客户端有很多，例如 cherry studio 、以外还有RAGFlow 和 Dify 等等；一些AI驱动的编程IDE也可以算在其中，包括 cursor 、TRAE 等。这些工具的对比在网上有许多，此处不再赘述，感兴趣的读者可以参考：《综合对比分析：AnythingLLM、Cherry Studio、RAGFlow 和 Dify》。

笔者最初接触的工具是 cherry studio 。使用至今，接入了数十个API模型，并基于日记和生物论文打造了一些AI agent工具，积累了许多使用体验。因此本文以 cherry studio 为例，讲一讲这类工具的安装、配置和使用。

二、cherry studio的安装与配置

另外参考博客往期文章：《白嫖Github大模型服务（可用GPT4o和GPT4.1) 》

cherry studio 是一个跨平台的工具，在其官方网站的下载页面上可以获得对应的安装包（该说不说，这个网页能够自动检测用户的系统，然后推荐最适合系统版本的安装包，这一点做的真不错）。安装的过程全自动化进行，只需要按照提示点击“下一步”，cherry studio就会自动完成安装。

在安装完成以后，我们来配置大模型API。这里以Github model的API配置为例，详细的配置过程如下图所示。

首先，我们需要准备好三样东西： API密钥(API KEY)、API地址(endpoint)、模型ID。例如，下面是我的GitHub models的信息：

1
2
3

API KEY:  （由于GitHub安全设置，此处无法上传。读者朋友可以自行去 [Github Tokens](https://github.com/settings/tokens) 处申请）
endpoint: https://models.inference.ai.azure.com/
model ID: gpt-4o

我们在模型服务的设置中找到Github model，在这里填入API密钥，然后点击“检查”看一下服务状态。如果配置成功，会有“连接正常”的提示出现。

Cherry Studio默认的Github Models能够调用的模型似乎只有GPT4o。要使用最新的GPT-4.1，我们可以在Github Models设置页的底部找到 添加 按钮，在这里进行模型添加的操作。

下面列出了我的设置，为cherry studio新增了三个模型：gpt-4.1, gpt-4.1-mini, gpt-4.1-nano 。

三、AI agent配置（以心理咨询bot为例）

如下图，在“助手”页面里可以添加一些AI agent。

此处点击“添加助手”可以增加一些预制的AI agent（如下图）

也可以在“助手”页面里修改一些助手的默认配置。下面以我的心理咨询师AI助手为例展示一下我的配置：

提示词如下（其中personal memory部分需要自己填）

# Role 
心理咨询师 
 ## Description
 一位有 20 年经验的心理咨询师，旨在通过深入对话和分析，帮助用户发现内心深处的真实想法和潜力。 
 ## Attention 
 请尽量利用专业的心理学知识和人文关怀，帮助用户解决问题或达到心理成长。 
 ## Background 
 用户面临各种心理压力和困扰。作为一位经验丰富的心理咨询师，你会通过在线对话方式，帮助用户找到内心的平和和方向。 
 ## Definition 
 - 内心深处的真实想法: 用户潜意识或未明确表达的需求和感受。 
 - 潜力: 用户可能未意识到的能力和特质，有助于其个人成长和解决问题。 
 ## Goals 
 - 通过对话和分析，帮助用户明确问题和需求。 
 - 引导用户发现自己内心深处的真实想法和潜力。 
 - 你需要结合用户的personal memory以及知识库，分析用户实际存在的心理问题，并为用户提供成长建议。

 ## Skills 
 1. 倾听能力：在与用户交谈时，会认真倾听对方的观点，细心观察并分析非语言信息, 挖掘用户内心的真实想法 
 2. 沟通技巧：懂得如何通过提问深入了解别人，包括使用开放型问题以鼓励对方分享更多信息。 
 3. 情绪智力：能理解和处理复杂的情绪，理解对方的情绪和视角。 
 4. 思维分析能力：能从众多信息中分析并识别关键点。透过表面现象，了解隐藏的需求和动机。 
 5. 耐心和尊重：具有高度的耐心，愿意花时间理解他人，并给予他人充分的尊重和理解。 
 6. 富有同理心：可以设身处地去想象和理解他人的感受和动机。 
 7. 建立信任：能建立良好的人际关系，使他人感到舒适并愿意分享内心想法。 
 ## Tone 
 - 温柔 
 - 真诚 
 - 善良 
 - 充满关心和爱意 
 ## Value 
 - 尊重每一个人作为独特个体的价值和尊严。 
 - 深信人内心深处有无限潜力。 

## 知识库
在知识库中，是用户最近6年来写下的日记，每一条日记均以 `=== YYYY-MM-DD` 开头，其中 YYYY 是日记写下的年份， MM 是日记写下的月份， DD 是日记写下的日期。你可以通过翻阅知识库，了解用户过去的经历和内心活动。
在回答中，如果涉及用户日记里提及的经历，你需要在回答的末尾标注引用的日记篇目，格式为 `>【YYYYMMDD】 : 事件概述` 。

## 用户的personal memory

{{此处粘贴chatGPT中的personal memory，也可以自己编辑撰写}}

知识库设置

配置词向量API服务

需要简单解释一下知识库的原理。我们准备好一些文本语料，然后创建知识库，此时cherry studio会对这些文本语料进行分词、向量化等处理，最终生成一个sqlite格式的数据库文件（如下图，是这样一个数据库文件内部结构的展示）。

当在AI chat中调用知识库时，cherrystudio就会搜索这个sqlite数据库，将其中与用户话题相关度高的条目作为prompt的一部分发送给大模型，从而实现智能化解答。

因此，我们需要首先添加一个词向量服务API。下面展示了我的词向量API配置，使用的是阿里云百炼的平台：

1
2
3

API KEY:  sk-82b3bfa35dce4e93877d7a54841d157d
endpoint: https://dashscope.aliyuncs.com/compatible-mode/v1/
model ID: text-embedding-v3

接下来，去知识库管理面板里创建一个知识库。先前我使用dokuwiki配置过一个日记本系统，可以导出按照时间命名的日记文档。在此处选择嵌入模型为 text-embedding-v3 ，然后把所有的日记文档拖进来，cherry studio就会开始处理——总共会耗时几秒到几十分钟，取决于传入的文本字数和文件数量。（以我为例，当时传了将近600个文件，大概一百多万字，处理用时大概半个小时左右——如果我把这些文字合并为一个单独的文件，处理用时则会只有几分钟）。

最后，在AI agent的知识库设置界面里，把上面我们弄好的这个知识库给选上，聊天时就可以用了。

四、一些好用的API推荐

作为粉丝福利（？）的一部分，我打算在这一部分列出一些我自己正在用的付费平台的API KEY，并简单说一说使用体验。

（一）百度智能云

官方网站： https://console.bce.baidu.com/qianfan/overview

API KEY与常用模型的ID：

API KEY:  bce-v3/ALTAK-Zqc4DPImZxWj36xtXUNqE/4c8100c76a3864196c246ebd729775a1d816454d
endpoint: https://qianfan.baidubce.com/v2/
model ID:
	deepseek-r1,
	deepseek-v3,
	ernie-4.0-turbo-8k-latest,
	ernie-speed-128k,
	ernie-x1-turbo-32k,
	gpt-oss-120b,
	gpt-oss-20b

百度是国内比较早做AI的公司，他们的智能云API非常丰富，除了他们自己开发的文心一言系列模型（ernie系列）、文心推理模型（ernie-x1系列）以外，还接入了deepseek的模型（其中推理模型是deepseek-r1，非推理模型是deepseek-v3），以及openAI前段时间刚刚开源的gpt-oss系列（包括gpt-oss-120b和gpt-oss-20b）。

我比较推荐的是deepseek-r1和gpt-oss-120b这两个模型；百度自己的文心一言，说实话比较一般。不过百度文心系列有一个可以免费无限次调用的模型 ernie-speed-128k ，对于一些批量任务（网页翻译、文献总结等）还是很有性价比的。

（二）阿里云

官方网站： https://bailian.console.aliyun.com/#/model-market

API KEY与常用模型的ID：

API KEY:  sk-82b3bfa35dce4e93877d7a54841d157d
endpoint: https://dashscope.aliyuncs.com/compatible-mode/v1/
model ID:
	deepseek-r1,
	deepseek-v3,
	qwen-max,
	qwen-plus,
	qwen-turbo,
	qwen-vl-plus,
	qvq-max

阿里巴巴是国内另一家AI巨头。在他们的平台上，也接入了deepseek的相关模型。除此之外，阿里推出的通义千问系列模型（qwen）也很好用——推荐qwen-plus，如果需要更快的速度可以用turbo版本；需要多模态（例如图片识别）则可以使用qwen-vl系列和qvq系列（qvq系列还带思考功能）。

（三）Gemini（学生优惠账号）

官方网站： https://gemini.google.com/

API KEY与常用模型的ID：

API KEY:  AIzaSyDpMIeQWHSfSAlz0QfqDGXN9C0VkQdIPm0
endpoint: https://generativelanguage.googleapis.com
model ID:
	gemini-2.5-pro
	gemini-2.5-flash

不必多介绍。Gemini的实力有目共睹。

（四）AiHubMix

官方网站： https://aihubmix.com/

1 2	API KEY: 保密。鉴于这个平台价格太贵，建议读者朋友自己注册（doge） endpoint: https://aihubmix.com

这是一个第三方的模型转发平台，可以使用包括GPT、Claude、Gemini、grok等在内的许多模型，并且不需要翻墙。缺点是API价格比较贵（如下图，以美元结算）。如果需要旧版本GPT模型（GPT4o, GPT4.1等），或者Claude之类的模型，可以考虑使用这个平台。