Termark AI 助手设计:我为什么没有做一个"全自动运维 Agent"
在我另一款产品 NextTerminal 里,我很早就做过一个 AI 助手。
那时候做得很简单:用户在后台配置 API、模型和提示词,打开终端后可以在旁边问一句"这个命令怎么写"。AI 给出命令,用户看一眼再决定要不要执行。

功能不复杂,但当时反馈还不错。它解决的问题很具体:人在终端里工作,往往不是完全不会,而是需要一个能快速给出方向的助手,比如查日志、看进程、写一条 grep、解释一段报错、补一个一时想不起来的参数。
但我一直没把它再往前推、做成更激进的"自动运维 Agent"。原因很直白,服务器和代码仓库不是一回事。
代码仓库里 AI 删错文件,多数时候还能从 git 里找回来;Linux 机器上跑错一条命令,掉的可能是日志、配置、数据库文件,甚至直接把一台正在跑业务的机器搞坏。
后来做 Termark,AI 这块本来可以从头选型,上下文怎么给、Agent 形态怎么做、要不要支持外部 Agent,全都可以重来一遍。但 NextTerminal 上那个判断我没改。服务器场景的 AI,目标不是让它做得更多,而是让它在能控制的范围里把效率提上去。
从一问一答,到真正站在终端旁边
我现在已经离不开 Claude Code、Codex 这类编程 Agent。一个账号额度不够用,也会在不同渠道之间切。
用久了之后再回头看"终端旁边放一个聊天框"的形态,会觉得不太够。真实的排查过程并不是用户问一句、AI 答一句,而是看最近终端输出,判断下一步该查什么,执行一条只读命令,根据结果继续推,必要时再给出修改建议。
所以 Termark 的 AI 助手也得是 Agent 形态。
不过我没让它一上来就拥有一堆复杂能力。Termark 的核心现场是用户当前可见的 SSH 终端,工具边界也就收敛在这个会话里:查看终端环境、执行命令、读取文件、搜索内容,必要时再加目录浏览和文件写入。这些工具最后全部落到当前 SSH 会话上,AI 不能绕过 Termark 自己去连服务器。

和很多 Agent 不太一样的是,Termark 的 AI 直接在用户当前看到的那个终端里执行命令,不会在后台另开一个 shell。
举两个例子。
刚 su - postgres 完,问 AI:"看一下当前连接数。" 它执行的 psql 就跑在 postgres 用户的上下文里,不会莫名其妙跑到 root,也不会因为环境变量不对而报一堆错。
切到了 /var/log/nginx,问 AI:"最近这几个 access log 里 5xx 多吗?" 它的 grep 直接在这个目录下跑,不需要再传绝对路径,也不会跑去别的机器上找。
更实际的好处是,命令如果要求输入数据库密码、二次确认、vim 编辑、sudo 鉴权,用户可以直接在终端里继续输入。它更像是身边的人把命令敲进当前终端,而不是后台跑的一个自动化脚本。

代价是少了一点"纯自动化"的爽感,换来的是现场一致:在哪台机器、哪个用户、哪个目录下做事,用户随时都看得到。
为什么我没有默认放开所有命令
用 AI Agent 最让人烦的,往往是每一步都要确认。
写代码时反复确认 ls、cat、rg,确实很打断思路。但服务器场景没法照搬这套体验。
Termark 面对的是 SSH 资产,可能是个人 VPS,也可能是生产环境。AI 说"我清理一下临时文件",背后可能就是一条 rm -rf;AI 说"我重启服务看看",背后可能影响线上流量。差一个字,结果差很远。
我的策略是:明确只读、可观察的命令默认放行;会改变远端状态、无法判断是否安全、或者解析不清楚的命令,都走确认流程。
代码里有一套命令风险判断逻辑,会拆 shell token、识别管道、重定向、子命令、反引号、命令替换。命令里只要出现写入、删除、移动、安装、重启、权限变更、输出重定向这类可能改状态的动作,就要确认。设置里也保留了更保守的一档:所有工具调用都确认。

我没有做"开发者模式:永不确认"那种开关。
不是不信 AI。问题是 Termark 支持 OpenAI 兼容接口,每个人接的模型都不一样,能力和工具调用质量参差不齐。一旦给了"永不确认"的开关,出问题时损失发生在用户的服务器上,不在我这。
内置 Agent
Termark 内置了一条 OpenAI 兼容的 Agent 路径,给"我想用自己挑的模型,但又不想自己搭一套工具链"的人用。
可以配置不同的 API Profile,OpenAI、DeepSeek、OpenRouter、Qwen、Kimi、Ollama 或自定义接口都行。每个 Profile 单独配置 API 地址、Key、模型列表、当前模型、reasoning 参数、最大重试次数和自定义 User-Agent。


我自己测试时偏向用响应快、成本可控的模型做高频终端辅助。能这样选,是因为 Termark 给模型的上下文比较克制:最近若干行终端输出、当前会话范围、必要的系统提示词,加上用户这次的问题,差不多就这些。它不会把整个服务器状态都塞过去,也不会把所有历史一股脑堆进去。上下文越大成本越高,噪音也越多。
这里面比较关键的一块是最近终端输出。我不希望用户每次都手动复制一段输出再粘给 AI,所以 Termark 会从当前终端抓最近 N 行,自动作为上下文带过去。N 可以在设置里调。
这样刚执行完:
systemctl status nginx然后问:
帮我看一下为什么没启动AI 就能直接结合刚才的输出来分析,不会反问一句"请提供错误日志"。

日常解释日志、生成排查命令、看配置片段、搜索文件,这点上下文基本够用。
轻量模型当然有它的能力上限。所以内置 Agent 我没把定位拔得太高,它的角色是终端旁边一个能看现场、能有限执行命令的助手,不负责替你跑完整套运维流程。查磁盘、看端口、分析报错都合适;不经确认改生产配置,我并不鼓励。
外部 CLI:给你本地已有的 Agent 用
还有一类场景反过来。
有些人已经在本地终端里重度用 Codex、Claude Code 或 OpenCode,不愿意切到 Termark 的 AI 面板。问题是这些本地 Agent 默认拿不到用户的 SSH 资产,它不知道密码、私钥、跳板机配置,从安全角度看也不该知道。
Termark 在这里的处理是给一条外部 CLI。
设置页里点几下就能把 termark 命令装到 PATH,并且把 Termark skill 装到 Codex、Claude、OpenCode 的 skills 目录里。之后在本地 Agent 里就可以让它去用 termark:
termark assets list -q <keyword> --json
termark exec <asset-id> -- <command>
termark upload <asset-id> <local-path> <remote-path>
termark download <asset-id> <remote-path> <local-path>


外部 CLI 不直接持有凭证。它通过正在跑的 Termark 桌面端访问受控能力,凭证、跳板、连接细节这些都还留在 Termark 里。Agent 拿到的只是一个"对指定资产做点事"的入口。
能做的事比较有限:搜索资产、查看资产基础信息、对指定资产跑一次性命令、上传或下载文件。长任务别让外部 CLI 一直挂着,应该在远端用 tmux、nohup 或 systemd 接住。
它不是要做一个万能 remote agent,只是给已有的 Agent 加一个能安全访问服务器的入口。
两条路解决两类人
到这里,Termark 在 AI 这块其实给了两个入口。
一个是内置的 OpenAI 兼容 Agent。用户挑自己想用的模型,让 AI 在 SSH 终端旁边看现场、分析问题、执行受控命令,安全靠 Termark 的确认策略兜着。
另一个是外部 CLI。本地 Agent 工作流不变,只是多了一个能安全访问 Termark 资产的命令;凭证不交给 Agent,留在 Termark 这边就行。
我没想强迫用户只用其中一种。有人在乎接入门槛和模型选择,有人在乎已有工作流。两个入口共享同一套资产、凭证、会话和安全策略,差别只是从哪边进来。