Claude 和 Codex 简单测评

我好想用 Claude 🙉

「我对外界信息的提取能力好差，2025 一整年都在用 ChatGPT，都在浏览 YouTube、X，但是对 Claude 和 Codex 的发展却一无所知……」

我是 2026 年过年的时候，才开始认真关注 Claude 和 Codex。

最开始，我先试了 VS Code 里的 Codex 插件，直观感受是：

「很慢」
经常卡住
用了几次之后就放弃了

而 Claude 则是从「中转」开始接触的。

当时买的中转刚开始还没有降智，也是通过 VS Code 插件来用，给我的感觉就是「打开了新世界的大门」，非常爽。

`Claude`

一般使用下来，再加上「先入为主」的影响，我会更青睐 Claude。结合 SKILL，它可以处理一些预设任务，确实很方便。

刚开始中转价格还比较便宜，一次简单会话也就几分钱。那段时间里，我主要结合 SKILL 做了下面几类任务：

1. 项目启动

h5 项目是多页面应用，每一个目录都是一个独立页面。启动时，需要在配置文件里指定启动目录，比如 entryWork: home。

所以我用 SKILL 配合脚本，把「项目启动」这件事做成了一个预设任务：

先配置目录映射关系
再通过自然语言触发脚本
最终达到快速启动目标页面的效果

比如我只要说一句「启动首页」，Claude 就会读取对应的 SKILL，找到首页相关目录，然后执行对应脚本。

2. 项目打包部署

打包部署也是类似的场景。

因为只有在指定的 entryWork 下执行打包命令，才能正确打包对应目录。以前我的流程是：

手动执行打包
把 css、js 等静态资源扔到一个 SVN 目录
再把 html 文件扔到另一个 SVN 目录
最后再手动更新、提交

后来我也把这套流程交给了 SKILL 处理，和项目启动一样，先做好目录映射关系，再通过自然语言执行打包部署任务。

比如输入 打包部署首页，它就会：

执行对应脚本
复制构建产物到指定的 SVN 目录
继续执行 SVN 更新、提交等操作

3. 单位格式化

这个场景我感受最明显。

在小程序里，元素标签是 view、text 这些；但我习惯用 VS Code 开发，而输入 view 并没有自动补全，所以写代码时还是更习惯先写 div、span。

另外，Figma 设计稿通常是以 375 为基准，单位是 px；而小程序里实际使用的是 rpx。所以每次开发完之后，往往还要再做一轮替换：

把 div 改成 view
把 span 改成 text
把 px 改成 rpx

以前在其他 AI 工具里，我通常要单独开一个窗口，一次次地下达指令：

把这个页面的 div 替换为 view
把 1px 替换成 2rpx
再指定下一个文件，说一句「同理，处理这个文件」

但在 Claude 里，只要把相关 skill 定义好，开发完成后直接说一句「单位格式化」，它就会读取对应 skill，把相关文件一起处理掉。

`Codex`

用了 Claude 一段时间之后，中转涨价了，实在顶不住，我就转向了 Codex。

Codex 也有 skill，但更多是官方预设的技巧，而不是我这种「自定义规范」式的能力，所以这一点在我看来没有那么方便。

现在我用了一个多月 Codex，最直观的感受是「人机交互更自由」。

它可以读取项目里的 .md 文件，然后根据要求执行命令。至于上面那些规范类任务，为了不污染上下文，我还是会像以前一样，单独开一个窗口，通过自然语言让 Codex 去处理。

所以整体给我的感觉是：

交互方式很随意
更像直接和工具对话
但少了一点「人设感」

另外还有几个我不太满意的点：

在任意项目里打开 Codex 的历史，都能看到所有沟通记录，并不是只显示当前项目的记录
终端里的文本格式处理不如 Claude 清晰，表格渲染不出来，文本容易挤在一起，代码也没有高亮
不知道是不是 Codex 对中文处理还有问题，编辑文件时偶尔会把中文弄成乱码

维度对比

如果不只是看个人使用感受，而是拆成几个具体维度来比较，我现在的看法大概是这样的：

1. 对话能力

单看「能不能回复」这件事，其实 Claude 和 Codex 都没有太大问题，基本都能正常接住问题、继续追问，也都能围绕上下文展开。

但如果看最终呈现出来的回答体验，我会觉得 Claude 更好一点，主要体现在：

结构通常更分明
分点更自然
文本排版更清楚
读起来更像一份整理过的结果

而 Codex 的回答风格，在我这里更多是一种「直接干活」的感觉，信息有时候是够的，但展示层面没那么舒服。

2. 代码能力

如果只说我自己的使用感受，我会觉得这两者各有偏向。

Codex 在「逻辑处理」上更强一点
Claude 在 UI 相关任务上更讨喜一点

Codex 给我的感觉是更像一个直接进项目、读文件、执行命令、落实修改的工具，尤其在处理偏工程化、偏逻辑链路的问题时，表现会更稳一些。

而 Claude 在处理页面文案、布局描述、UI 细节这类内容时，往往会显得更顺手，输出也更容易让我觉得「像那么回事」。

但这里还有一个很现实的问题，就是「能力是否稳定」。

对 Claude 来说，如果想把 skill 这套能力真正用起来，最好还是使用它自己的模型；如果换成第三方模型，很多时候并不会稳定地读取 skill，那它这部分优势就会明显打折。

而 Codex 的问题则是另外一面：它能做，但规则必须限制得更死一点。不然一旦约束不够明确，它就很容易开始「自由发挥」。

3. 准确性

准确性这一项，我目前的感受是两边「差距没有特别大」。

它们都不是那种可以让我完全不复查的工具，也都可能：

理解偏一点
在局部细节上出错
按照自己的理解补一些其实并不需要的内容

如果一定要细分的话，我会觉得：

Codex 在贴着项目上下文做事时，准确性会更稳定一点
Claude 在表达和整理上更强，但有时候也会因为太会组织语言，看起来很对，实际上还是需要再核对一下

所以这一项，我更倾向于认为两边都「能用，但都不能盲信」。

4. 效率

如果看「形成工作流之后的效率」，我会更偏向 Claude。

原因也比较直接：

它有很多 slash 命令
可以定义 skill
比较适合把重复任务沉淀成固定动作

一旦这些东西配好了，很多事就不是临时一句一句地下指令，而是直接调用一套现成流程，所以整体效率会更高。

相比之下，Codex 当然也能做很多事，而且上手很直接，但它更像是「边聊边做」。这种方式很灵活，不过在面对高频、重复、可模板化的任务时，我还是会觉得 Claude 那一套更省力。

5. 易用性

易用性这一项，我反而会把票投给 Codex。

Codex 的优势是：

直接打开就能用
直接对话就能处理
不需要先搭很多前置配置

它的门槛更低，比较适合马上进入问题本身。

而 Claude 虽然在工作流成型之后效率更高，但前提是你得先去折腾 skill、命令、规则这些东西。也就是说，它更像是「前期多投入，后期提效率」的路线。

所以如果只是从「拿来就用」的角度看，Codex 会更容易上手；如果是从「深度定制后长期使用」的角度看，Claude 会更有想象空间。

Demo

为了不只是停留在主观感受，我又补了一个简单 demo 来做横向对比。

正好翻到几年前的一个面试题，要求做一个「转盘抽奖」功能。

我就顺手拿它来看看 Claude 和 Codex 在处理这个任务时的表现。

这次测试环境大致是这样的：

Claude 用的是中转的 Sonnet 4.6
Codex 用的是 OpenAI 的 GPT-5.4
两边都是新建目录
目录里只有一张参考图
另外补了一个简单的 prd.md，说明页面内容和交互要求

也就是说，这次并不是拿现成项目做增量修改，而是看它们在「从零起一个小页面」时，分别会怎么完成这个任务。

`Codex` 表现

先说结论，一个字：「快」。

大概 1 分钟左右就完成了。终端里的格式如下：

页面结果

仅生成一个 index.html 文件，内容如下：

倒计时结束后，在当前页面内通过条件渲染展示表单内容：

存在问题

主要有两个问题：

表单页一开始无法滚动，是我提醒之后，Codex 才补处理的
验证码的提示弹窗出现在页面下方，交互细节不太自然

不过从执行速度和逻辑连贯性来看，Codex 还是很利落，基本属于「先快速做出来，再按反馈修」的风格。

`Claude` 表现

Claude 总体上是比较慢的，大概 8 分钟左右才完成。终端里的格式如下：

页面结果

按照要求生成了两个页面，一个是 index.html，一个是 form.html。

倒计时结束后，跳转到 form.html 页面。

存在问题

这次这个 demo 里，页面和逻辑上我没有发现明显缺陷，基本符合需求。

对比结论

在这个 demo 里，两个工具其实都把需求做出来了。

但也能看出明显差异：

两边都没有真的去解析图片，并没有完全做成参考图里的样子
都是在自己的理解基础上重新设计了一版 UI
Codex 更快，偏向先把逻辑和页面直接落下来
Claude 更慢，但 UI 表现更好，文件结构也更符合我的预期

如果只看这次结果，我会觉得：

Codex 更像「执行型选手」
Claude 更像「审美和整理能力更强的选手」

虽然 Claude 花的时间更长，但最终效果确实更完整一点，某种程度上也可以理解为它在这类任务里更愿意多花时间组织结果。

当然，这里用的还是中转版 Sonnet 4.6，不排除存在降智的可能。所以如果换成正版的 Sonnet 4.6，理论上效果可能还会更好一些。

挣扎

上面说到底，我放弃 Claude 的核心原因还是「中转太贵」。

现在我在 OpenRouter 里还有一点余额，平常如果只是解释某些方法，偶尔还是会用一下 Claude，但模型就不用 Sonnet 了，真的太贵。

下面这个例子，其实只是一个很简单的需求：

「创建加入我们页面，暂时添加一些示例内容」

然后读取 skill，再执行对应命令。

结果就是，几个文件、每个文件百行左右，就消耗了七块钱左右，实在用不起。

所以，我现在还是老老实实用 Codex。

但我心里还是一直很向往 Claude。

我好想用 Claude 🙉

之前就因为支付方式、网络等一大堆问题，还担心封号，所以迟迟没有开通订阅。本来是打算这个月用完 Codex 之后就订阅的，但又来了 KYC 这一出，真的是麻了……

我还想心存一下侥幸心理，开个 Pro 看看会不会被封……

从实际使用感受出发，简单比较一下 Claude 和 Codex