Claude 和 Codex 简单测评

从实际使用感受出发,简单比较一下 Claude 和 Codex

Posted by My on April 13, 2026

我好想用 Claude 🙉

「我对外界信息的提取能力好差,2025 一整年都在用 ChatGPT,都在浏览 YouTubeX,但是对 ClaudeCodex 的发展却一无所知……」

我是 2026 年过年的时候,才开始认真关注 ClaudeCodex

最开始,我先试了 VS Code 里的 Codex 插件,直观感受是:

  • 「很慢」
  • 经常卡住
  • 用了几次之后就放弃了

Claude 则是从「中转」开始接触的。

当时买的中转刚开始还没有降智,也是通过 VS Code 插件来用,给我的感觉就是「打开了新世界的大门」,非常爽。

Claude

一般使用下来,再加上「先入为主」的影响,我会更青睐 Claude。结合 SKILL,它可以处理一些预设任务,确实很方便。

刚开始中转价格还比较便宜,一次简单会话也就几分钱。那段时间里,我主要结合 SKILL 做了下面几类任务:

1. 项目启动

h5 项目是多页面应用,每一个目录都是一个独立页面。启动时,需要在配置文件里指定启动目录,比如 entryWork: home

所以我用 SKILL 配合脚本,把「项目启动」这件事做成了一个预设任务:

  • 先配置目录映射关系
  • 再通过自然语言触发脚本
  • 最终达到快速启动目标页面的效果

比如我只要说一句「启动首页」,Claude 就会读取对应的 SKILL,找到首页相关目录,然后执行对应脚本。

2. 项目打包部署

打包部署也是类似的场景。

因为只有在指定的 entryWork 下执行打包命令,才能正确打包对应目录。以前我的流程是:

  • 手动执行打包
  • cssjs 等静态资源扔到一个 SVN 目录
  • 再把 html 文件扔到另一个 SVN 目录
  • 最后再手动更新、提交

后来我也把这套流程交给了 SKILL 处理,和项目启动一样,先做好目录映射关系,再通过自然语言执行打包部署任务。

比如输入 打包部署 首页,它就会:

  • 执行对应脚本
  • 复制构建产物到指定的 SVN 目录
  • 继续执行 SVN 更新、提交等操作

3. 单位格式化

这个场景我感受最明显。

在小程序里,元素标签是 viewtext 这些;但我习惯用 VS Code 开发,而输入 view 并没有自动补全,所以写代码时还是更习惯先写 divspan

另外,Figma 设计稿通常是以 375 为基准,单位是 px;而小程序里实际使用的是 rpx。所以每次开发完之后,往往还要再做一轮替换:

  • div 改成 view
  • span 改成 text
  • px 改成 rpx

以前在其他 AI 工具里,我通常要单独开一个窗口,一次次地下达指令:

  • 把这个页面的 div 替换为 view
  • 1px 替换成 2rpx
  • 再指定下一个文件,说一句「同理,处理这个文件」

但在 Claude 里,只要把相关 skill 定义好,开发完成后直接说一句「单位格式化」,它就会读取对应 skill,把相关文件一起处理掉。

Codex

用了 Claude 一段时间之后,中转涨价了,实在顶不住,我就转向了 Codex

Codex 也有 skill,但更多是官方预设的技巧,而不是我这种「自定义规范」式的能力,所以这一点在我看来没有那么方便。

现在我用了一个多月 Codex,最直观的感受是「人机交互更自由」。

它可以读取项目里的 .md 文件,然后根据要求执行命令。至于上面那些规范类任务,为了不污染上下文,我还是会像以前一样,单独开一个窗口,通过自然语言让 Codex 去处理。

所以整体给我的感觉是:

  • 交互方式很随意
  • 更像直接和工具对话
  • 但少了一点「人设感」

另外还有几个我不太满意的点:

  • 在任意项目里打开 Codex 的历史,都能看到所有沟通记录,并不是只显示当前项目的记录
  • 终端里的文本格式处理不如 Claude 清晰,表格渲染不出来,文本容易挤在一起,代码也没有高亮
  • 不知道是不是 Codex 对中文处理还有问题,编辑文件时偶尔会把中文弄成乱码

维度对比

如果不只是看个人使用感受,而是拆成几个具体维度来比较,我现在的看法大概是这样的:

1. 对话能力

单看「能不能回复」这件事,其实 ClaudeCodex 都没有太大问题,基本都能正常接住问题、继续追问,也都能围绕上下文展开。

但如果看最终呈现出来的回答体验,我会觉得 Claude 更好一点,主要体现在:

  • 结构通常更分明
  • 分点更自然
  • 文本排版更清楚
  • 读起来更像一份整理过的结果

Codex 的回答风格,在我这里更多是一种「直接干活」的感觉,信息有时候是够的,但展示层面没那么舒服。

2. 代码能力

如果只说我自己的使用感受,我会觉得这两者各有偏向。

  • Codex 在「逻辑处理」上更强一点
  • ClaudeUI 相关任务上更讨喜一点

Codex 给我的感觉是更像一个直接进项目、读文件、执行命令、落实修改的工具,尤其在处理偏工程化、偏逻辑链路的问题时,表现会更稳一些。

Claude 在处理页面文案、布局描述、UI 细节这类内容时,往往会显得更顺手,输出也更容易让我觉得「像那么回事」。

但这里还有一个很现实的问题,就是「能力是否稳定」。

Claude 来说,如果想把 skill 这套能力真正用起来,最好还是使用它自己的模型;如果换成第三方模型,很多时候并不会稳定地读取 skill,那它这部分优势就会明显打折。

Codex 的问题则是另外一面:它能做,但规则必须限制得更死一点。不然一旦约束不够明确,它就很容易开始「自由发挥」。

3. 准确性

准确性这一项,我目前的感受是两边「差距没有特别大」。

它们都不是那种可以让我完全不复查的工具,也都可能:

  • 理解偏一点
  • 在局部细节上出错
  • 按照自己的理解补一些其实并不需要的内容

如果一定要细分的话,我会觉得:

  • Codex 在贴着项目上下文做事时,准确性会更稳定一点
  • Claude 在表达和整理上更强,但有时候也会因为太会组织语言,看起来很对,实际上还是需要再核对一下

所以这一项,我更倾向于认为两边都「能用,但都不能盲信」。

4. 效率

如果看「形成工作流之后的效率」,我会更偏向 Claude

原因也比较直接:

  • 它有很多 slash 命令
  • 可以定义 skill
  • 比较适合把重复任务沉淀成固定动作

一旦这些东西配好了,很多事就不是临时一句一句地下指令,而是直接调用一套现成流程,所以整体效率会更高。

相比之下,Codex 当然也能做很多事,而且上手很直接,但它更像是「边聊边做」。这种方式很灵活,不过在面对高频、重复、可模板化的任务时,我还是会觉得 Claude 那一套更省力。

5. 易用性

易用性这一项,我反而会把票投给 Codex

Codex 的优势是:

  • 直接打开就能用
  • 直接对话就能处理
  • 不需要先搭很多前置配置

它的门槛更低,比较适合马上进入问题本身。

Claude 虽然在工作流成型之后效率更高,但前提是你得先去折腾 skill、命令、规则这些东西。也就是说,它更像是「前期多投入,后期提效率」的路线。

所以如果只是从「拿来就用」的角度看,Codex 会更容易上手;如果是从「深度定制后长期使用」的角度看,Claude 会更有想象空间。

Demo

为了不只是停留在主观感受,我又补了一个简单 demo 来做横向对比。

正好翻到几年前的一个面试题,要求做一个「转盘抽奖」功能。

lottery_img.jpeg

我就顺手拿它来看看 ClaudeCodex 在处理这个任务时的表现。

这次测试环境大致是这样的:

  • Claude 用的是中转的 Sonnet 4.6
  • Codex 用的是 OpenAIGPT-5.4
  • 两边都是新建目录
  • 目录里只有一张参考图
  • 另外补了一个简单的 prd.md,说明页面内容和交互要求

也就是说,这次并不是拿现成项目做增量修改,而是看它们在「从零起一个小页面」时,分别会怎么完成这个任务。

Codex 表现

先说结论,一个字:「快」。

大概 1 分钟左右就完成了。终端里的格式如下:

codex1.png

页面结果

仅生成一个 index.html 文件,内容如下:

codex2.png

倒计时结束后,在当前页面内通过条件渲染展示表单内容:

codex3.png

存在问题

主要有两个问题:

  • 表单页一开始无法滚动,是我提醒之后,Codex 才补处理的
  • 验证码的提示弹窗出现在页面下方,交互细节不太自然

不过从执行速度和逻辑连贯性来看,Codex 还是很利落,基本属于「先快速做出来,再按反馈修」的风格。

Claude 表现

Claude 总体上是比较慢的,大概 8 分钟左右才完成。终端里的格式如下:

claude1.png

页面结果

按照要求生成了两个页面,一个是 index.html,一个是 form.html

claude2.png

倒计时结束后,跳转到 form.html 页面。

claude3.png

存在问题

这次这个 demo 里,页面和逻辑上我没有发现明显缺陷,基本符合需求。

对比结论

在这个 demo 里,两个工具其实都把需求做出来了。

但也能看出明显差异:

  • 两边都没有真的去解析图片,并没有完全做成参考图里的样子
  • 都是在自己的理解基础上重新设计了一版 UI
  • Codex 更快,偏向先把逻辑和页面直接落下来
  • Claude 更慢,但 UI 表现更好,文件结构也更符合我的预期

如果只看这次结果,我会觉得:

  • Codex 更像「执行型选手」
  • Claude 更像「审美和整理能力更强的选手」

虽然 Claude 花的时间更长,但最终效果确实更完整一点,某种程度上也可以理解为它在这类任务里更愿意多花时间组织结果。

当然,这里用的还是中转版 Sonnet 4.6,不排除存在降智的可能。所以如果换成正版的 Sonnet 4.6,理论上效果可能还会更好一些。

挣扎

上面说到底,我放弃 Claude 的核心原因还是「中转太贵」。

现在我在 OpenRouter 里还有一点余额,平常如果只是解释某些方法,偶尔还是会用一下 Claude,但模型就不用 Sonnet 了,真的太贵。

下面这个例子,其实只是一个很简单的需求:

「创建加入我们页面,暂时添加一些示例内容」

然后读取 skill,再执行对应命令。

post_claude_vscode.png

结果就是,几个文件、每个文件百行左右,就消耗了七块钱左右,实在用不起。

post_openrouter_cost.png

所以,我现在还是老老实实用 Codex

但我心里还是一直很向往 Claude

我好想用 Claude 🙉

之前就因为支付方式、网络等一大堆问题,还担心封号,所以迟迟没有开通订阅。本来是打算这个月用完 Codex 之后就订阅的,但又来了 KYC 这一出,真的是麻了……

我还想心存一下侥幸心理,开个 Pro 看看会不会被封……