
Post
最近群里聊AI的,一个比一个上头
好几个平时碰都不碰代码的群友,现在张口就是「我让 AI 写了个脚本」「我搓了个小工具」
俨然半个工程师了
我看着这些消息,忽然冒出个问题:
那些真靠写代码吃饭的兄弟呢?干了十年八年的,现在都在做什么?
连外行都能差遣AI敲两行了,专业的人,到底是更金贵了,还是反过来——先被顶下去了?
这种问题,光在脑子里打转没用,得看个活的。
@CreaoAI 这家公司,活得够极端
25个人,10个工程师,99%的生产代码全是AI写的
到什么程度?
上午上线一个新功能
中午 A/B 测发现数据不行
下午直接砍掉
傍晚换个更好的版本重新上
同样一件事,三个月前他们要跑六周
看到这儿我就想:坏了,以前敲代码那帮兄弟怕是真要被顶下去了。
可越往下扒,我越觉得不对劲
该慌是该慌,但慌错了方向。
→ → →
他们到底做对了什么?
先分清两个词,这是一切的分水岭
大多数公司用 AI,是这么个用法
■ 工程师开 Cursor 敲代码
■ 产品经理拿 ChatGPT 写文档
■ 测试拿 AI 凑用例
流程一点没动,效率涨个10%、20%,就到顶了
这叫 AI-assisted
在旧流程上,挂一个AI
CREAO干的是另一件事
他们把整条流程拆了,重新假设一遍:AI 是主要的建造者,人只负责给方向、做判断。
不是问「AI 怎么帮工程师」
是问「怎么把所有环节重排,让 AI来造,人来把关」
➤ 举个最狠的:AI 两小时就能造完一个功能,可产品经理写需求还得磨好几周
那一刻,瓶颈不是开发,是产品经理
于是他们把这个岗位,直接拿掉了。
重构流程,狠起来是会动组织的。这跟给工程师发个 AI 工具,根本是两码事。
一个是加法,一个是乘法。
这俩,不是一回事。
→ → →
那他们做的产品,到底是什么?
这儿有个特别反直觉的点
真正值钱的东西,从来不是那个Agent本身。
Agent会犯错,会幻觉,会走一条你看不懂的歪路
你越想把它调得更聪明,它越不可控。
真正的产品,是Agent外面那套挽具
OpenAI 给它起了个名字,叫 harness engineering
>>意思是:一个工程团队的核心活儿,不再是写代码,是给 AI 搭一套「能看懂、能验证、能约束」的骨架
让它在里面干活。
出了问题,解法从来不是让 AI 再努力点
>>是问:缺了哪块能力?怎么把它补成一条AI 能读、能照做的规则。
这套思路听着抽象
落到地上,是下面这件让我服气的事。
---
谁来给AI兜底?
这是所有人问CREAO最多的一句
答案不是「多招点 QA」
他们压根没有QA团队。
每天早上9点,一个AI自动去翻所有服务的日志,生成一份健康报告
没人需要开口要
一小时后,另一个AI把线上报错聚类、按九个维度打分、自动开工单,甚至直接提一个修复的PR上去。
50%以上的bug,AI自己就修完了。
没有QA,没有那种上线前一堆人手点一遍的测试环境
取而代之的,是一个「AI 陪审团」
三个不同厂家的大模型,给每一条线上回答打分
分数掉了,新代码就别想上线。
测它的是AI,放行它的是 AI,出岔子把它召回的,还是 AI
这套东西能自己修自己。
——
➤ 讲到这儿,CREAO这家公司最有意思的地方才露出来
它本身,就是个做Agent 的平台
也就是说:他们是用Agent,造了一个造Agent的平台
这句话听着像绕口令,却是整套方法论最硬的一次自证
如果这套挽具真能让 AI 独立把活干好,那它该交出的第一份作品,恰恰就是这家公司自己。
能自己造自己,这事才算成立
这些效率数字,全是他们自己披露的
能不能复制、有多少水分,你自己掂量。
但有句话,我反复想
他们的CTO,一个物理博士、前Meta LLaMA团队的人,说他 2026年没写过一行代码。
他说工程师往后最值钱的,不是写代码的手速
是找出 AI 计划里的漏洞
和判断什么东西真正有价值
这话,值得每个还在熬夜啃新框架的人,停下来想三秒。
注:以上内容纯项目分析,不作任何投资建议哈,DORY

CREAO试用地址:
Disclaimer: OKX Orbit content is provided for informational purposes only. Learn more
Replies
No comments yet. Be the first to reply!
