Powerpei | OKX Orbit | OKX United States

Post

最近群里聊AI的，一个比一个上头好几个平时碰都不碰代码的群友，现在张口就是「我让 AI 写了个脚本」「我搓了个小工具」俨然半个工程师了我看着这些消息，忽然冒出个问题：那些真靠写代码吃饭的兄弟呢？干了十年八年的，现在都在做什么？连外行都能差遣AI敲两行了，专业的人，到底是更金贵了，还是反过来——先被顶下去了？这种问题，光在脑子里打转没用，得看个活的。 @CreaoAI 这家公司，活得够极端 25个人，10个工程师，99%的生产代码全是AI写的到什么程度？上午上线一个新功能中午 A/B 测发现数据不行下午直接砍掉傍晚换个更好的版本重新上同样一件事，三个月前他们要跑六周看到这儿我就想：坏了，以前敲代码那帮兄弟怕是真要被顶下去了。可越往下扒，我越觉得不对劲该慌是该慌，但慌错了方向。 → → → 他们到底做对了什么？先分清两个词，这是一切的分水岭大多数公司用 AI，是这么个用法 ■ 工程师开 Cursor 敲代码 ■ 产品经理拿 ChatGPT 写文档 ■ 测试拿 AI 凑用例流程一点没动，效率涨个10%、20%，就到顶了这叫 AI-assisted 在旧流程上，挂一个AI CREAO干的是另一件事他们把整条流程拆了，重新假设一遍：AI 是主要的建造者，人只负责给方向、做判断。不是问「AI 怎么帮工程师」是问「怎么把所有环节重排，让 AI来造，人来把关」 ➤ 举个最狠的：AI 两小时就能造完一个功能，可产品经理写需求还得磨好几周那一刻，瓶颈不是开发，是产品经理于是他们把这个岗位，直接拿掉了。重构流程，狠起来是会动组织的。这跟给工程师发个 AI 工具，根本是两码事。一个是加法，一个是乘法。这俩，不是一回事。 → → → 那他们做的产品，到底是什么？这儿有个特别反直觉的点真正值钱的东西，从来不是那个Agent本身。 Agent会犯错，会幻觉，会走一条你看不懂的歪路你越想把它调得更聪明，它越不可控。真正的产品，是Agent外面那套挽具 OpenAI 给它起了个名字，叫 harness engineering >>意思是：一个工程团队的核心活儿，不再是写代码，是给 AI 搭一套「能看懂、能验证、能约束」的骨架让它在里面干活。出了问题，解法从来不是让 AI 再努力点 >>是问：缺了哪块能力？怎么把它补成一条AI 能读、能照做的规则。这套思路听着抽象落到地上，是下面这件让我服气的事。 --- 谁来给AI兜底？这是所有人问CREAO最多的一句答案不是「多招点 QA」他们压根没有QA团队。每天早上9点，一个AI自动去翻所有服务的日志，生成一份健康报告没人需要开口要一小时后，另一个AI把线上报错聚类、按九个维度打分、自动开工单，甚至直接提一个修复的PR上去。 50%以上的bug，AI自己就修完了。没有QA，没有那种上线前一堆人手点一遍的测试环境取而代之的，是一个「AI 陪审团」三个不同厂家的大模型，给每一条线上回答打分分数掉了，新代码就别想上线。测它的是AI，放行它的是 AI，出岔子把它召回的，还是 AI 这套东西能自己修自己。 —— ➤ 讲到这儿，CREAO这家公司最有意思的地方才露出来它本身，就是个做Agent 的平台也就是说：他们是用Agent，造了一个造Agent的平台这句话听着像绕口令，却是整套方法论最硬的一次自证如果这套挽具真能让 AI 独立把活干好，那它该交出的第一份作品，恰恰就是这家公司自己。能自己造自己，这事才算成立这些效率数字，全是他们自己披露的能不能复制、有多少水分，你自己掂量。但有句话，我反复想他们的CTO，一个物理博士、前Meta LLaMA团队的人，说他 2026年没写过一行代码。他说工程师往后最值钱的，不是写代码的手速是找出 AI 计划里的漏洞和判断什么东西真正有价值这话，值得每个还在熬夜啃新框架的人，停下来想三秒。注：以上内容纯项目分析，不作任何投资建议哈，DORY