这是一位钉钉 PD 在 「钉钉 ONE」 这款 AI 工作产品 0 → 1 → 落幕的全程中写下的第一人称记录。我们带着一个问题来读它:它对今天在 Edge 移动端做 AI 的我们,意味着什么?
第一人称的实录:当时房间里哪些声音最大、为什么做了那些决定、又是事后才看见了什么。我们把它当作一份「结构性陷阱图」,对照今天 Edge 移动端正在踩的坑。
小店可以「老子就这么做」,平台不行,它得承载千千万万种用法。ONE 选择了激进的、创始人口味的默认值,把它叫做「设计判断力」。但对那 95% 从不动设置的用户来说,这些默认值就是产品。
小餐馆可以坚持「我就这样出品」,美团不行。美团要承载千千万万种吃法。《置身钉内》 · 设计篇
精品产品可以有强主张(「不爱我们这味儿就别来」);平台产品必须承载千差万别的工作流。ONE 选了一套激进、创始人口味浓厚的默认值(自动已读、系统决定排序、Discover 强制开启),还把它包装成「设计判断力」。
新标签页的默认布局、地址栏的行为、AI 功能的默认开关、通知策略,这些对那 95% 从不打开「设置」的用户来说,就是产品本身。
任何默认值上线前,先回答一个问题并存档:「如果一个用户永远只看到这个默认值、从不去自定义,他会感谢我们,还是骂我们?」团队答不齐 → 改成 opt-in 再发。
这个入口很容易误触,以往习惯点这里去消息 tab,被强行影响了使用习惯。《置身钉内》 · 用户篇
ONE 把一个大大的 AI 入口塞进了钉钉左下角。团队内部觉得自己选的是「比较温和」的那版方案。但从外面看,用户只有一种体感:那个每天都要去点的位置,不再是原来那个东西了。
任何 AI 表面替换或挪动了一个老熟悉的控件(地址栏的某个动作、底部 tab、新标签默认),用户第一周的主体感受就是 「丢了个旧习惯」,而不是 「获得了一个新功能」。
每一次入口变更,都先给出一份明确的 「习惯损失预算」:那个旧动作折算成多少 MAU 价值?如果新功能未达预期,回滚窗口有多长?
移动端把设计语言压缩到极致:卡片、手势、预览。ONE 最深的伤,是不断打补丁修症状,却始终不肯回到最初的判断。「卡片感」的审美遮住了一个事实:每多露出一张卡片,就多压上一份责任。
我们很敏捷地修补了很多地方,却始终没有敏捷地回到最初的判断。这就像房梁歪了,却每天换窗帘、擦地板、调灯光。《置身钉内》 · 敏捷篇
ONE 让消息在用户滑过卡片时自动标记已读。为了缓解恐惧,团队叠加了一堆补丁:横向「探头」预览下一张、Peekaboo 手势用来「预读」、摘要、撤销路径。没有人问真正的问题:系统到底该不该自动标已读?
当一个 AI 功能开始需要预览、撤销、确认、安抚,根设计大概率就是错的。补丁让批评变得无形,但不会让设计变对。
给每个功能跟踪一个 「补丁比」:发布后追加的缓解措施 ÷ 实际交付价值。一旦超过 3,触发一次根设计评审。别再开补丁冲刺。
工作产品里的「看见」从来不是中性的。看见一条消息,可能意味着已读;看见一个待办,可能意味着责任。《置身钉内》 · 设计篇·篇末
ONE 爱上了「卡片感」这种审美。但 每多露一张卡片,就多压一份责任。看见这个动作本身就改变了用户状态,无论用户是否想被改变。
AI 摘要、Tab 分组建议、推荐动作、Copilot 提示,每一个都在告诉用户 「你现在已经知道这件事了」。屏幕空间的成本是小事,真正烧掉信任的是认知负担和被默认转嫁的责任感。
给每一个新的移动表面加一道 「责任审计」:这个表面让用户多担了哪些他刚才并不需要的义务?如果答案是「没什么有用的」 → 这个表面砍掉。
有三个陷阱在吃掉你的用户研究:奖励礼貌的问卷、被信息预先「灌满」的内测群体、得到抽象回答的抽象问题。要为那个沉默的行为做产品,而不是为那个被说出来的回答做产品。
一个用户说「这个功能不错」,却不愿意多点一次,不愿意改变路径……那么这个「不错」就很轻。《置身钉内》 · 用户篇
「不错」「我会用」「方向挺好」,这些话翻译过来都是零。用户愿意付什么成本才是 真正的信号:多一次点击、改变习惯、迁移工作流、暴露隐私数据、推荐给同事。
Copilot 满意度的问卷分数都是「氛围感」。用户有没有在没被引导的情况下主动用?两周后还会不会回来?有没有去改默认搜索? 那才是数据。
把 陈述类 指标(问卷、NPS、自报)和 行为类 指标(W2 留存、未引导主动调用、撤销率、流失率)分开。不同时间、不同人、不同 deck 评审。
内测玩家会替产品补全意义,正式用户只验收眼前价值。前者体验的是产品加服务,后者体验的仅仅是产品本身。《置身钉内》 · 用户篇 · 网易《射雕》案例
作者举了网易《射雕》:6 年、600 人、内测分数飞起,公测后 18 个月就凉了。内测用户拿到的是产品 + 服务 + 解释 + 礼物;真用户拿到的就是产品本身,然后转身就走。
Insider、Dogfood、员工渠道的用户,身上已经被我们灌满了产品意图、文档和解释。他们的行为对 GA 几乎 没有预测力。当 方向 用,别当 量 用。
始终给内测数据打 tag。永远不把它当作 GA 准入的门槛。真正的 GA 信号是 第一批陌生人、没有 onboarding、第一会话的前 60 秒。
理论上,没有人会反对学习……可当用户正在处理消息时,系统突然把他带进一个学习流,实际感受可能就是「像广告」「占地方」。他并没有撒谎。《置身钉内》 · 用户篇 · The Mom Test
问「你想要学习内容吗?」 → 用户说想。把视频流塞进工作流 → 用户骂垃圾。两次回答都是诚实的。抽象的问题和具体的当下根本没有关系。
别再问「你想不想要 AI 摘要?」。该问的是: 「带我看一下你上一次在手机上读完一篇长文章。你做了什么?Copilot 当时参与了吗?为什么参与/没参与?你接下来做了什么?」
所有访谈脚本默认走 Mom Test 原则:过去的行为、具体的事件、付过的真实成本。禁用假设句。问题开头是「你会不会……」 → 重写。
敏捷是工具。当组织把「快」当成结果本身,迭代会变成噪音、信号会被忽略、人会沉默地离开。日落也是发布,得有纪律,别让一个功能体面地悄悄消失。
敏捷开发不是目的,它只是工具。它最大的副作用是 —— 让团队误以为「快」就是「对」,把高频迭代当成了战略本身。《置身钉内》 · 敏捷篇
ONE 在没把问题陈述弄清楚之前就开始发版。每个 sprint 都修一些症状,从不回到根因。速度让批评看起来不合时宜:「我们都已经发了!你怎么还在质疑前提?」
Edge Mobile 一年发 26 个版本。但每条 PR 背后真的有一个清晰的、可证伪的用户假设吗?还是我们只是 把代办事项搬上线了?
每个 sprint 开工前先回答三个问题:(1) 我们正在验证哪个用户假设? (2) 验证用什么指标? (3) 失败长什么样? 写不出来就别动手。不写,就不发。
当一线最在意产品的人,开始用「算了」来回应你的决定,那不是冷漠,那是某种最终的失望。《置身钉内》 · 组织篇
ONE 的设计、研究、运营提前几个月就提出了警告。被听见的次数太少了,以至于他们 不再提了。当最在意产品的人开始说「算了」,信誉之死就已经是既成事实,只是还没下葬。
Edge Mobile 团队的设计师、研究员、客户支持每天都在看你看不到的信号。如果他们最近不再 push pushback,那是他们已经在走的信号。
每月做一次「最近被否的反对意见」回顾。谁提的?为什么被否?半年后看,谁判得更准?把这个变成一个组织级别的指标,不只是会议纪要里的脚注。
「如果这个功能我们直接拿掉,会有人骂吗?」 —— 这个问题,有时候比所有的用研都管用。它能让你瞬间分辨出哪些是真的有人爱,哪些只是没人敢杀。《置身钉内》 · 终篇
没有团队愿意杀掉自己几年的辛苦。所以「下线」 → 「冻结」 → 「冬眠」 → 「迁移」 → 一个零关注、还在跑、还在烧成本的功能。体面的隐身,代价是真实的债。
Edge Mobile 里那一堆「我们当初构想很好但从来没有真正起来」的功能。把它们日落,和上线一样需要一份 PRD,要写清楚四件事:逻辑、用户沟通、数据复盘、团队叙事。
每季度都做一个 「拿掉测试」:列出底部 20% 的功能。每一个问:「如果我们彻底拿掉,有人会跑过来骂吗?」如果答案是 *No* → 准备一份 sunset spec,而不是再写一份重启 spec。
翻出我们当前 mobile spec 里的每个默认值,问:「这个默认,我们是用主张选的,还是用习惯选的?」把每个无主张的默认值,改成有主张的提议。
把「陈述指标」和「行为指标」物理隔离:不同章节、不同评审、不同 owner。让任何用 NPS 当 GA 门槛的人都做不到。
底部 20% 移动功能。每个回答:「如果今晚拿掉,会有人骂吗?」对每个 *No*,起草一份一页的 sunset spec。