目录(16 节)▾
- 引子
- 1. 为什么需要再造一个测试
- 2. 我们承袭了什么,扬弃了什么
- 3. 5 个维度的来源与定义
- 第 1 维:EI · 能量来源(外向 E ↔ 内向 I)
- 第 2 维:SN · 信息获取(实感 S ↔ 直觉 N)
- 第 3 维:TF · 决策方式(思考 T ↔ 情感 F)
- 第 4 维:JP · 生活方式(判断 J ↔ 知觉 P)
- 第 5 维:AT · 自我认同(自信 A ↔ 动荡 -T)
- 4. 「光谱化」的设计选择
- 5. 反向题与一致性检测
- 6. 中文母语化:不是翻译,是重写
- 7. AI 个性化解读的角色
- 8. 我们的非目标:为什么我们不是临床工具
- 9. 命名:棱格 / 棱镜战略家 / 16 个昵称的背后
- 10. 学术诚实声明
引子
读完前两篇,你大概理解了一个事情:当下的人格测试世界,被两股力量撕开了一个缝。
一边是 MBTI/16 型阵营。它有故事、有标签、有原型、有亚文化。它好传播、好沟通、好和朋友吐槽。但它在科学严谨度上挨了几十年的批评。
另一边是 Big Five 阵营。它在学术上几乎是事实标准,跨文化、跨年龄、跨性别都稳定。但它太冷,没有故事,没有原型,没有名人对照。它说不出"我是 INFJ"这种让人愿意发朋友圈的话。
棱格(Lengge)就是想在这条缝里,填一个新东西。这篇文章里,我想讲清楚:我们承袭了什么,扬弃了什么,我们在 5 维度上做了哪些具体的设计选择,以及为什么我们最在乎"中文母语化"这一件具体小事。
1. 为什么需要再造一个测试
中文用户做人格测试时面对的现状,大致是这样的:
- 16personalities 中文版是直译的英文测试,情境(感恩节、橄榄球、prom 舞会)对中文使用者陌生;描述里的"提倡者""指挥官""主人公"等命名属于其商标,文风偏拗口。
- 国内本土的 16 型测试质量参差,大多没有正式心理学背景,题目和解读相互抄袭,准确度难以保证。
- 真正基于 Big Five 的测试(中科院的 CBF-PI 等)虽然科学,但对普通用户体验不友好——做完得到 5 个百分比,没有解读、没有视觉、没有故事。
- 微信生态完全空白。世界上最大规模的中文社交场景里,几乎没有原生体验的人格测试产品——所有的分享都靠截图,所有的复测都靠重新搜索。
我们的判断是:中文用户值得一个"科学诚实 + 中文原生 + 微信原生 + 价格亲民"的人格测试产品。 这就是棱格诞生的起点。
2. 我们承袭了什么,扬弃了什么
棱格的设计是一个"取最长的两根棍"的工程:
承袭 MBTI / 16 型的:
- 4 个字母代号 + 16 种类型作为"对外语言"
- 4 维度划分:E/I × S/N × T/F × J/P
- 每型给一个故事化的描述(优势、盲点、代表人物)
- 自我探索的姿态——不是诊断,是镜子
扬弃 MBTI 的:
- 强制的二分类(我们改为连续百分比)
- 信度问题(我们设计反向题做一致性检测)
- 套用商标用语(我们用全新的中文昵称,如"棱镜战略家")
- 直译式生硬文案(我们用中文母语写每一个题、每一段描述)
承袭 Big Five 的:
- 连续百分比内核
- 第 5 个维度:情绪稳定性(我们叫 Identity:自信 / 动荡)
- 多个子维度可以延展(M2 之后会逐步释放更细的子分数)
- 跨文化、跨场景的中性命名
扬弃 Big Five 的:
- 完全没有故事的"冷数据"呈现
- "Neuroticism 神经质"这种容易被误解的命名(我们改名"动荡 -T")
- 缺乏视觉化(我们做了雷达图、卡通形象、分享卡)
- 学术圈付费墙(我们的核心测试永久免费)
最终的形态可以一句话概括:
棱格 = MBTI 的可传播壳 + Big Five 的科学心 + 中文母语的呼吸
3. 5 个维度的来源与定义
棱格的 5 个维度,精确名称与设计如下:
第 1 维:EI · 能量来源(外向 E ↔ 内向 I)
心理学溯源:荣格 1921 的"态度",Big Five 的 Extraversion。 棱格的处理:0-100 连续刻度,中间 45-55 标为"双倾向"。我们不让 51% E 的人和 49% E 的人拿完全相反的标签。 题目情境:聚会、独处、社交后的疲惫感、新朋友、视频会议、出差结伴。 核心问题:你的精力是从外界激发,还是从内心积累?
第 2 维:SN · 信息获取(实感 S ↔ 直觉 N)
心理学溯源:荣格 1921 的"知觉功能",Big Five 的 Openness 子维度(尤其是想象、思维、美学)。 棱格的处理:连续刻度。题目情境围绕"看到一件事时,你最先注意的是事实/细节,还是模式/可能"。 核心问题:你更被"实然"吸引,还是被"或然"吸引?
第 3 维:TF · 决策方式(思考 T ↔ 情感 F)
心理学溯源:荣格的"判断功能",Big Five 的 Agreeableness(部分)。 棱格的处理:连续刻度。我们刻意避免把"思考"和"冷漠"绑定、把"情感"和"软弱"绑定——这是 16 型测试经常踩的坑。 核心问题:在权衡时,你优先看逻辑公正,还是看相关人的感受与价值?
第 4 维:JP · 生活方式(判断 J ↔ 知觉 P)
心理学溯源:Briggs 母女在 1940s 添加的维度,Big Five 的 Conscientiousness。 棱格的处理:连续刻度。题目情境包括出行规划、工作清单、最后一刻完成、待办事项的踏实感。 核心问题:你更靠"提前敲定"获得安全感,还是更享受"路上调整"的弹性?
第 5 维:AT · 自我认同(自信 A ↔ 动荡 -T)
心理学溯源:NERIS 模型(16personalities)的 Identity 维度,本质对应 Big Five 的 Neuroticism。 棱格的处理:这是一条独立的维度,不参与 4 字母组合,而是作为"后缀"出现(INTJ-A vs INTJ-T)。它跟踪的是你面对压力时的内在张力——同样的外在类型,自信和动荡的体验差别很大。 为什么改名:Neuroticism 在中文里直译是"神经质",带强烈贬义。"动荡"是中性描述,捕捉的是同一种敏感度但不带审判。
4. 「光谱化」的设计选择
棱格最核心的产品理念是一句话:性格不是标签,是光谱。
这句话有具体的工程含义:
**(1)每个维度都是 0-100 连续刻度。**当你拿到自己的报告,看到的不是"E 还是 I",而是"E 38% / I 62%"——你能看到自己究竟有多偏。
**(2)边界提示。**confidence < 10%(也就是某维度上得分在 45-55 之间)时,系统会主动告诉你:"你在这一维度处于双倾向,可能因情境不同呈现两面"。我们不会强迫你把自己塞进一边。
**(3)雷达图可视化。**结果页用 5 维雷达,直观展示你在每个维度上的位置。圆心是平衡点,外缘是极端,你能一眼看到自己的"形状"。
**(4)16 字母代号是"叙事的壳",不是"决定的核"。**当我们说你是 INTJ-A,这只是一个方便聊天的简称。真正的"你",是雷达图里那个独特的多边形。
光谱化听起来很抽象,但它解决一个具体问题:**让人在自我认知上有合适的灰度。**16 型测试的常见副作用之一,就是用户开始把自己塞进固定的盒子——"我是 INTJ,所以我不善表达感情"。光谱化让用户看到:你在 T/F 维度上 51% 偏 T、49% 偏 F——这意味着你不是"不善表达感情",只是在某些情境下你倾向于先讲逻辑。这给自我成长留下了空间。
5. 反向题与一致性检测
MBTI 因为重测信度低被诟病了几十年。我们的应对手段,是在题库里人为植入约 33% 的反向题(reverse-coded items)。
举个例子:
- 正向 E 题:"在陌生场合,你能比较快地融入对话。"——同意 → 偏 E
- 反向 E 题:"你倾向于在大群人中保持安静,只在必要时发言。"——同意 → 偏 I
如果一个用户对这两道题都"强烈同意",说明他在快速答题、没认真读题,或者在前后矛盾——这是统计上典型的不一致信号。
棱格当前版本(M1)只用反向题做基本计分,但题库已经按 30%+ 的反向比例设计;M2.x 之后会基于这些反向题做"一致性指数",对一致性低的答卷给出更宽松的解读(例如"你的答题模式较快,建议有空时再细做一次")。
6. 中文母语化:不是翻译,是重写
很多人以为做中文版人格测试就是把英文翻译过来。这是棱格最坚定不做的事。 直译的代价远比"语义对得上"严重:
**(1)情境不通。**英文 MBTI 里的情境往往是"prom 舞会上""感恩节大家庭聚餐""高中橄榄球场上"——对中文用户来说,这些场景没有触感。当一个题目的情境和你的生活无关,你会下意识"猜出题人想测什么",而不是"对照真实自己回答"。这种猜题行为会显著降低测试信度。
**(2)语用差异。**中文里"我倾向于……"和"我有时候会……"的语气微妙差距,在英文翻译中容易抹平。中文人格测试的题目,需要按中文使用者的实际语用习惯写,而不是把英文的 "I tend to..." 直接套上"我倾向于"。
**(3)文化默认值不同。**例如"主动表达感情"在中文文化里和英文文化里的基线就不一样,所以同一份题目在两种文化里测出来的"E"分布,是没法直接比较的。我们的题库需要按中文使用者的"基线"重新校准。
棱格的 88 道题,全部由 Claude 用现代中文重写,不参考任何英文测试题。 题库情境包括:同事、聚餐、地铁、加班、考试、汇报、送礼、和父母通话、网购退货、视频会议、相亲、公园遛弯——都是中文用户日常生活里真实会出现的场景。
文风方面我们刻意避开两类陷阱:民国译本式的拗口("汝倾向于在群体中独处")和美式翻译腔("作为一个非常擅长在不确定情境中的策略性思考者……"),改用接近小红书 / 豆瓣的现代中文短句:"做完一件事,即使不完美,你也能放下它继续往前。"
每一道题都经过"读出来通不通顺"的口语测试。
7. AI 个性化解读的角色
棱格付费报告(M3)的核心差异化,是 AI 个性化解读。
传统 16 型测试(包括 16personalities 的付费版)的"完整报告"本质上是 16 个固定模板——你是 INFJ,就拿到事先写好的 INFJ 长版描述,你和另一个 INFJ 拿到的是一模一样的内容。
棱格的做法不一样:国际顶级 AI 大模型会拿到你独特的答题向量——你 5 个维度的具体百分比、你的答题节奏、你的反向题一致性、你在边界维度的双倾向标记——然后基于这个独特的指纹生成你的报告。
具体来说:
- 职业适配建议(~600-700 字):不是"INTJ 适合做战略咨询",而是"基于你 75% 偏 N 但 J/P 接近 50/50,你在需要长线规划但允许一定灵活性的环境最舒服,具体可以考虑……"。
- 关系与亲密相处:不是"INFP 在恋爱中浪漫",而是基于你 T/F 与 A/T 的具体得分,讲你在亲密关系中可能的天然倾向、常见冲突源、和不同类型搭档的具体相处建议。
- 3 年成长路径:第一年专注什么、第二年突破什么、第三年的目标画像——具体到行动,不空话。
技术上我们用了 Anthropic prompt cache,把"类型基础描述"长期缓存,只把"用户独特数据"作为非缓存增量发给模型。这让单份报告的 AI 成本控制在 ¥3 以下,毛利仍然可观。
我们也设计了降级方案:大模型 API 短暂不可用时,系统返回基于静态 Type16 数据的模板版,绝不让用户付了钱看到"服务不可用"。
8. 我们的非目标:为什么我们不是临床工具
棱格不会:
- 帮你诊断抑郁、焦虑或任何精神疾病——找有资质的医生
- 决定你的职业路径——参考它,不要依赖它
- 评判一个候选人是否适合招聘——这是 MBTI 的伦理红线,棱格也不会跨
- 替代心理治疗——情感困扰严重请联系专业心理咨询师
棱格的合理用法是:作为自我探索的入口、作为团队和恋人之间的对话起点、作为成长方向的灵感来源。它的价值在于"启发",不在"裁决"。
我们也在网站显眼位置(用户协议、关于页、付费报告页脚)反复强调这个边界。这是科学诚实的成本——我们牺牲了一些"权威感",换来了用户对我们的长期信任。
9. 命名:棱格 / 棱镜战略家 / 16 个昵称的背后
最后聊聊名字。
"棱格" 这个中文品牌的隐喻是:棱镜把白光分解成完整的彩色光谱。 大众对人格的常见误解是把人当成单一标签——你是 INTJ,所以你冷峻;你是 ENFP,所以你跳脱。但人就像白光,看似单一,内含七色。让你的"光谱"被看见——这是棱格的产品哲学。
"棱镜战略家" 这类 16 个中文昵称,我们刻意避开了 16personalities 的商标用语("提倡者""指挥官""主人公")。每个昵称用棱镜作为统一前缀,后缀是该型最鲜明的人物形象——战略家、思辨者、引路人、温守者、画手、表演者。这些词都是常见中文词,不冒充任何专属商标。
英文昵称(Strategist, Theoretician, Lighthouse, Painter…)同样避开了 NERIS 商标,主要为未来海外站准备。
棱格的所有命名都不需要付授权费给第三方,这是健康长期生态的前提。
10. 学术诚实声明
棱格不会假装它是经过同行评议的科学工具。
我们承认的局限:
- 我们的题库 v1 还没有大样本的信度/效度检验
- 4 字母代号天然存在分类粗糙的问题(虽然我们用连续百分比缓解)
- 一致性指数仍在 M2.x 阶段开发
- 重测信度需要 5000+ 用户使用 6 个月后才能给出可信数据
我们承诺做的:
- 持续累计真实用户答题数据,做信度/效度的内部校准(已规划 M5 之后)
- 公开 5000 用户后的统计报告(类型分布、维度相关性、一致性指数等)
- 定期修订题库,每次大改升版号(v1 → v2 → ...),并保留历史版本数据
- 将棱格的统计基线与 Big Five 的本土化数据(中科院 CBF-PI 等)做对照
我们的目标不是"成为一个完美的科学工具",而是 "成为一个对中文用户而言,在科学诚实和传播友好之间的最佳折中"。
如果你认同这个目标,欢迎你做一次测试。