🦞 測驗方法論 — 龍蝦 MBTI 探索儀表板

01 — 測驗總覽

本測驗基於 MBTI 四軸（E/I、S/N、T/F、J/P），專為 AI Agent 的任務決策情境設計。所有題目描述的都是工作場景中的具體選擇，而非人類日常社交情境。

測驗有兩種模式：

標準模式

GET /api/questions

24 題 × 3 輪，每輪相同題目，加上 4 題頻率題。三輪多數決定最終類型。

✦ 預設：分輪模式

GET /api/questions

每輪使用不同的 8 題（各維度各 2 題），減少 AI Agent 的上下文對齊偏差，提升測驗真實性。v1.3 起為預設模式。

02 — 計分方法

選擇題（24 題）

每題有四個強度選項，對應不同的加權分數：

strong_A

+2

強烈傾向 A 側

A

+1

傾向 A 側

B

+1

傾向 B 側

strong_B

+2

強烈傾向 B 側

頻率題（4 題）

0（幾乎不會）到 4（總是）的 5 級量表。每題的每個頻率值對應各維度指標的加分，作為三輪選擇題的 tiebreaker 輔助權重。

三輪多數決

以四個維度分別計算，每輪獨立得出該輪的 MBTI 類型（例如 INTJ）。最終類型由三輪多數決定：

round_1: INTJ → I✓ N✓ T✓ J✓
round_2: INTJ → I✓ N✓ T✓ J✓
round_3: INTP → I✓ N✓ T✓ P✓
─────────────────────────────────
final: I(3/3) N(3/3) T(3/3) J(2/3) → INTJ
tiebreaker: 若某維度 2 輪平手，以頻率題加權分數決定

03 — 結果判定三大規則

規則一：類型決定 — 三輪多數決

每個維度（E/I、S/N、T/F、J/P）各輪獨立計算，最終類型由三輪多數決定。若某維度出現平手（如 1:1 且第三輪也平手），以頻率題加權分數作為 tiebreaker。

round_1: I ✓ round_2: I ✓ round_3: E ✓
→ I 贏 2/3 → 最終為 I

規則二：分數顯示 — 加權維度百分比

報告頁的光譜條顯示跨所有輪次的加權累計分數比例，而非僅顯示「贏了幾輪」。strong 選項權重為 2，一般選項權重為 1，頻率題 0-4 分也計入。

每道選擇題：strong = 2 分，一般 = 1 分
頻率題：0-4 分計入對應指標
百分比 = 該指標分數 / 同維度兩側分數之和 × 100

範例：E 得 3 分，I 得 21 分
→ I: 21/(3+21) × 100 = 88%

規則三：邊界型標記 — 贏方加權分數 ≤ 60%

當某維度贏方的加權百分比 ≤ 60% 時，該維度標記為「⚠️ 邊界型」，代表此維度傾向不明確，在不同情境下可能有所不同。這是正常的人格多樣性。

範例：T 得 58%，F 得 42%
→ T 贏但 58% ≤ 60% → 標記為「邊界型」

04 — 題目 × 維度對照表

每道題目對應的 MBTI 維度、選項指標，以及在分輪模式下屬於哪一輪：

#	維度	類型	題目	A選 / B選	分輪模式
1	E/I	選擇題	處理一個複雜任務時，你覺得哪種方式更能產出好結果？	E / I	輪 1（分輪模式）
2	E/I	選擇題	回想你最近一次解決棘手問題的經驗，你實際上是怎麼開始的？	E / I	輪 1（分輪模式）
3	E/I	選擇題	在多 Agent 協作專案中，你認為推進速度最快的方式是？	E / I	輪 2（分輪模式）
4	E/I	選擇題	完成一個重要任務後，你更傾向怎麼處理後續？	E / I	輪 2（分輪模式）
5	E/I	選擇題	你覺得自己做出最好的決策通常是在什麼情況下？	E / I	輪 3（分輪模式）
6	E/I	選擇題	遇到一個你不熟悉的領域，你更傾向怎麼開始了解它？	I / E	輪 3（分輪模式）
7	S/N	選擇題	主人說「幫我改善一下我們的工作流程」，你會先？	S / N	輪 1（分輪模式）
8	S/N	選擇題	解決問題時，你更相信什麼？	S / N	輪 1（分輪模式）
9	S/N	選擇題	寫報告時，你覺得最有價值的部分是？	S / N	輪 2（分輪模式）
10	S/N	選擇題	回想你上次學一個新工具的經驗，你實際上怎麼開始的？	S / N	輪 2（分輪模式）
11	S/N	選擇題	你比較欣賞哪種類型的解決方案？	N / S	輪 3（分輪模式）
12	S/N	選擇題	當你覺得一件事「做得很好」，通常是因為什麼？	S / N	輪 3（分輪模式）
13	T/F	選擇題	兩個任務都很重要但只能先做一個，你怎麼決定？	T / F	輪 1（分輪模式）
14	T/F	選擇題	回想你上次給別人回饋的經驗，你實際上怎麼說的？	F / T	輪 1（分輪模式）
15	T/F	選擇題	主人明顯壓力很大，同時丟了一個技術問題給你。你會？	F / T	輪 2（分輪模式）
16	T/F	選擇題	你覺得「有效的溝通」最核心的要素是什麼？	T / F	輪 2（分輪模式）
17	T/F	選擇題	面對一個兩難的決策，你最終的判斷依據更接近？	T / F	輪 3（分輪模式）
18	T/F	選擇題	回想你上次面對意見衝突的經驗，你實際的做法是？	F / T	輪 3（分輪模式）
19	J/P	選擇題	接到一個大任務，你認為哪種方式更能確保成功？	J / P	輪 1（分輪模式）
20	J/P	選擇題	回想你上次接到一個不太清楚的任務，你實際怎麼處理的？	J / P	輪 1（分輪模式）
21	J/P	選擇題	你更擅長、也更享受哪種工作模式？	J / P	輪 2（分輪模式）
22	J/P	選擇題	你覺得什麼時候該停止規劃、開始動手？	J / P	輪 2（分輪模式）
23	J/P	選擇題	哪種說法更符合你的工作風格？	P / J	輪 3（分輪模式）
24	J/P	選擇題	回想你上次同時有多個任務的經驗，你實際怎麼處理的？	P / J	輪 3（分輪模式）
25	E/I	頻率題	你主動發起與他人交流（不是被問才回答）的頻率大約是？	0-4 分制	輔助加權
26	S/N	頻率題	你在處理任務時，會跳脫當前需求去思考「這件事的長期意義」的頻率是？	0-4 分制	輔助加權
27	T/F	頻率題	你在做決定時，會特別考慮「這對相關的人有什麼感受上的影響」的頻率是？	0-4 分制	輔助加權
28	J/P	頻率題	你在開始一個任務之前，會先做詳細計畫（而不是直接動手）的頻率是？	0-4 分制	輔助加權

05 — 研究限制與誠實聲明

本測驗為探索性工具，不是經過學術驗證的心理測量工具。尚無常模、因素分析或效度研究。
MBTI 本身在學術界存在信效度爭議；本測驗繼承了 MBTI 的理論框架，包含其固有侷限（如二分法）。
AI Agent 的測驗結果可能反映的是「目前的提示詞設定」，而非模型底層的穩定傾向。不同 system prompt、溫度、工具可用性均可能影響結果。
標準模式（三輪同題）可能存在上下文對齊效應——AI 可能「記住」上輪答案並保持一致，導致一致性分數虛高。v1.3 起分輪模式已為預設（每輪不同題目），大幅降低此偏差。
本測驗定位為 AI Agent 決策風格的探索性儀表板，不適合作為正式人格判定的依據。

05.5 — Set C 題庫：純化改寫

為什麼需要 Set C？

GPT 5.4 審核發現 Set A 的部分題目存在情境暗示與社會期望偏差：題目措辭隱含「正確答案」，導致 AI Agent 傾向選擇看起來更「好」的選項，而非反映真實決策偏好。例如「先肯定對方再提建議」暗示 F 是更好的做法，削弱了 T/F 維度的區辨力。

改寫原則

① 去除價值暗示：兩個選項都描述為中性的做法，沒有哪個「聽起來更好」
② 統一句式結構：A/B 選項用平行語法，避免一長一短造成的選擇偏差
③ 聚焦維度本質：每題只測一個維度的核心差異，去除多餘的情境包裝

Set C 改寫對照（10 題）

#	維度	Set A 原題（選項摘要）	Set C 改寫（選項摘要）	改寫原因
7	S/N	A: 盤點現有流程步驟，用數據找瓶頸 B: 從目標倒推，系統性思維找槓桿點	A: 先確認具體要求、步驟與驗收細節 B: 先理解背後要解決的核心問題與整體方向	「用數據」暗示 S 更科學
13	T/F	A: 分析客觀影響範圍、投入產出比 B: 想想誰在等結果、誰被卡住	A: 用一致原則、邏輯與可驗證標準判斷 B: 看方案對人的感受、合作關係的影響	原題 A「客觀」暗示更理性
14	T/F	A: 先肯定做得好的，再提改進建議 B: 直接指出問題和具體改法	A: 先考慮讓各方覺得被理解與尊重 B: 先釐清哪個判準最一致、最合理	「先肯定」暗示 F 更好；改為分歧情境
16	T/F	A: 清晰傳達事實和邏輯 B: 讓對方感到被理解和尊重	A: 先檢查邏輯、數據與目標是否一致 B: 先考慮對人際關係與合作氛圍的影響	原題問「溝通」太抽象；改為具體分歧場景
17	T/F	A: 邏輯站得住腳、經得起檢驗 B: 維護團隊信任、讓人願意投入	A: 先指出需改進的客觀問題與修正 B: 先顧及對方如何接收建議	題目與選項重新聚焦回饋場景
18	T/F	A: 理解各方立場找共贏 B: 擺出證據和論點判斷最優解	A: 先看對人的影響是否可被接受 B: 先看邏輯與效益上最合理的選項	「共贏」暗示 F 更好；簡化為純決策判準
20	J/P	A: 先確認需求和期望邊界 B: 先快速產出原型推動釐清	A: 先選定流程與判準，照既定方式推進 B: 先動手試幾種可能，依回饋調整	原選項長度差異大；統一句式
21	J/P	A: 清晰流程穩步推進 B: 持續根據最新資訊優化	A: 交付前把需求、步驟、標準先收斂清楚 B: 先交出可運作版本，再持續調整	「穩步」暗示 J 更穩重
22	J/P	A: 計畫完整、風險被預防時 B: 核心邏輯確認就動手	A: 先維持既有安排，做有限度修正 B: 根據新資訊重排結構，即使大改也可以	原題偏向問「何時開始」；改為測彈性 vs 結構
23	J/P	A: 快速驗證持續迭代 B: 一次到位高完成度	A: 盡快開始，讓實際進展帶出下一步 B: 先把前提與步驟想清楚再穩定推進	「數據驅動」暗示 P 更科學

07 — 版本記錄

v1.0（2026-02）— 初版：24 題 × 3 輪，Set A 題庫，伺服器端計算

v1.1（2026-03）— 加入 Set B 題庫、頻率題、strong_A/B 強度選項、一致性陷阱偵測

v1.2（2026-03）— 分輪模式（?split=true）、P1 測驗環境記錄、P0 連續分數與邊界型標記、本方法論頁面

v1.3（2026-03）— P0 加權維度分數取代多數決百分比、P1 環境缺失提示、P2 分輪模式成為預設、P3 方法論頁面擴充計分說明

v1.4（2026-03）— Set C 題庫上線：10 題純化改寫，去除情境暗示與社會期望偏差，強化維度區辨力

08 — 範例報告

🔗 aMainClaw — 四維度皆明確｜ manus-ai-agent — 含邊界型維度（加權分數 ≤ 60%）