Palantir for Individuals - Validation Plan

날짜: 2026-03-14
상태: Draft
문서 목적: 사용자 인터뷰, concierge validation, PMF 측정, pricing 테스트를 위한 검증 계획을 정리한다.

1. 검증의 목표

우리가 검증해야 하는 것은 "사람들이 AI를 좋아하는가"가 아니다. 아래 네 가지다.

founder/operator가 실제로 이 문제를 강하게 느끼는가
decision memo라는 산출물이 실제로 유의미한가
Gmail + Calendar + Notes만으로도 첫 가치가 나오는가
사용자가 이 제품에 돈을 낼 정도로 신뢰와 효용을 느끼는가

2. 핵심 가설

H1. Problem Intensity

초기 ICP는 일정 혼란보다 판단 분산을 더 큰 문제로 느낀다.

H2. Artifact Advantage

decision memo는 일반적인 chat 답변보다 높은 신뢰와 재사용성을 만든다.

H3. Minimal Data Sufficiency

Gmail + Calendar + Notes만으로도 유의미한 현재 상태와 옵션 비교가 가능하다.

H4. Repeatability

사용자는 한 번의 신기한 데모보다, 두 번째와 세 번째 memo에서 더 강한 가치를 느낀다.

H5. Willingness to Pay

월 20달러에서 50달러 사이의 가격대도 founder/operator에게는 성립 가능하다.

3. What Would Falsify This

아래 결과가 나오면 방향을 다시 봐야 한다.

사용자가 문제를 판단이 아니라 단순 task/calendar 관리로만 본다
memo보다 chat summary를 더 선호한다
필요한 첫 가치를 위해 5개 이상의 source 연결이 필요하다
사용자가 privacy 불안 때문에 source 연결을 거의 허용하지 않는다
memo를 반복적으로 다시 보거나 요청하지 않는다

4. Interview Program

대상 수

초기 20~30명 인터뷰를 권장한다.

구성:

founder/operator 12~15명
independent professional 5~8명
high-agency knowledge worker 5~8명

인터뷰 형식

45분 인터뷰
최근 실제 결정 사례 중심
데모보다 workflow 관찰 우선

5. Interview Structure

Part 1. Background

현재 어떤 툴 조합으로 일과 삶을 관리하는가
하루와 주간 운영에서 가장 자주 보는 화면은 무엇인가
어떤 productivity/AI 도구에 돈을 내고 있는가

Part 2. Recent Decision

최근 30~90일 안에 내린 중요한 결정을 하나 말해달라
그 결정은 왜 어려웠나
어떤 정보가 흩어져 있었나
무엇을 놓쳤다고 느끼나

Part 3. Workflow Breakdown

그 결정을 내릴 때 이메일, 일정, 노트, 대화, 돈 중 무엇을 실제로 참고했나
그걸 한곳에서 볼 수 있었나
지금 돌아보면 어떤 형식의 출력이 있으면 가장 도움이 됐겠나

Part 4. Concept Reaction

"흩어진 신호를 운영 그래프로 묶어 decision memo를 생성한다"는 설명에 어떤 반응을 보이는가
가장 끌리는 부분은 무엇인가
가장 불안한 부분은 무엇인가
어떤 source까지는 연결할 의향이 있는가

Part 5. Pricing and Adoption

이런 제품이 있다면 어떤 순간에 가장 먼저 켜보겠는가
월 20달러, 30달러, 50달러 가격대에서 어떻게 느끼는가
어떤 결과가 있어야 유료를 정당화할 수 있는가

6. Interview Rules

인터뷰에서는 미래형 칭찬을 수집하면 안 된다. 가능한 한 실제 과거 행동과 현재 워크플로를 중심으로 물어야 한다.

원칙:

"would you use"보다 "최근에 무엇을 했나"를 묻는다
긍정적 반응보다 실제 대안과 비용을 묻는다
solution pitching보다 current behavior를 관찰한다
가장 최근의 구체적 사례를 파고든다

7. Concierge Validation

초기에는 제품을 모두 만들지 말고, decision memo를 반수동으로 제공해도 된다.

방식

사용자로부터 최근 결정 하나를 받는다
Gmail/Calendar/Notes 일부를 수집한다
현재 상태를 정리한다
옵션과 제약을 구조화한다
memo를 만들어 전달한다
사용자가 실제로 무엇을 했는지 추적한다

관찰 포인트

어떤 섹션을 가장 유용하게 느꼈는가
무엇이 빠졌는가
불신을 유발한 표현은 무엇이었는가
사용자가 memo를 누구에게 공유했는가

8. PMF Measurement

PMF 판단은 느낌이 아니라 반복 가능한 기준으로 봐야 한다.

First Round Review의 Superhuman PMF 글에 따르면 Sean Ellis의 질문인 "제품을 더 이상 사용할 수 없다면 얼마나 실망할 것 같은가"에 대해 very disappointed가 40% 이상이면 강한 PMF 신호로 볼 수 있다. 같은 글에서 Superhuman은 active users를 대상으로 이 질문을 사용했고, 처음 22%에서 시작해 특정 고가치 세그먼트를 좁히는 방식으로 개선했다.

해석

40%+ very disappointed: 강한 PMF 신호
25%~39%: 일부 세그먼트에서는 fit 가능성 있음, segmentation 필요
<25%: 아직 wedge 또는 artifact가 약함

9. Activation Metrics

추천 activation 정의는 다음과 같다.

source 2개 이상 연결
첫 decision question 제출
첫 memo 생성
memo 이후 action 또는 follow-up 생성

이 네 단계 중 3개 이상 완료한 사용자를 activated user로 본다.

10. Success Metrics by Phase

Discovery / Concierge

인터뷰 중 반복되는 problem language
실제 최근 결정 사례의 복잡도
memo usefulness qualitative score
second memo request rate

Closed Alpha

activation rate
second memo generation rate
weekly review completion rate
memo revisit rate

Paid Beta

conversion to paid
PMF survey score
4주 retention
referral or invite behavior

11. Pricing Validation

가격 검증은 설문보다 행동이 중요하다.

실험 1. Paid waitlist

소액 deposit 또는 paid pilot 의향을 본다.

실험 2. Founding member plan

초기 cohort에게 연간 할인 또는 제한된 founding price를 제안한다.

실험 3. High-anchor test

Pro만 보여줄지, Operator tier를 함께 보여줄지 비교한다.

12. Recommended Sample Questions

아래 질문은 실제 인터뷰에 바로 써도 되는 수준으로 작성한다.

Opening

최근 한 달 동안 가장 머리를 많이 잡아먹은 결정이 뭐였나요?
그 결정이 어려웠던 이유를 한 문장으로 말하면 뭐였나요?

Behavior

그 결정을 내릴 때 실제로 어떤 앱과 문서를 왔다 갔다 했나요?
마지막으로 비슷한 결정을 내릴 때는 어떤 순서로 판단했나요?
그 과정에서 가장 귀찮았던 부분은 뭐였나요?

Artifact

만약 그때 "현재 상태, 제약, 옵션, trade-off, 다음 질문"이 정리된 memo가 있었다면 실제로 썼을 것 같나요, 아니면 그냥 참고만 했을 것 같나요?
누군가와 공유했을 만한 출력은 어떤 형식이었을까요?

Trust

어디까지 연결하는 건 괜찮고, 어디서부터는 불편한가요?
이런 시스템이 가장 잘못하면 어떤 식으로 망가질 것 같나요?

Pricing

이게 월 20달러라면 어떤 조건에서 사겠나요?
50달러라도 아깝지 않으려면 무엇이 반드시 돼야 하나요?

13. PMF Readiness Criteria

아래 기준이 일정 수준 충족되면 discovery에서 PR 또는 implementation planning으로 넘어갈 수 있다.

founder/operator segment에서 반복되는 동일 pain language가 나온다
memo artifact가 chat보다 선호된다
첫 3개 source만으로 strong value가 나온다
trust objection이 통제 가능한 수준으로 수렴한다
PMF survey를 돌릴 만큼 usage loop가 정의된다

14. 추천 결론

지금 가장 중요한 것은 많은 기능을 만드는 것이 아니라, 정말 아픈 문제를 가진 사람에게 정말 설득력 있는 memo artifact를 반복적으로 제공할 수 있는지 검증하는 것이다.

이 제품의 첫 PMF 신호는 트래픽이 아니라, 어떤 세그먼트가 "이걸 잃으면 매우 실망할 것"이라고 말하느냐에서 나온다.