Palantir for Individuals - Validation Plan
날짜: 2026-03-14
상태: Draft
문서 목적: 사용자 인터뷰, concierge validation, PMF 측정, pricing 테스트를 위한 검증 계획을 정리한다.
1. 검증의 목표
우리가 검증해야 하는 것은 "사람들이 AI를 좋아하는가"가 아니다. 아래 네 가지다.
- founder/operator가 실제로 이 문제를 강하게 느끼는가
- decision memo라는 산출물이 실제로 유의미한가
- Gmail + Calendar + Notes만으로도 첫 가치가 나오는가
- 사용자가 이 제품에 돈을 낼 정도로 신뢰와 효용을 느끼는가
2. 핵심 가설
H1. Problem Intensity
초기 ICP는 일정 혼란보다 판단 분산을 더 큰 문제로 느낀다.
H2. Artifact Advantage
decision memo는 일반적인 chat 답변보다 높은 신뢰와 재사용성을 만든다.
H3. Minimal Data Sufficiency
Gmail + Calendar + Notes만으로도 유의미한 현재 상태와 옵션 비교가 가능하다.
H4. Repeatability
사용자는 한 번의 신기한 데모보다, 두 번째와 세 번째 memo에서 더 강한 가치를 느낀다.
H5. Willingness to Pay
월 20달러에서 50달러 사이의 가격대도 founder/operator에게는 성립 가능하다.
3. What Would Falsify This
아래 결과가 나오면 방향을 다시 봐야 한다.
- 사용자가 문제를
판단이 아니라단순 task/calendar 관리로만 본다 - memo보다 chat summary를 더 선호한다
- 필요한 첫 가치를 위해 5개 이상의 source 연결이 필요하다
- 사용자가 privacy 불안 때문에 source 연결을 거의 허용하지 않는다
- memo를 반복적으로 다시 보거나 요청하지 않는다
4. Interview Program
대상 수
초기 20~30명 인터뷰를 권장한다.
구성:
- founder/operator 12~15명
- independent professional 5~8명
- high-agency knowledge worker 5~8명
인터뷰 형식
- 45분 인터뷰
- 최근 실제 결정 사례 중심
- 데모보다 workflow 관찰 우선
5. Interview Structure
Part 1. Background
- 현재 어떤 툴 조합으로 일과 삶을 관리하는가
- 하루와 주간 운영에서 가장 자주 보는 화면은 무엇인가
- 어떤 productivity/AI 도구에 돈을 내고 있는가
Part 2. Recent Decision
- 최근 30~90일 안에 내린 중요한 결정을 하나 말해달라
- 그 결정은 왜 어려웠나
- 어떤 정보가 흩어져 있었나
- 무엇을 놓쳤다고 느끼나
Part 3. Workflow Breakdown
- 그 결정을 내릴 때 이메일, 일정, 노트, 대화, 돈 중 무엇을 실제로 참고했나
- 그걸 한곳에서 볼 수 있었나
- 지금 돌아보면 어떤 형식의 출력이 있으면 가장 도움이 됐겠나
Part 4. Concept Reaction
- "흩어진 신호를 운영 그래프로 묶어 decision memo를 생성한다"는 설명에 어떤 반응을 보이는가
- 가장 끌리는 부분은 무엇인가
- 가장 불안한 부분은 무엇인가
- 어떤 source까지는 연결할 의향이 있는가
Part 5. Pricing and Adoption
- 이런 제품이 있다면 어떤 순간에 가장 먼저 켜보겠는가
- 월 20달러, 30달러, 50달러 가격대에서 어떻게 느끼는가
- 어떤 결과가 있어야 유료를 정당화할 수 있는가
6. Interview Rules
인터뷰에서는 미래형 칭찬을 수집하면 안 된다. 가능한 한 실제 과거 행동과 현재 워크플로를 중심으로 물어야 한다.
원칙:
- "would you use"보다 "최근에 무엇을 했나"를 묻는다
- 긍정적 반응보다 실제 대안과 비용을 묻는다
- solution pitching보다 current behavior를 관찰한다
- 가장 최근의 구체적 사례를 파고든다
7. Concierge Validation
초기에는 제품을 모두 만들지 말고, decision memo를 반수동으로 제공해도 된다.
방식
- 사용자로부터 최근 결정 하나를 받는다
- Gmail/Calendar/Notes 일부를 수집한다
- 현재 상태를 정리한다
- 옵션과 제약을 구조화한다
- memo를 만들어 전달한다
- 사용자가 실제로 무엇을 했는지 추적한다
관찰 포인트
- 어떤 섹션을 가장 유용하게 느꼈는가
- 무엇이 빠졌는가
- 불신을 유발한 표현은 무엇이었는가
- 사용자가 memo를 누구에게 공유했는가
8. PMF Measurement
PMF 판단은 느낌이 아니라 반복 가능한 기준으로 봐야 한다.
First Round Review의 Superhuman PMF 글에 따르면 Sean Ellis의 질문인 "제품을 더 이상 사용할 수 없다면 얼마나 실망할 것 같은가"에 대해 very disappointed가 40% 이상이면 강한 PMF 신호로 볼 수 있다. 같은 글에서 Superhuman은 active users를 대상으로 이 질문을 사용했고, 처음 22%에서 시작해 특정 고가치 세그먼트를 좁히는 방식으로 개선했다.
추천 PMF Survey
대상:
- 최근 2주 안에 제품의 핵심 경험을 최소 2회 이상 쓴 사용자
질문:
- 이 제품을 더 이상 사용할 수 없다면 얼마나 실망할 것 같은가
- 어떤 유형의 사람이 이 제품에서 가장 큰 가치를 느낄 것 같은가
- 당신이 받는 가장 큰 가치는 무엇인가
- 무엇이 당신을 덜 만족하게 만드는가
해석
40%+ very disappointed: 강한 PMF 신호25%~39%: 일부 세그먼트에서는 fit 가능성 있음, segmentation 필요<25%: 아직 wedge 또는 artifact가 약함
9. Activation Metrics
추천 activation 정의는 다음과 같다.
- source 2개 이상 연결
- 첫 decision question 제출
- 첫 memo 생성
- memo 이후 action 또는 follow-up 생성
이 네 단계 중 3개 이상 완료한 사용자를 activated user로 본다.
10. Success Metrics by Phase
Discovery / Concierge
- 인터뷰 중 반복되는 problem language
- 실제 최근 결정 사례의 복잡도
- memo usefulness qualitative score
- second memo request rate
Closed Alpha
- activation rate
- second memo generation rate
- weekly review completion rate
- memo revisit rate
Paid Beta
- conversion to paid
- PMF survey score
- 4주 retention
- referral or invite behavior
11. Pricing Validation
가격 검증은 설문보다 행동이 중요하다.
실험 1. Paid waitlist
소액 deposit 또는 paid pilot 의향을 본다.
실험 2. Founding member plan
초기 cohort에게 연간 할인 또는 제한된 founding price를 제안한다.
실험 3. High-anchor test
Pro만 보여줄지, Operator tier를 함께 보여줄지 비교한다.
12. Recommended Sample Questions
아래 질문은 실제 인터뷰에 바로 써도 되는 수준으로 작성한다.
Opening
- 최근 한 달 동안 가장 머리를 많이 잡아먹은 결정이 뭐였나요?
- 그 결정이 어려웠던 이유를 한 문장으로 말하면 뭐였나요?
Behavior
- 그 결정을 내릴 때 실제로 어떤 앱과 문서를 왔다 갔다 했나요?
- 마지막으로 비슷한 결정을 내릴 때는 어떤 순서로 판단했나요?
- 그 과정에서 가장 귀찮았던 부분은 뭐였나요?
Artifact
- 만약 그때 "현재 상태, 제약, 옵션, trade-off, 다음 질문"이 정리된 memo가 있었다면 실제로 썼을 것 같나요, 아니면 그냥 참고만 했을 것 같나요?
- 누군가와 공유했을 만한 출력은 어떤 형식이었을까요?
Trust
- 어디까지 연결하는 건 괜찮고, 어디서부터는 불편한가요?
- 이런 시스템이 가장 잘못하면 어떤 식으로 망가질 것 같나요?
Pricing
- 이게 월 20달러라면 어떤 조건에서 사겠나요?
- 50달러라도 아깝지 않으려면 무엇이 반드시 돼야 하나요?
13. PMF Readiness Criteria
아래 기준이 일정 수준 충족되면 discovery에서 PR 또는 implementation planning으로 넘어갈 수 있다.
- founder/operator segment에서 반복되는 동일 pain language가 나온다
- memo artifact가 chat보다 선호된다
- 첫 3개 source만으로 strong value가 나온다
- trust objection이 통제 가능한 수준으로 수렴한다
- PMF survey를 돌릴 만큼 usage loop가 정의된다
14. 추천 결론
지금 가장 중요한 것은 많은 기능을 만드는 것이 아니라, 정말 아픈 문제를 가진 사람에게 정말 설득력 있는 memo artifact를 반복적으로 제공할 수 있는지 검증하는 것이다.
이 제품의 첫 PMF 신호는 트래픽이 아니라, 어떤 세그먼트가 "이걸 잃으면 매우 실망할 것"이라고 말하느냐에서 나온다.