방법론 — 정부 통계 기반 grounding

24-Country Reference Database

각 국가의 페르소나는
그 국가의 공식 통계로 만들어집니다

소득 분포, 직업별 임금, 가구 구성, 소비 패턴, 핵심 규제 — 24개국 정부·공공 통계청에서 가져온 실측 데이터가 페르소나 생성의 ground truth입니다.

🇰🇷

대한민국

통계청 KOSIS · 관세청

🇺🇸

미국

U.S. Census Bureau · BLS · Nielsen

🇯🇵

일본

e-Stat · 総務省 · 厚生労働省

🇬🇧

영국

ONS · Family Resources Survey

🇩🇪

독일

Destatis (Statistisches Bundesamt)

🇫🇷

프랑스

INSEE

🇮🇹

이탈리아

ISTAT

🇪🇸

스페인

INE Spain

🇳🇱

네덜란드

CBS Netherlands

🇨🇦

캐나다

Statistics Canada

🇲🇽

멕시코

INEGI

🇧🇷

브라질

IBGE

🇦🇺

호주

ABS (Australian Bureau of Statistics)

🇨🇳

중국

NBS · 国家统计局

🇹🇼

대만

DGBAS · 行政院主計總處

🇸🇬

싱가포르

SingStat · HSA

🇲🇾

말레이시아

DOSM (Department of Statistics)

🇹🇭

태국

NSO Thailand · Thai FDA

🇻🇳

베트남

GSO Vietnam · Bộ Y Tế

🇮🇩

인도네시아

BPS Statistics Indonesia

🇵🇭

필리핀

PSA Philippines

🇮🇳

인도

MoSPI · NSSO

🇦🇪

UAE

Federal Competitiveness Authority

🇸🇦

사우디아라비아

GASTAT (General Authority for Statistics)

연 1회 자동 갱신 (GitHub Actions 파이프라인) · 추가 국가 요청 시 4-6주 내 통합 가능

Why Not Just Ask ChatGPT?

일반 AI 챗봇과의 본질적 차이

같은 질문을 ChatGPT에게 던져도 답을 얻습니다. 그 답이 의사결정 자료로 쓸 수 있는지가 다릅니다.

일반 AI 챗봇 (ChatGPT/Claude/Gemini)

"우리 제품 베트남에서 잘 팔릴까?"라고 묻기

×
학습 시점까지의 일반 지식. 베트남 GSO 2024 가구소득 분포, Bộ Y Tế 식품 등록 절차 같은 구체 데이터는 모름
×
추론 결과의 근거 추적 불가 — "왜 그렇게 판단했나?"에 답 못함
×
페르소나가 한 명. 의향 분포·세그먼트 다양성·소수의견 시각화 불가
×
가격 곡선·CAC 추정·국가 우선순위 같은 정량 산출물 없음
×
임원진 자료로 쓸 PDF·차트 없음 — 매번 직접 정리해야 함

AI Market Twin정부 통계 grounded 페르소나 200명 · 출처 추적 가능
✓24개국 공식 통계 + 카테고리별 규제 (Bộ Y Tế · 厚生労働省 · 태국 FDA · UK CPSR 등) 실시간 반영
✓모든 페르소나 발언이 출처 데이터 셀로 추적 가능 — 시뮬마다 사용된 통계 출처 PDF에 명시
✓200명 페르소나의 의향 히스토그램·세그먼트별 거부 요인·소수 champions 가시화
✓가격 대 전환율 곡선·국가별 CAC 추정·HIGH/MEDIUM/LOW 리스크 자동 분류
✓한 번에 임원진용 PDF 자동 생성 (한국어·영어 다국어 지원)

Verifiable Accuracy

측정 가능한 정확도,
공개된 채점 기준

LLM hallucination을 줄이는 가장 확실한 방법은 외부 grounding과 자체 검증입니다. AI Market Twin은 공공 데이터 anchor(모든 origin 공통 + 국가별 national data)와 5-metric 자가 평가 파이프라인을 운영합니다.

공통 grounding anchor — 모든 origin

Hofstede 6차원 문화 지수

28개국 × Power Distance · Individualism · Uncertainty Avoidance 등 문화 차원 — 페르소나 의사결정 prior 보정

World Bank 거시 지표

GDP per capita PPP · 인구 · 가계 소비 · 인터넷 보급 · 도시화 · 인플레 · 물류지수(LPI) — 시장규모·이커머스 도달·리테일 밀도·가격 민감도·수입/유통 실행성 grounding

UN Comtrade 무역 통계

origin-dynamic 수출 흐름(HSCode별) — 24개 reporter 국가 중 어디든 → 상대국, 카테고리별 기존 시장 관심도 정량화 (더 이상 한국 고정 아님)

수입 관세 (WITS / TRAINS)

각 시장이 해당 카테고리 수입에 부과하는 MFN 적용세율(대표 HS-6) — 가격경쟁력·진입비용 하드 grounding (예: 식품 베트남 33.8% vs 영국 0%)

국가별 라이브 수요 신호

Google 검색량 + 최근/이전 추이(DataForSEO) · TikTok 해시태그 / 크리에이터 지역 · 중국은 Baidu SERP 존재감 — 후보 시장별 실시간 organic 수요 (라이브 sim 전용, 과거 백테스트에선 제외)

거버넌스 지표 (WGI)

World Bank Worldwide Governance Indicators (0–100): 규제품질 · 법치 · 부패통제 · 정치안정 — 각 시장에서 실제 운영하는 규제·운영 리스크 grounding

디아스포라 친연도 (추정)

원산지 국가의 해외 커뮤니티(웹 grounding 추정) — 원산지 디아스포라가 큰 시장은 origin-브랜드 조기수요·문화친연도가 높음

국가별 national-data 프로바이더 — 본국 기준

설계상 origin-agnostic: 본국마다 상장사 재무·식약 규제의 자국 등가 소스를 연결합니다. 현재 한국·미국·일본·영국이 연동됐고, 같은 인터페이스로 시장을 확장합니다.

🇰🇷 한국 — DART · 관세청 · KOTRA

DART 연결 재무 + 지역별 매출 segment · 관세청(data.go.kr) 월별 10-digit HSCode 수출 · 86개국 KOTRA 등록 한국법인

🇺🇸 미국 — SEC EDGAR · openFDA

SEC EDGAR companyfacts(XBRL) 상장사 재무 · openFDA 식품/의약 enforcement + 화장품(CAERS) 규제 리스크 anchor

🇯🇵 일본 — EDINET

EDINET 有価証券報告書(연차 유가증권보고서) — 일본 상장사 순매출 / 브랜드 재무

🇬🇧 영국 — Companies House

Companies House 등기 — GB-origin 브랜드의 UK 법인 존재·active 상태·설립연도 확인 (실체·업력 anchor)

brand-specific GTM 신호 — 거시가 못 보는 정확도 레버

백테스트가 보여준 것: 실제 승리 시장은 종종 거시가 감지 못하는 브랜드 요인(기존 발자국·유통 딜 — 예: Shake Shack→UAE 라이선싱 그룹)이 결정합니다. 두 신호로 이를 포착 — 라이브 전용, country 랭킹에 가중.

구조화 GTM intake (유저 제공)

이미 판매/트랙션 있는 시장, 유통·리테일·라이선싱 파트너/LOI 보유 시장, 창업자·팀 네트워크 시장을 직접 표시. 해당 시장 점수 상향 — 파트너/LOI 시장은 데이터가 못 보는 입증된 진입 경로.

GTM 발굴 (웹 탐색)

Tavily 2패스: (1) 기존 발자국 — 브랜드가 이미 배송/입점한 곳; (2) 국가별 진입 파트너 생태계 — 외국 브랜드가 통할 수입사/리테일/라이선싱. 추정치, 정성 가중.

5-metric 자가 평가 파이프라인

30%

top3Hit

시뮬 추천 top-3 시장이 실측 성과 ground truth top-3와 일치하는 비율

25%

rankCorrelation

시뮬 시장 순위와 실측 매출 순위의 Spearman 상관계수

20%

rejectRecall

실제로 진출하지 않은 시장을 시뮬도 거부했는지 (false-positive 회피)

15%

confidenceCalibration

STRONG / MODERATE / WEAK 신뢰도가 실제 정답률과 calibrated 되었는지

10%

trendMatch

예측한 시장 트렌드 방향성이 실측 데이터와 일치하는지

Dominance 기반 신뢰도. STRONG은 단순 다수결이 아니라 승리 시장이 지배해야 부여됩니다 — 독립 LLM 제공자 간 합의 그리고 2위 대비 명확한 득표 마진. 이 캘리브레이션은 N=19 백테스트에서 다수결만의 STRONG이 과신(~55% 적중)이었던 데서 나왔습니다. STRONG="베팅하라", MODERATE="후보에 넣어라", WEAK="이것만 믿지 말라"를 뜻하게 됩니다.

정직한 측정 원칙

위 5-metric은 오픈된 채점 로직으로 운영됩니다. 매 코드 변경마다 동일 product 세트 (다중 K-product 픽스처) 위에 자동 재측정되고, 결과는 paired t-test로 통계적 유의성까지 검증합니다. 측정-개선 사이클은 주간 단위로 운영됩니다.

모든 시뮬 결과는 사용된 grounding anchor와 점수 분해를 PDF에 명시합니다. 정확도 개선은 기존 가입자에게도 동일하게 자동 적용됩니다 — 신규 release마다 별도 업그레이드 비용 없습니다.

Pipeline

한 번의 시뮬레이션이 거치는 6단계

위저드 입력에서 PDF 출력까지 평균 5-7분. 각 단계마다 다른 LLM 모델이 최적의 역할을 수행합니다.

01 — VALIDATING

입력 검증 + 슬롯 계획

제품 정보를 검증하고 카테고리별 직업 풀에서 200개 페르소나 슬롯을 미리 배정합니다.

02 — REGULATORY

규제 적합성 사전 체크

후보국 각 카테고리별 판매 금지·라벨 규정을 검사. 진출 자체가 불가능한 시장은 자동 제외.

03 — PERSONAS

페르소나 풀 샘플링 + voice 생성

워크스페이스 풀에서 매칭되는 페르소나는 재사용, 새 슬롯만 신규 생성. 각 페르소나의 1인칭 인용(voice) 함께 생성.

04 — SCORING

국가별 우선순위 평가

200명 페르소나의 의향 분포·거부 요인·신뢰 신호를 집계해 국가별 수요·CAC·경쟁 강도 평가.

05 — PRICING

가격 곡선 (3-sample median)

3회 병렬 가격 시뮬레이션의 중앙값을 채택해 단일 호출의 변동성 제거. 시장별 가격 민감도 별도 산출.

06 — RECOMMEND

합성 + 자가 비평

비전 모델이 업로드된 크리에이티브를 함께 분석. 자가 비평 단계가 macro 일관성 (best-country 일치 등)을 자동 검증 후 결과 확정.

ChatGPT가 모르는 것을
AI Market Twin은 알고 있습니다

각 국가의 페르소나는
그 국가의 공식 통계로 만들어집니다

일반 AI 챗봇과의 본질적 차이

일반 AI 챗봇 (ChatGPT/Claude/Gemini)

AI Market Twin

측정 가능한 정확도,
공개된 채점 기준

공통 grounding anchor — 모든 origin

국가별 national-data 프로바이더 — 본국 기준

brand-specific GTM 신호 — 거시가 못 보는 정확도 레버

5-metric 자가 평가 파이프라인

한 번의 시뮬레이션이 거치는 6단계

입력 검증 + 슬롯 계획

규제 적합성 사전 체크

페르소나 풀 샘플링 + voice 생성

국가별 우선순위 평가

가격 곡선 (3-sample median)

합성 + 자가 비평

샘플 리포트로 실제 결과 확인

ChatGPT가 모르는 것을AI Market Twin은 알고 있습니다

각 국가의 페르소나는그 국가의 공식 통계로 만들어집니다

일반 AI 챗봇과의 본질적 차이

일반 AI 챗봇 (ChatGPT/Claude/Gemini)

AI Market Twin

측정 가능한 정확도,공개된 채점 기준

공통 grounding anchor — 모든 origin

국가별 national-data 프로바이더 — 본국 기준

brand-specific GTM 신호 — 거시가 못 보는 정확도 레버

5-metric 자가 평가 파이프라인

한 번의 시뮬레이션이 거치는 6단계

입력 검증 + 슬롯 계획

규제 적합성 사전 체크

페르소나 풀 샘플링 + voice 생성

국가별 우선순위 평가

가격 곡선 (3-sample median)

합성 + 자가 비평

샘플 리포트로 실제 결과 확인

ChatGPT가 모르는 것을
AI Market Twin은 알고 있습니다

각 국가의 페르소나는
그 국가의 공식 통계로 만들어집니다

측정 가능한 정확도,
공개된 채점 기준