Methodology

ChatGPT가 모르는 것을
AI Market Twin은 알고 있습니다

"우리 K-뷰티가 베트남에서 잘 팔릴까?"를 일반 AI 챗봇에게 물으면 일반론적 추측이 돌아옵니다. AI Market Twin은 베트남 Bộ Y Tế 식품 등록 절차, 인도네시아 BPS 가구소득 분포, 일본 厚生労働省 화장품 규제 같은 실제 정부·공공 통계로 grounded된 페르소나 풀 위에서 시뮬레이션을 실행합니다.

24-Country Reference Database

각 국가의 페르소나는
그 국가의 공식 통계로 만들어집니다

소득 분포, 직업별 임금, 가구 구성, 소비 패턴, 핵심 규제 — 24개국 정부·공공 통계청에서 가져온 실측 데이터가 페르소나 생성의 ground truth입니다.

🇰🇷
대한민국
통계청 KOSIS · 관세청
🇺🇸
미국
U.S. Census Bureau · BLS · Nielsen
🇯🇵
일본
e-Stat · 総務省 · 厚生労働省
🇬🇧
영국
ONS · Family Resources Survey
🇩🇪
독일
Destatis (Statistisches Bundesamt)
🇫🇷
프랑스
INSEE
🇮🇹
이탈리아
ISTAT
🇪🇸
스페인
INE Spain
🇳🇱
네덜란드
CBS Netherlands
🇨🇦
캐나다
Statistics Canada
🇲🇽
멕시코
INEGI
🇧🇷
브라질
IBGE
🇦🇺
호주
ABS (Australian Bureau of Statistics)
🇨🇳
중국
NBS · 国家统计局
🇹🇼
대만
DGBAS · 行政院主計總處
🇸🇬
싱가포르
SingStat · HSA
🇲🇾
말레이시아
DOSM (Department of Statistics)
🇹🇭
태국
NSO Thailand · Thai FDA
🇻🇳
베트남
GSO Vietnam · Bộ Y Tế
🇮🇩
인도네시아
BPS Statistics Indonesia
🇵🇭
필리핀
PSA Philippines
🇮🇳
인도
MoSPI · NSSO
🇦🇪
UAE
Federal Competitiveness Authority
🇸🇦
사우디아라비아
GASTAT (General Authority for Statistics)

연 1회 자동 갱신 (GitHub Actions 파이프라인) · 추가 국가 요청 시 4-6주 내 통합 가능

Why Not Just Ask ChatGPT?

일반 AI 챗봇과의 본질적 차이

같은 질문을 ChatGPT에게 던져도 답을 얻습니다. 그 답이 의사결정 자료로 쓸 수 있는지가 다릅니다.

일반 AI 챗봇 (ChatGPT/Claude/Gemini)

"우리 제품 베트남에서 잘 팔릴까?"라고 묻기
  • ×
    학습 시점까지의 일반 지식. 베트남 GSO 2024 가구소득 분포, Bộ Y Tế 식품 등록 절차 같은 구체 데이터는 모름
  • ×
    추론 결과의 근거 추적 불가 — "왜 그렇게 판단했나?"에 답 못함
  • ×
    페르소나가 한 명. 의향 분포·세그먼트 다양성·소수의견 시각화 불가
  • ×
    가격 곡선·CAC 추정·국가 우선순위 같은 정량 산출물 없음
  • ×
    임원진 자료로 쓸 PDF·차트 없음 — 매번 직접 정리해야 함

AI Market Twin

정부 통계 grounded 페르소나 200명 · 출처 추적 가능
  • 24개국 공식 통계 + 카테고리별 규제 (Bộ Y Tế · 厚生労働省 · 태국 FDA · UK CPSR 등) 실시간 반영
  • 모든 페르소나 발언이 출처 데이터 셀로 추적 가능 — 시뮬마다 사용된 통계 출처 PDF에 명시
  • 200명 페르소나의 의향 히스토그램·세그먼트별 거부 요인·소수 champions 가시화
  • 가격 대 전환율 곡선·국가별 CAC 추정·HIGH/MEDIUM/LOW 리스크 자동 분류
  • 한 번에 임원진용 PDF 자동 생성 (한국어·영어 다국어 지원)
Verifiable Accuracy

측정 가능한 정확도,
공개된 채점 기준

LLM hallucination을 줄이는 가장 확실한 방법은 외부 grounding과 자체 검증입니다. AI Market Twin은 6종 공공 데이터 anchor와 5-metric 자가 평가 파이프라인을 운영합니다.

6종 외부 grounding anchor

Hofstede 6차원 문화 지수
28개국 × Power Distance · Individualism · Uncertainty Avoidance 등 문화 차원 — 페르소나 의사결정 prior 보정
World Bank 거시 지표
GDP per capita PPP · 인구 · 가계 소비 — 가격 민감도와 시장 사이즈 추정의 base
UN Comtrade 무역 통계
HSCode별 한국→상대국 수출 흐름 — 카테고리별 기존 시장 관심도 정량화
관세청 수출 실적
data.go.kr 관세청 OpenAPI · 월별 / 10-digit HSCode 정밀도 (Comtrade 보완)
DART 전자공시
한국 상장기업의 연결 재무 + 지역별 매출 segment — 브랜드 실제 해외 매출 anchor
KOTRA 진출 한국기업
86개국 KOTRA 등록 한국법인 리스트 — 카테고리 일치 진출기업 신호로 브랜드 인지도 보정

5-metric 자가 평가 파이프라인

30%
top3Hit
시뮬 추천 top-3 시장이 실측 성과 ground truth top-3와 일치하는 비율
25%
rankCorrelation
시뮬 시장 순위와 실측 매출 순위의 Spearman 상관계수
20%
rejectRecall
실제로 진출하지 않은 시장을 시뮬도 거부했는지 (false-positive 회피)
15%
confidenceCalibration
STRONG / MODERATE / WEAK 신뢰도가 실제 정답률과 calibrated 되었는지
10%
trendMatch
예측한 시장 트렌드 방향성이 실측 데이터와 일치하는지
정직한 측정 원칙

위 5-metric은 오픈된 채점 로직으로 운영됩니다. 매 코드 변경마다 동일 product 세트 (다중 K-product 픽스처) 위에 자동 재측정되고, 결과는 paired t-test로 통계적 유의성까지 검증합니다. 측정-개선 사이클은 주간 단위로 운영됩니다.

모든 시뮬 결과는 사용된 grounding anchor와 점수 분해를 PDF에 명시합니다. 정확도 개선은 기존 가입자에게도 동일하게 자동 적용됩니다 — 신규 release마다 별도 업그레이드 비용 없습니다.

Pipeline

한 번의 시뮬레이션이 거치는 6단계

위저드 입력에서 PDF 출력까지 평균 5-7분. 각 단계마다 다른 LLM 모델이 최적의 역할을 수행합니다.

01 — VALIDATING

입력 검증 + 슬롯 계획

제품 정보를 검증하고 카테고리별 직업 풀에서 200개 페르소나 슬롯을 미리 배정합니다.

02 — REGULATORY

규제 적합성 사전 체크

후보국 각 카테고리별 판매 금지·라벨 규정을 검사. 진출 자체가 불가능한 시장은 자동 제외.

03 — PERSONAS

페르소나 풀 샘플링 + voice 생성

워크스페이스 풀에서 매칭되는 페르소나는 재사용, 새 슬롯만 신규 생성. 각 페르소나의 1인칭 인용(voice) 함께 생성.

04 — SCORING

국가별 우선순위 평가

200명 페르소나의 의향 분포·거부 요인·신뢰 신호를 집계해 국가별 수요·CAC·경쟁 강도 평가.

05 — PRICING

가격 곡선 (3-sample median)

3회 병렬 가격 시뮬레이션의 중앙값을 채택해 단일 호출의 변동성 제거. 시장별 가격 민감도 별도 산출.

06 — RECOMMEND

합성 + 자가 비평

비전 모델이 업로드된 크리에이티브를 함께 분석. 자가 비평 단계가 macro 일관성 (best-country 일치 등)을 자동 검증 후 결과 확정.

Try it

샘플 리포트로 실제 결과 확인

실제 K-푸드 5개국 진출 검증 시뮬레이션 결과 PDF — 회원가입 불필요, 즉시 다운로드.

샘플 리포트 다운로드 (PDF) 무료로 시작하기