AI가 만든 응답자, 믿어도 될까? 합성패널, 합성소비자 제대로 알고 쓰기

최근 리서치 업계에서 가장 뜨거운 키워드는 단연 합성패널(Synthetic Panel) 혹은 합성소비자(Synthetic consumer)입니다. 하지만 AI가 만든 응답을 믿을 수 있을지에 대한 의문은 여전히 실무자들의 발목을 잡곤 합니다. 오픈서베이는 지난 4월, 웨비나 세션을 통해 실무자들이 가장 많이 던지는 질문들—’신뢰할 수 있나요?’, ‘어디에 써야 하나요?’, ‘비용과 시간 절감 외에 다른 이점은 무엇인가요?’—을 중심으로 합성패널의 정의부터 한계, 그리고 오픈서베이가 직접 만들며 겪은 시행착오까지 솔직하게 공유했습니다. 이번 글에서는 합성패널의 개념, 신뢰도 검증 지표, 그리고 실제 실험을 통해 얻은 인사이트를 중심으로 웨비나 핵심 내용을 정리합니다. 합성패널을 실무에 제대로 활용하고 싶다면, 지금 바로 아티클에서 확인해보세요.
리서치를 가장 잘 아는 AI를 직접 경험해보고 싶다면, 아래 버튼을 눌러 데이터스페이스를 무료로 시작해보세요. 내가 담당하고 있는 제품이나 나의 고객, 혹은 그냥 최근의 비즈니스 고민을 말하면, 전문가가 일하는 방식 그대로 비즈니스 고민을 구조화하고 이를 해결할 방법을 차근차근 설계하여 답을 찾을 수 있게 도와드립니다.

데이터스페이스 무료로 시작하기

합성패널을 향한 기대와 우려, 실무자들은 어떻게 생각할까

2026년 들어 오픈서베이에 합성패널 관련 문의가 눈에 띄게 늘었습니다. 단순히 ‘이런 게 있다더라’는 수준을 넘어 “어느 카테고리에 쓸 수 있나요?”, “신뢰할 수 있나요?”처럼 구체적인 질문들이 들어오기 시작했습니다. 웨비나 등록자를 대상으로 사전 설문을 진행한 결과, 합성패널 인지도는 55.8%였지만 실제 이용 경험은 10% 미만에 그친 것을 확인했습니다.

합성패널을 써보고 싶은 이유로는 ‘더 빠른 리서치’와 ‘비용 절감’이 각각 약 50%로 가장 높게 꼽혔습니다. 반면 우려하는 이유로는 ‘실제 응답과의 유사도를 신뢰하기 어렵다’, ‘응답 편향·대표성이 우려된다’ 등 신뢰도 관련 항목이 압도적으로 높았습니다. 아직은 인지하기 시작한 단계지만, 기대와 우려가 공존하는 상황이라고 볼 수 있습니다.

Research with AI 웨비나 | 합성패널, 제대로 알아야 기대만큼 쓴다 (p.13)

합성데이터, 합성패널, 합성소비자? 용어부터 정리하기

시장에는 비슷한 듯 다른 용어들이 혼용되고 있습니다. Synthetic Data, Synthetic Panel, Synthetic Persona, Simulated User, Digital Twin 등 다양한 표현이 쓰이는데, 오픈서베이는 이를 두 가지 기준으로 정리했습니다.

첫 번째 기준은 데이터 생성 단위입니다. 전체 시장을 하나로 집계한 Aggregated Insights, 특정 그룹이나 세그먼트 단위로 생성하는 Group/Segment-level, 그리고 응답자 한 명 한 명의 개별 데이터를 만드는 Individual-level로 나뉩니다. 두 번째 기준은 제공하는 정보 형태입니다. 수치로 표현 가능한 정량적 정보냐, 성향이나 동기 같은 정성적 정보냐의 구분입니다. 이 두 가지 기준을 교차하면 시장에서 혼용되는 다양한 용어들이 어디에 속하는지 훨씬 명확하게 파악할 수 있습니다.

Aggregated Insights · 합성 페르소나, 무엇이 다를까

분류 기준을 이해했다면 각 유형이 실제로 어떻게 다른지 살펴볼 차례입니다. Aggregated Insights는 인터뷰 스크립트, 설문 데이터, 보고서 등 다양한 소스에서 비정형 텍스트 데이터를 추출해 LLM이 요약·추론한 결과물입니다. 오픈서베이의 ‘Ask AI’ 기능이 여기에 해당하며, 현재 베타로 제공 중입니다.

Research with AI 웨비나 | 데이터스페이스 Ask AI 화면

Group/Segment-level에 속하는 합성 페르소나는 특정 타겟 세그먼트의 심리적·인구통계학적 특성을 대표하는 AI 기반 가상 인물을 설정하고, 그 인물과 인터뷰하거나 정량 설문을 진행하는 방식으로 실제 수집한 소비자 데이터를 기반으로 페르소나를 만드는 것이 핵심입니다. Individual-level에 속하는 합성패널은 과거 데이터를 기반으로 새로운 질문에 대해 개별 응답자 수준의 응답 데이터셋을 생성하는 방식입니다. 한편 특정 실존 인물을 정확하게 복제하는 Digital Twin은 개인정보 보호 측면의 취약성 때문에 리서치 목적으로는 지양하고 있습니다.

합성패널 신뢰도, 무엇으로 판단해야 할까

합성패널을 둘러싼 가장 큰 질문은 결국 “신뢰할 수 있는가”입니다. 오픈서베이는 합성데이터와 합성패널의 신뢰도를 판단하는 기준으로 충실도, 유용성, 개인정보보호를 제시합니다. 충실도는 합성 데이터가 원본 데이터의 분포를 얼마나 잘 따르는지, 유용성은 실제 비즈니스 의사결정에 도움이 되는지, 개인정보보호는 개인의 정보를 그대로 복제하지 않았는지를 의미합니다. 이 세 가지 기준은 합성패널을 단순한 AI 응답 생성 기능이 아니라, 리서치 방법론으로 평가하기 위한 최소 조건입니다.

Research with AI 웨비나 | 합성패널, 제대로 알아야 기대만큼 쓴다 (p.27)

그런데 LLM만으로는 이 세 가지를 동시에 충족하는 합성패널을 만들기 어렵습니다. 그 이유는 첫째, 분산 붕괴(Variance Collapse)입니다. LLM은 평균적인 사람은 그럴듯하게 만들 수 있지만, 실제 인간 집단 안에 존재하는 다양한 응답 패턴을 심각하게 과소 재현합니다. 둘째, 정렬로 인한 사회적 바람직성 편향(Social Desirability Bias)입니다. 최신 LLM일수록 극단적이지 않고 올바른 답을 내는 경향이 있어, 실제보다 사회적으로 바람직한 응답이 과대 표현됩니다. 셋째, 대표성 부재(Lack of Representativeness)입니다. LLM 학습 데이터는 서구권·고학력층 편향이 있어 특정 집단의 목소리가 왜곡되거나 지워질 수 있습니다. 넷째, 모델 재현성(Reproducibility) 문제입니다. OpenAI나 Anthropic 같은 기업이 모델 업데이트 시 동일한 프롬프트에도 결과가 달라져, 학술 연구의 핵심인 재현성을 어렵게 만듭니다.

따라서 신뢰할 수 있는 합성패널을 만들기 위해서는 두 가지가 함께 필요합니다. 하나는 새로운 질문에 답하는 데 관련성이 높고 대표성이 보장되는 데이터입니다. 다른 하나는 LLM의 한계를 보완하고 실제 응답의 분산을 재현할 수 있는 예측 엔진입니다. 단순히 많은 데이터를 넣는다고 좋은 결과가 나오는 것이 아니라, 질문에 필요한 데이터를 선별하고 실제 소비자 행동과 의향에 영향을 주는 변수를 모델링하는 것이 중요합니다.

합성패널은 대체재가 아니라, 리서치를 더 쉽게 쓰게 만드는 기반

이번 세션의 핵심 메시지는 분명합니다. 합성패널은 아직 개념, 활용 방법, 평가 지표가 모두 정의되어가는 중인 영역입니다. 오픈서베이도, 기업도 더 많은 탐색과 실험이 필요합니다. 합성패널 결과에 99%의 정확도를 기대하기보다, 80%의 정확도로도 충분히 활용할 수 있는 use case를 찾는 것이 더 현실적인 접근입니다.

Research with AI 웨비나 | 합성패널, 제대로 알아야 기대만큼 쓴다 (p.42)

오픈서베이가 그리는 합성패널의 방향은 단순한 LLM Wrapper가 아닙니다. 실제 데이터에 기반하여 비즈니스 의사결정을 연결하는 구조입니다. 실제 프로필, 태도, 가치관, 행동 데이터를 기반으로 예측 모델을 만들고, LLM의 대화형·추론 역량을 결합해 의사결정을 시뮬레이션할 수 있는 기반을 제공하는 것입니다.

이 구조가 기업의 소비자 조사에서에서 의미 있는 이유는 명확합니다. 기업은 매번 모든 아이디어를 실제 소비자에게 검증하기 어렵습니다. 수많은 아이디어 가운데 안 될 가능성이 높은 것은 빠르게 걸러내고, 가능성이 있는 후보에 리소스를 집중해야 합니다. 합성패널은 이 초기 선별 단계에서 시간과 비용을 줄이는 도구가 될 수 있습니다. 단, 최종 검증은 실제 고객과 실제 소비자를 대상으로 탄탄하게 진행되어야 합니다.

또한 테스트를 통해 축적된 데이터는 다음 테스트 결과를 합성하는 재료가 될 수 있습니다. 즉, 합성패널은 한 번 쓰고 끝나는 도구가 아니라, 기업이 보유한 고객 데이터와 리서치 데이터를 자산화할수록 더 정교해지는 기반이 될 수 있습니다. 기업이 어떤 데이터를 축적하고, 어떤 속성을 관리하느냐에 따라 목적에 맞는 커스텀 합성패널의 활용 가능성도 커집니다.

효율을 넘어 성과로, 데이터스페이스와 함께하는 리서치 혁신

본 콘텐츠는 오픈서베이가 2026년 4월 진행한 <Research with AI 웨비나 | 합성패널, 제대로 알아야 기대만큼 쓴다>내용을 바탕으로 제작했습니다.
Research with AI 웨비나 시리즈는 리서치 AX가 가져온 변화와 각 단계별 AI 활용법, 그리고 오픈서베이가 직접 시도하며 얻은 경험과 팁을 상세히 공유합니다. AI가 반복적인 작업을 자동화함에 따라 리서처는 협업과 의사결정 같은 더 가치 있는 일에 집중할 수 있으며, 이번 웨비나 시리즈에서는 이러한 변화를 위협이 아닌 기회로 바꾸기 위한 여정을 함께 만들어갑니다.

리서치를 가장 잘 아는 AI를 직접 경험해보고 싶다면, 아래 버튼을 눌러 데이터스페이스를 무료로 시작해보세요. 내가 담당하고 있는 제품이나 나의 고객, 혹은 그냥 최근의 비즈니스 고민을 말하면, 전문가가 일하는 방식 그대로 비즈니스 고민을 구조화하고 이를 해결할 방법을 차근차근 설계하여 답을 찾을 수 있게 도와드립니다.

데이터스페이스 무료로 시작하기

회원가입 시 AI 크레딧 200개가 제공됩니다🎁

오픈서베이 소개

Opensurvey는 AI 리서치 테크 기업입니다. 리서치 기획부터 데이터 수집, 분석까지 전 과정을 AI로 연결하며, 플랫폼과 리서치 전문가 서비스, 소비자 패널을 함께 보유하고 있습니다. 삼성전자, P&G, CJ제일제당, 우아한형제들 등 시대를 이끄는 기업들과 함께하며, 지난 14년간 3,000여 기업 고객과 25,000개 프로젝트를 수행해 왔습니다. ISMS-P, ISO/IEC 27001·27701, ISO 20252 인증과 ESOMAR 정회원 자격을 통해 보안과 리서치 품질 모두 국제 기준을 충족합니다.

👉 오픈서베이 서비스 문의하기

데이터스페이스 소개

데이터스페이스는 오픈서베이가 제공하는 AI 기반 컨슈머 인텔리전스 플랫폼입니다. 리서치 맥락을 이해하는 오케스트레이터와 단계별 전문 에이전트가 기획부터 데이터 수집, 분석, 인사이트 보고, 공유까지 리서치 전 과정을 함께 합니다. 통계 연산과 AI 추론을 분리한 Dual Layer 구조로 분석의 정확도를 확보하며, 모든 인사이트에는 실제 소비자 응답에 기반한 근거가 함께 제시됩니다.

한국을 포함한 20개국 소비자 패널과 연결할 수 있고, 자사 고객을 대상으로 직접 데이터를 수집하거나 CRM 등 외부 플랫폼과 연동하는 API도 제공됩니다. 데이터스페이스에 축적된 소비자 데이터와 리서치 맥락은 기업의 인텔리전스 자산으로 남습니다. 이를 기반으로 자사 브랜드에 특화된 합성 소비자를 구축해 대화를 나누고 시장 반응을 예측할 수도 있습니다.

곽지은 Olive

오픈서베이 그로스 마케팅 매니저

황희영 HY

오픈서베이 CEO

AI가 만든 응답자, 믿어도 될까? 합성패널, 합성소비자 제대로 알고 쓰기

합성패널을 향한 기대와 우려, 실무자들은 어떻게 생각할까

합성데이터, 합성패널, 합성소비자? 용어부터 정리하기

Aggregated Insights · 합성 페르소나, 무엇이 다를까

합성패널 신뢰도, 무엇으로 판단해야 할까

합성패널은 대체재가 아니라, 리서치를 더 쉽게 쓰게 만드는 기반

효율을 넘어 성과로, 데이터스페이스와 함께하는 리서치 혁신

곽지은 Olive

황희영 HY

DS AI 론치

AI가 리서치를 대신할 때 나는 무엇을 해야할까? — 리서처의 일과 역할 재정의

Research with AI｜AI가 리서치를 하면, 나는 무엇을 해야할까? 리서치, 리서치팀, 리서처의 역할 재정의

리서치를 하지 않고도 답을 얻는 경험 — Dataspace AI가 바꾼 것들