설문조사 시 시장 현황을 반영한 응답자 구성 방법

Posted by

설문조사 시 시장 현황을 반영한 응답자 구성 방법


황희영 오픈서베이 대표이사
황희영
오픈서베이 대표이사
“20~59세 이동수단 이용자 2,000명 대상 조사를 하고 싶은데, 월 1회 이상 개인 이동수단 공유 서비스를 이용하는 사람이 200명 이상 포함되면 좋겠습니다.”

시장 전체 구성과 우리 기업의 주요 비즈니스 영역에 대한 데이터를 한 번에 확인하길 원할 때 기업들은 위와 같은 문의를 합니다. 전체 소비자(20~59세 이동수단 이용자 2,000명)를 대상으로 시장 전체 상황을 파악하는 동시에 집중해서 보고 싶은 하위 분석 단위(개인 이동수단 공유 서비스 이용자 200명)에 대한 최소 응답 수를 확보하길 원하기 때문입니다.

그럼 위 문의대로 개인 이동수단 공유 서비스 이용자 200명을 포함한 이동수단 이용자 2,000명으로 응답자를 구성해도 괜찮을까요? 그렇지 않습니다. 20~59세 이동수단 이용자 2,000명 중 월 1회 이상 개인 이동수단 공유 서비스를 사용하는 사람은 200명이나 되지 않기 때문입니다. 만약 문의 내용을 그대로 적용해서 응답자를 구성할 경우, 시장이 구성된 현황을 제대로 반영하지 않은 잘못된 데이터를 얻을 수 있습니다.
Market Map 분석 소개서 다운로드 버튼

설문조사, 응답자 구성에 따라 조사 결과가 달라질 수 있다

설문조사 시 위의 방식으로 응답자를 구성했을 때 생길 수 있는 오류에 대해 먼저 알아보겠습니다. 문의사항에 맞춰 개인 이동수단 공유 서비스 이용자를 200명까지 늘려서 전체 응답자를 구성하면, 전체 응답에 개인 이동수단 공유 서비스를 이용하는 사람들의 의견이 실제보다 많이 반영되기 때문입니다.

기업이 위와 같은 조사를 진행하는 이유는, 시장의 구성과 크기를 정량적으로 분석해서 새로운 비즈니스 기회를 발견하기 위함입니다. 이를테면 “모빌리티 시장은 이제 신차 판매 시장은 흔들리고 차량 공유 서비스가 더욱 확대될 것”이라는 데이터를 알고 싶을 때 이런 조사를 하는 겁니다.

이에 오픈서베이는 시장이 구성된 현황을 제대로 반영한 응답자 구성을 권장합니다. 응답자 구성에 따라서 조사 결과가 달라질 수도 있으니까요. 이번 글에서는 대표표본과 부스터 표본의 개념을 알아보면서 오픈서베이가 권장하는 시장 현황을 반영해 응답자를 구성하는 방법을 알아보겠습니다.

부스트 표본, 특정 하위 그룹 분석할 때 활용

먼저 좀 더 작은 단위인 ‘부스터 표본’의 개념에 대해 알아보겠습니다. 부스터 표본에 대해 알게 되면 전체 응답자 특성에 영향을 미치지 않으면서도 개인 이동수단 공유 서비스 이용자 200명을 모집할 수 있습니다. 먼저 아래 이미지를 함께 보겠습니다.

 부스터 표본은 본 설문 응답자에 포함된 개인 이동수단 공유 서비스 이용자 50명 이외에 추가로 모집한 150명을 의미합니다
부스터 표본은 본 설문 응답자에 포함된 개인 이동수단 공유 서비스 이용자 50명 이외에 추가로 모집한 150명을 의미합니다

학창 시절 수학 시간에 종종 보던 교집합과 비슷한 이미지입니다. 교집합에 대한 개념을 아직 기억하고 있다면 부스터 표본에 대해 쉽게 이해할 수 있을 겁니다. 전체 응답자인 2059 이동수단 이용자를 모집할 때 개인 이동수단 공유 서비스 이용자가 자연스럽게 포함될 수 있도록 하고, 부족한 인원에 대해서만 따로 모집하는 겁니다.

그럼 본 설문에서는 이동수단 이용자 2,000명 대상으로 수집한 응답을 기준으로 데이터를 분석하고, 개인 이동수단 공유 서비스에 대한 데이터를 분석할 때는 전체 응답자에 포함된 50명과 따로 모집한 150명을 합친 200명의 응답 데이터를 분석하는 겁니다. 이렇게 응답 대상자 중 특정 하위 그룹을 별도 분석을 위해 추가로 모은 응답자를 ‘부스터 표본(Boost Sample)’이라고 부릅니다.

설문조사, 응답자를 골고루 균등하게 구성하는 게 늘 좋지는 않다

그럼 별도 분석을 위해 추가로 모은 부스터 표본이 아닌 본 응답자에 해당하는 2059 이동수단 이용자 2,000명은 어떤 사람으로 구성해야 할까요? 이번 단락에서 ‘대표표본’의 개념에 대해 알아보겠습니다.

2059 이동수단 이용자 2,000명을 구성하는 가장 쉬운 방법은 성별·연령별로 응답자를 균등하게 할당해서 모집하는 겁니다. 그럼 20대 남성, 20대 여성, 30대 남성, 30대 여성, 40대 남성, 40대 여성, 50대 남성, 50대 여성으로 나뉜 총 8개의 그룹에 각 250명의 응답자가 구성되죠.

물론, 이렇게 응답자를 성별·연령별로 균등할당해서 진행하는 설문조사는 사실 꽤 많은 편입니다. 특히 사람들의 일반적인 인식에 대한 조사일 경우, 성별·연령별로 고르게 응답자를 구성하는 것도 효과적일 때가 있기 때문입니다.

하지만 모빌리티 시장의 구성과 크기를 알아보기 위한 이번 조사는 좀 다릅니다. 모빌리티 시장은 성별·연령별로 이용자 비율 차이가 꽤 많이 나기 때문입니다. 20대 여성과 40대 남성의 본인 소유 자동차 이용률이 서로 비슷하기 힘들겠죠. 이에 이런 경우는 응답자를 기계적으로 균등할당하기보다 시장 현황을 반영해서 대표표본을 구성하는 게 효과적입니다.

 딱 떨어지는 숫자는 아름다워 보이지만, 시장 현황을 반영한 구성이라 보긴 힘듭니다
딱 떨어지는 숫자는 아름다워 보이지만, 시장 현황을 반영한 구성이라 보긴 힘듭니다

대표표본, 시장현황 반영한 응답자 구성법

그럼 대표표본은 어떻게 구성할 수 있을까요? 사실 리서치 회사의 실무자가 아니라면 구체적인 방법에 대해 꼭 알아야 하지는 않습니다. 조사 의뢰를 할 때 “응답자는 대표표본으로 구성해달라”고 하면 되니까요. 하지만 그 방법에 대해 조금이라도 알아둔다면 소비자 조사에 대해 더욱 풍부하게 이해하고 소비자 데이터를 활용할 수 있습니다.

오픈서베이는 우리나라 인구 구성 비율에 맞춘 응답자를 대상으로 스크리닝 조사를 진행합니다. 전 국민을 대상으로 응답 대상자에 해당하는 사람이 얼마나 되는지를 설문조사를 통해 직접 찾아보는 거죠. 이를 스크리닝 조사라고 합니다. 대표표본을 구성하기 위해 본 조사 전 진행하는 사전 조사를 진행한다고 보면 좋습니다.

위 방법을 이번 사례에 적용해봅시다. 먼저, 우리나라 인구 구성 비율에 맞춘 20~59세 남녀를 대상으로 차량 보유 여부를 묻는 스크리닝 조사를 진행합니다. 스크리닝 조사의 대상자는 많으면 많을수록 좋습니다. 응답자 수가 많아질수록 우리나라 20~59세 남녀 차량 보유자 실제 데이터와 더욱 유사해질 테니까요.

하지만 조사 대상이 많아질수록 조건에 맞는 응답자를 찾는 데 시간이 오래 걸리고 비용이 늘어납니다. 이에 오픈서베이는 적정한 수준을 맞춰 1만 명의 응답자를 대상으로 스크리닝 조사를 진행했습니다.

 스크리닝 설문 응답자 1만 명은 우리나라 인구 비례에 맞춰서 구성합니다
스크리닝 설문 응답자 1만 명은 우리나라 인구 비례에 맞춰서 구성합니다

이를 통해 모빌리티 시장 소비자의 성별·연령별 비율이 제대로 반영된 응답자 구성비를 얻을 수 있고, 이 비율을 본 설문 응답자 2,000명 적용해서 대표표본을 구성할 수 있습니다.

스크리너로 파악된 성별·연령별 비율을 본 설문 응답자 구성에 적용합니다

그럼 아래 이미지를 통해 처음에 성별·연령별로 250명씩 구성한 응답자와 대표표본으로 구성한 응답자를 한 번 비교해보겠습니다. 각 그룹별 인원이 상당히 다르다는 게 한눈에 들어옵니다. 특히 20대 여성은 처음에 구성한 250명에서 45명으로 굉장히 큰 차이가 나죠. 이를 고려하지 않고 조사를 진행했다면 시장 현황이 제대로 반영되지 않은 잘못된 데이터를 얻었을 겁니다.

 오픈서베이의 응답자 구성 방법이라면 성별·연령별 비율이 이렇게나 달라집니다
오픈서베이의 응답자 구성 방법이라면 성별·연령별 비율이 이렇게나 달라집니다

스크리너 통한 대표표본 구성, 정확할까

오픈서베이의 스크리닝 설문을 활용한 대표표본 구성은 과연 정확할까요? 사실 모빌리티 시장을 예시로 든 이유는 여기에 있습니다. 자동차 시장은 여타 시장과 달리 이용자와 관련한 아주 정확한 2차 자료가 존재합니다. 바로 국토교통부의 ‘전국 자동차 등록 통계’입니다. 이를 통해 오픈서베이가 구성한 대표표본과 실제 통계를 비교해서 얼마나 정확도가 높은지 검증할 수 있죠.

아래 이미지를 함께 살펴보겠습니다. 2019년 6월 전국 자동차 등록 통계를 보면 국내 자동차 보유자는 약 1,500만 명쯤으로 나옵니다. 이들의 성별·연령별 구성을 오픈서베이가 구성한 대표표본과 비교해봤는데 전반적으로는 매우 유사하게 나타납니다.

 도시 거주자 특성이 좀 더 반영되지만 전반적으로 실제 자동차 등록 통계와 유사하게 나타납니다
도시 거주자 특성이 좀 더 반영되지만 전반적으로 실제 자동차 등록 통계와 유사하게 나타납니다

다른 점이라면 오픈서베이의 조사 결과에선 20대에 가까울수록 차량 보유 비율이 높게 나타난다는 겁니다. 실제 통계에서는 고연령대의 비율이 좀 더 높은데 말이죠. 이런 차이가 발생한 이유는 오픈서베이 패널 구성에서 도시 거주자 비율이 높게 나타나기 때문입니다. 이에 대도시 특성이 더욱 잘 반영된 서울의 자동차 등록 통계는 오픈서베이 데이터와 좀 더 비슷합니다.

그럼 도시 특성이 좀 더 반영된 응답자 구성을 그대로 활용해도 될까라는 물음이 남습니다. 이는 설문 주제에 따라 답이 달라질 수 있는데, 모빌리티 시장에서 새로운 기회를 찾기 위한 본 조사의 경우는 충분히 가능합니다.

모빌리티 시장의 새로운 변화는 대도시를 중심으로 일어나기 때문입니다. 생각해보면 킥고잉 등 개인 모빌리티 공유 서비스도 수도권을 벗어나면 쉽게 찾아보기 힘듭니다. 이에 새롭게 변화하는 시장에 대해 알아보고 싶다면 오픈서베이가 모바일 설문조사를 통해 구성한 응답자를 기준으로 설문조사를 해도 무방하다고 볼 수 있습니다.

| 마치며

본 콘텐츠는 오픈서베이가 지난 10월 마켓맵 조사를 주제로 진행한 월간 세미나 발표 내용입니다.

마켓맵 조사란 소비자 조사를 통해 시장의 구성과 크기를 정량적으로 분석하는 방법입니다. 주로 이용자 시각에서 시장을 세분화해서 새로운 비즈니스 기회를 발견할 때 혹은 2차 자료와 이용자 조사 결과를 결합해 시장 규모를 정량화할 때 마켓맵조사를 활용합니다.

이러한 마켓맵 조사를 통해 정확한 시장 분석 데이터를 얻기 위해서는 시장 현황을 정확히 반영한 응답자 구성 단계가 반드시 필요합니다. 이에 본 콘텐츠는 마켓맵 조사를 위해 오픈서베이가 어떻게 응답자를 구성하는지를 집중적으로 소개합니다.

아티클을 읽으며 오픈서베이 마켓맵 조사 소개서가 궁금해진 분은 아래 ‘마켓맵 조사 소개서 다운로드’ 버튼을 눌러 전체 내용을 확인해 주세요. 🙂

Market Map 분석 소개서 미리보기
Market Map 분석 소개서 다운로드 버튼