챗GPT로 VoC 데이터 분석하는 방법

VoC(Voice of Customer)는 정량 데이터만으로는 알 수 없는 고객의 진짜 경험과 생각을 담고 있습니다. 기업은 VoC 데이터를 분석해 고객 경험을 개선하고, 제품과 서비스의 경쟁력을 높일 기회를 발견할 수 있습니다.

그런데 VoC 데이터는 방대한 양과 텍스트 형태라는 특성 때문에 분석이 쉽지 않습니다. 많은 기업이 VoC 분석의 중요성에 공감하면서도 효과적으로 활용하지 못하는 이유입니다. 이번 글에서는 VoC 데이터를 분석하는 프로세스와 AI를 분석에 활용하는 방법을 소개합니다.

오픈서베이 데이터스페이스는 텍스트 분석 AI 기능으로 VoC 데이터 분석을 자동화했습니다. 아래 버튼을 눌러 데이터스페이스를 무료로 체험해 보세요.

*이 아티클은 지난 12월 10일 오픈서베이가 진행한 Data on Fire 써밋에서 전예리 오픈서베이 프로덕트 매니저가 진행한 <워크샵 -> 내용 일부를 요약한 것입니다. 

VoC 데이터 분석 프로세스는 크게 3단계입니다. 먼저 1)샘플 데이터에서 핵심 주제를 추출하고, 2)개별 VoC와 주제를 매칭하여 데이터를 셀 수 있는 형태로 정형화한 다음, 3)정량화 및 시각화하는 겁니다. 

VoC 데이터 분석, AI, 챗GPT

1) 핵심 주제 추출

수집한 VoC 데이터 중 일부 데이터를 활용해 주제를 추출합니다. VoC를 2,000건 수집했다면 대개 100~200건 정도를 샘플로 살펴보기를 권장합니다.

  • 예: OTT 서비스별 만족스러운 점에 대한 주관식 응답에서 “다양한 콘텐츠”, “좋은 사용성”, “비싼 이용료” 등의 주제 추출

2) 개별 VoC와 주제 매칭

주제 리스트가 만들어졌다면 모든 개별 VoC 응답에 주제를 매칭합니다. 매칭 과정에서 새로운 주제가 추가될 수 있으며, 한 개의 VoC에 매칭되는 주제는 최대 3개를 권장합니다. 

  • 예: “비싸지만 최신 콘텐츠가 많아서 좋음” → ‘비싼 이용료’, ‘최신 콘텐츠’ 2가지 주제 매칭

3) 정량화

모든 VoC를 1~3개의 주제와 매칭했다면, 각 주제가 얼마나 등장했는지 빈도를 분석함으로써 VoC 데이터를 정량화합니다. 이를 기반으로 차트 형태로 결과를 시각화할 수 있습니다. 

그런데 많은 기업이 VoC 데이터의 중요성에는 공감하면서도 실제 분석 및 활용에는 어려움을 겪습니다. 그 이유는 크게 3가지를 꼽을 수 있습니다. 

  • 늘어나는 데이터 양: 고객 접점이 다양해지며 VoC를 수집하는 채널이 늘었고, 수천 명에게 동시에 설문조사를 실시하는 것도 더 이상 어려운 일이 아닙니다. 다양한 채널에서 대량으로 수집되는 수만 건 이상의 VoC를 사람이 하나하나 읽어보고 주제를 분류하기는 사실상 불가능합니다. 
  • 분류 기준의 일관성 유지 어려움: 사람이 직접 주제를 분류한다 해도 분류 기준의 일관성을 유지하기가 어렵습니다. 수천수만 건의 VoC 데이터를 분류하는 과정에서 오류가 발생할 여지가 있죠. 여러 명이 함께 작업할 경우 각 담당자의 판단에 따라 유사한 VoC가 다른 주제로 분류될 가능성도 있습니다.  
  • 정보 손실 위험성: 텍스트 데이터를 정형화하는 과정에서 필연적으로 VoC에 포함된 구체적인 맥락이 제거될 가능성이 있습니다. 

VoC 데이터 분석의 어려움을 해결하기 위해서는 방대한 데이터를 빠르고 일관성 있게 처리하는 기술적 지원이 필요합니다. ChatGPT를 활용하면 사람이 반복해야 하던 작업을 빠르고 일관성 있게 처리할 수 있습니다. 다만, 효과적인 결과를 얻기 위해서는 적절한 프롬프트 입력이 필요합니다. 

VoC 분석 정확도를 높이는 GPT 프롬프트 작성법

(1) 결과 예시 제공하기 

GPT에 분석 요청 시 데이터와 원하는 분석 결과의 예시를 함께 제공하면 분석의 정확도가 크게 향상됩니다. 예를 들면 아래와 같이 입력할 수 있습니다. 

  • 수집한 Voc 데이터에서 적절한 주제를 추출해줘
  • 각 주제는 5음절 이하, 형용사+명사 혹은 형용사 형식이어야 해
    • VoC : [백화점 매장이 넓어서 좋지만 주차 공간은 부족하다]
    • 주제 : [넓은 매장, 부족한 주차 공간]
VoC 분석, AI, 챗GPT

(2) 명령 수행 순서를 정해주기

GPT는 작업을 수행하는 순서를 정해줄 때 더 뛰어난 결과를 보여줍니다. 예를 들어, 다음과 같은 순서로 요청합니다.

  • VoC 데이터에서 주요 주제를 추출해 줘
  • 개별 VoC에 대해 추출한 주제를 매칭해 줘
  • 개별 VoC에 적절한 주제가 매칭이 되지 않는다면, 주제를 새롭게 생성해
  • 매칭한 주제에 대한 빈도를 계산해 줘
  • 주제별 빈도를 테이블로 만들어 줘
VoC 분석, AI, 챗GPT, 데이터 분석

GPT를 활용하면 VoC 데이터 분석에서 발생하는 기존의 어려움을 해결할 수 있습니다. 대량의 데이터를 동일한 기준으로 빠르게 처리합니다. 정형화 과정에서 발생하는 정보 손실을 보완하기 위해 대표 VoC를 추출하고 요약하게 하면 핵심 내용을 빠르게 파악할 수 있습니다.

AI를 활용하면 VoC 데이터를 효율적으로 분석할 수 있지만, 프롬프트 작성은 여전히 번거롭고 난이도가 있는 일입니다. 오픈서베이 데이터스페이스는 AI를 활용한 VoC 분석 과정을 자동화하여, 누구나 클릭 몇 번이면 손쉽게 VoC 분석 결과를 받아볼 수 있습니다.

데이터스페이스의 AI 텍스트 분석 기능은 오픈서베이가 축적해온 VoC 데이터와 분석 노하우를 학습 데이터로 활용해 개발한 독자적인 솔루션입니다. 데이터스페이스에서 VoC 데이터 분석이 이루어지는 과정은 다음과 같습니다.  

  1. 주제 추출: AI가 VoC 데이터를 처리해 주요 주제를 추출합니다.
  2. 데이터 분류: 개별 VoC 데이터를 추출한 주제와 매칭합니다. 이때 주제의 가짓수가 너무 많아지지 않도록 밀도 기반 클러스터링 알고리즘(HDBSCAN)을 활용해 유사 주제들을 통합하여 적절한 수준을 유지합니다.
  3. 대표 VOC 추출: 각 주제를 가장 잘 대표할 수 있는 VoC를 추출합니다.
  4. 결과 요약: 주제별 대표 VoC를 기반으로 응답을 요약합니다. 
VoC 분석, AI, 챗GPT, 데이터 분석

오픈서베이 데이터스페이스의 텍스트 분석 AI는 2024년 5월 출시 후 약 7개월 만에 약 40만 건의 VoC 데이터를 처리했습니다. 오픈서베이는 VoC 분석 결과의 신뢰성을 높이기 위해, 텍스트 분석 AI 기능의 정확도와 적합성을 지속적으로 평가하여 프롬프트와 알고리즘을 개선해 나가고 있습니다. 

VoC 데이터 분석, AI, 데이터스페이스

VoC 데이터는 고객과의 접점에서 얻을 수 있는 중요한 자산입니다. 고객이 직접 남긴 피드백에서 고객 경험을 개선하고 제품/서비스의 경쟁력을 강화할 기회를 발견할 수 있습니다. 하지만 VoC 데이터를 잘 활용하기 위해서는 방대한 데이터를 체계적으로 관리하고 분석할 수 있는 기술적 기반이 필요합니다. 

오픈서베이 데이터스페이스는 AI 기술로 VoC 데이터 분석을 자동화함으로써 기업이 빠르고 정확하게 고객의 목소리를 읽고 실행 가능한 인사이트를 도출할 수 있도록 돕습니다. 지금 바로 아래 버튼을 눌러 오픈서베이 데이터스페이스 소개서를 다운로드하거나 무료 체험을 신청해 보세요.

오픈서베이 콘텐츠 마케팅 매니저

전예리 Alex

오픈서베이 프로덕트 매니저