인터넷 쇼핑몰 니즈 분석 시스템의 설계 및 구현

A Design and Implementation of Needs Analysis System in Internet Shopping Mall

  • cc icon
  • ABSTRACT

    온라인에서 제품을 고르고 실질적인 구매는 오프라인에서 이루어지는 역 쇼루밍이 급격히 늘고 있다. 역 쇼루밍이 늘고 있다는 것은 이미지와 설명을 기반으로 한 인터넷 쇼핑몰의 사용자 분석에 한계가 있음을 의미한다. 따라서 대형 온라인 쇼핑몰은 고객 맞춤형 쇼핑정보를 제공하고 있으나, 단순히 고객이 검색하거나 구매한 상품을 나열하여 제공하여 준다. 따라서 사용자의 다양한 요구를 분석하고 적용할 수 있는 온라인 쇼핑몰이 필요하다. 본 논문에서는 새로운 니즈분석 시스템을 제안한다. 제안된 시스템은 사용자 정의 모듈과 후기 분석 모듈로 구성되어 있다. 전자는 두 개의 상품을 지정하고 개인별 사용자 선호도를 수집하며, 후자는 저장된 데이터베이스 사전을 이용하여 구매 상품의 후기를 분석한다. 구현된 시스템은 개별 사용자의 요구를 충족하는 상품을 추천할 수 있음을 보였다.


    Even though users choose goods they want to buy in on-line shopping malls, real purchase is often performed in off-line shopping malls. It is called reverse showrooming. It means that users’ analysis of goods based on images and description of internet shopping malls has limitation. Thus, large-scale online shopping malls provide a customized shopping information. However, in that case, the provided information is a simple list of goods users bought or retrieved. Thus, a system to analyze various needs of users and apply the result into on-line shopping mall is necessary. In this paper, an analysis system is proposed. The system contains a module to analyze user defined preference and a module to analyze users’ reviews. The former designates two goods and collects preferences of individual users. the latter analyzes reviews about purchased goods based on database dictionary stored in advance for analyzing reviews. The system implemented shows that it is possible to recommend some goods that meet each users’s needs

  • KEYWORD

    니즈분석 , 모바일 시스템 , 사용자 지정 선호도 , 데이터베이스 사전

  • Ⅰ. 서 론

    최근 오프라인 매장에서는 상품의 품질을 보고 가격을 온라인과 비교 후 온라인이 더 저렴할 경우 할인된 가격에 구입을 하는 것이다. 이를 가리켜 ‘쇼루밍족’ 이라한다[1]. 더군다나 쇼루밍족과는 반대의 형태인 상품의 탐색은 온라인에서하고, 구매는 오프라인에서 하는 “역쇼루밍족” 도 증가하는 추세이다. 역 쇼루밍족의 증가는 온라인 쇼핑몰에서 제공하는 상품정보(이미지 및 설명) 만을 이용하여 상품을 구매하는 것은 위험 부담이 있음을 의미한다. 따라서 고객에게 상품분석 정보 및 타인의 선호도와 같은 다양한 정보를 온라인에서 제공하는 것이 온라인 쇼핑몰의 경쟁력을 높이는 길이다.

    한편, 대규모 인터넷 쇼핑몰은 고객 맞춤형 쇼핑정보를 제공하고 있다. 그러나 대다수의 쇼핑몰들은 고객이 구매하거나, 보았던 상품을 단순히 나열하는 것에 그치고 있다. 따라서 이러한 문제를 해결하고자 본 논문에서는 고객의 니즈분석을 제안하고 모바일 쇼핑몰에 적용한다.

    상품을 구매하고자 하는 사용자가 선택한 두 가지 상품에 대해 개인 및 특정 그룹(연령별, 성별)의 선호도를 분석 할 수 있는 시스템을 고안하여 의사결정을 지원하여 주며, 해당 상품에 대한 타인의 반응을 쉽게 볼 수 있도록 하여 댓글 작성자가 아닌 타인도 해당 상품에 대한 선호도를 손쉽게 획득 할 수 있도록 하였다.

    이를 통하여 개개인의 선호도를 파악하고 선호도에 따라 맞춤상품을 추천할 수 있도록 한다. 구현결과 사용자 지정 선호도 분석 시스템을 이용하여 두 가지 상품을 손쉽게 비교할 수 있었고, 니즈분석 모듈을 이용하여 상품에 대한 개인 및 그룹의 선호도를 수치화하여 활용할 수 있었다.

    이 논문의 구성은 다음과 같다. 2장에서 사용자들의 소비패턴과 자연어 분석에 대한 관련 연구와 문제점들을 살펴본다. 3장에서 고안된 시스템의 전체 구조 및 각 모듈에 대하여 설명하고, 사용자들의 후기를 분석하기 위해 구축된 데이터베이스 사전과 카테고리 분류에 대하여 알아본다. 그리고 사용자 지정 선호도 분석 시스템에 대하여 설명한다. 4장에서는 제안한 시스템의 구현결과를 살펴보고, 끝으로 5장에서 결론을 맺는다.

    Ⅱ. 관련연구

    관련연구 [2] 에서는 데이터마이닝 기법을 이용한 인터넷 쇼핑몰 고객의 구매패턴 식별에 관한 연구로서 오프라인의 상품 구매 데이터에서 고객의 구매패턴을 찾아 연관성 있는 제품을 선정한 후, 수집된 고객들의 구매 정보(로그 데이터)를 기반으로 선별된 고객의 구매패턴과 비교하여 고객의 쇼핑패턴을 분석하였다.

    관련연구 [3, 4]에서는 온라인 쇼핑몰에서의 제품 구매 후기와 배송 서비스의 질에 따라 사용자에게 미치는 영향에 대해 언급하고 있었다.

    본 논문에서는 사용자의 니즈를 분석함에 있어 신뢰도를 향상시키기 위한 방안으로 상품에 대한 후기를 등록 할 때 배송 및 상품에 대한 만족도를 별점으로 평가할 수 있는 방법을 추가하였다.

    니즈를 분석하기 위한 가장 큰 요인은 상품에 대한 후기를 분석하는 것이다. [5]에서는 감성분석 방법을 검증할 수 있는 실험 집합 및 검증 방법의 어려움에 대하여 말하고 있으며, 이를 효과적으로 입증하기 위하여 단어를 특정 주제에 관하여 긍정, 부정, 중립 세 가지 성향으로 분류하고 있다.

    본 논문에서는 모호한 단어들을 제외시키고자 해당 주제에 대한 긍정과 부정의 단어들만을 데이터베이스 사전으로 구축하였으며 상품 마다 언급되는 단어의 빈도수를 측정하여 추가적인 데이터베이스 사전을 구축하였다.

    관련연구 [6]은 상품평 자동분류를 위한 감성분석 알고리즘을 제시하고 있으며, 상품평 수집, 형태소 분석, 감성분석, 요약화 4단계를 거쳐 해당상품평의 성향을 분석하고 있다.

    그러나 형태소 분석을 위하여 상품에 대한 주요 속성들을 정의하고 속성별로 형태소, 즉 단어들을 분류함에 있어 많은 시간과 비용이 소모되며 각 상품마다 동일작업을 반복해야 한다.

    본 논문에서는 형태소 분류 없이 상품이 소속된 카테고리를 분류하였으며 카테고리별로 주로 언급되는 단어들을 수집하고 빈도수에 따라 별도의 데이터베이스 테이블을 구축함으로서 시간과 비용을 절약 할 수 있도록 하였다.

    Ⅲ. 니즈분석 방법

       3.1. 전체 시스템 구조

    제안하는 니즈분석 시스템은 SNS 분석, 성향 분석, 후기 분석, 행동 분석 4가지로 구성된다.

    니즈분석 모듈은 SNS 분석, 사용자 지정 시스템에서 획득한 성향 분석, 후기 분석 및 행동 분석의 결과를 통합하여 활용하는 모듈로서 각 하위 모듈의 역할은 다음과 같다.

    기존 사이트에서 보여주던 추천 상품 등의 기능은 사용자가 구매하거나 클릭한 상품을 단순히 나열하여 보여주는 기능에 불과하였다. 이를 해결하고자 본 논문에서는 사용자가 상품 구매 시 취하는 여러 행동(상품 카테고리 선택, 선호 상품 체크, 리뷰 작성, 상품 구매)들을 통하여 누적된 로그 데이터를 분석하여 사용자 개인에게 맞는 상품들을 추천해줌으로써 상품 구매율을 향상시킬 수 있도록 하였다.

       3.2. 후기분석을 위한 데이터베이스 사전 구축방법

    후기분석의 신뢰도는 매칭되는 데이터베이스 사전의 완성도와 연관이 있다. 따라서 국내 대표 쇼핑몰들의 후기를 각 카테고리 마다 100개의 후기를 수집하고 분석한 결과 그림 2와 같이 상품의 카테고리에 따라 사용되는 특정 단어들이 있음을 파악했다.

    해당 상품의 후기에는 몇몇 단어들이 주로 사용되는 것을 발견하고, 이 단어들의 가중치를 조정하여 신뢰도를 향상시키고자 하였다.

    우선적으로 해당 상품의 카테고리를 정립할 필요성이 있었다. 그 이유는 그림3과 같다.

    그림 3에서 구두 A는 쇼핑몰의 차이만 있을 뿐 동일한 제품이다. 그러나 해당 상품의 카테고리는 차이를 보인다. 이는 카테고리별 자주 쓰이는 단어를 선별할 때 상당한 어려움이 있었고, 후기분석 결과의 신뢰도가 감소하게 된다. 이를 최소화하고자 여러 쇼핑몰의 카테고리를 수집하여 연관성 있는 제품들끼리 묶어 상품의 카테고리를 표1과 같이 34개로 정리하였다.

    각 카테고리마다 긍정적인 성향의 단어와 부정적인 성향의 단어를 분류하였고, 그 빈도수를 토대로 자주 쓰이는 단어들을 다시 분류하여 데이터베이스 사전을 두 가지(기본 단어 사전, 자주 쓰이는 단어 사전)로 구축하였다(그림 4). 상품의 후기들은 상품의 속성별로 언급되는 특정 단어들이 존재하였다.

       3.3. 사용자 지정 선호도 분석 모듈

    이 모듈은 쇼핑몰 사용자가 직접 두 가지 상품을 지정하고 두 가지 상품에 대한 타사용자의 선호도를 비교할 수 있도록 지원한다. 사용자 지정 선호도 분석 시스템을 통하여 등록되는 정보는 그림 5와 같다.

       3.4. 상품 후기의 선호도 분석을 위한 수치화 방법

    니즈분석에 가장 큰 영향을 주는 것이 쇼핑몰 사용자가 직접 작성한 상품 후기를 분석하는 것이다[9]. 또한 후기 분석의 결과를 보정하기 위하여 후기 작성에 앞서 상품에 대한 별점을 평가할 수 있는 방법을 고안하였다. 다음의 과정을 거쳐 사용자의 선호도가 수치화 된다.

    첫 번째로 사용자가 직접 상품에 대한 별점을 평가하도록 한다. 상품 구매 때 사용자의 선호도에 영향을 미치는 요인으로 네 가지(포장 상태, 택배 신속성, 제품의 사이즈, 제품 상태)를 반영하였다. 각 요인을 0 ~ 5 점으로 평가하고 4가지 요인의 평균을 기준으로 후기 분석 결과를 4가지로 나눈다.

    두 번째로 작성된 후기를 자주 쓰이는 단어 사전과 우선적으로 매칭한 후 성향에 맞는 가중치를 곱하여 수치를 합산(a) 하고, 매칭된 단어를 제외한 나머지 단어들 또한 기본 단어 사전과 매칭 후 성향에 맞는 가중치를 곱하여 수치를 합산(b)한다. (a)와 (b)는 식(1)에 의해 계산된다.

    image

    여기서, FR은 자주 쓰이는 단어들의 매칭 결과로, ft는 자주 쓰이는 긍정 단어의 수를 ff는 자주 쓰이는 부정단어의 수를 나타낸다.

    DR은 기본 단어들의 매칭 결과로, dt는 기본 긍정단어의 수를 df는 기본 부정 단어의 수를 나타낸다. 각 Weight표 2에 따라 부여된다.

    식 1에서 획득 되어진 FRDR은 합산하여 그림7의 B를 획득 한다.

    그림 6의 알고리즘을 이용하여 선호도 분석 결과 R을 획득한다. 그러나 별점과 매칭 합산 결과의 관계가 모호해지는 경우(별점이 1점인데 후기 매칭결과가 매우 높을 때 = 별점 및 후기 매칭 결과를 신용할 수 없음)가 발생한다. 따라서 표 3에 따라 가중치 비율을 적용하여 선호도 분석 결과를 보정한다.

    Ⅳ.구현 결과

    3장에서 제시한 사항들을 만족할 수 있도록 데이터 베이스 사전과 모바일 애플리케이션을 구축하였다.

       4.1. 데이터베이스 사전 구축

    데이터베이스 사전은 3장에서 선별된 34개의 카테고리를 기준으로 대형 쇼핑몰에서 카테고리별 100 ~ 150개의 후기를 선별하여 약 4천개의 후기를 수집하였다.

    수집된 후기들은 단어 단위로 나뉘어져 해당 상품에 대하여 긍정/부정의 성향을 뛰는 단어들로 나누었으며, 단어의 빈도수가 가장 높은 긍정 3단어, 부정 3단어를 선별하여 높은 가중치를 두었다. 자주 언급되는 214단어와 기본 1744단어를 선별하였다.

       4.2. 선호도 수치화 알고리즘 검증

    선호도 수치화 알고리즘의 검증을 위하여 동일한 상품에 대한 상품 후기 3 가지를 선정 하였다. 각 후기에 대한 인간의 판단결과는 그림 7과 같다.

    이후 각각의 후기들을 개발한 모바일 쇼핑몰을 이용하여 후기를 등록하였으며 분석된 선호도 수치는 10점, 42점, 50점으로 인간의 판단과 유사한 결과였다.

       4.3. 모바일 앱 구현

    모바일 앱은 니즈분석 시스템을 탑재한 모바일 쇼핑몰로서 2가지 페이지(상품의 구매가 가능한 페이지, 사용자 지정 선호도 분석 시스템을 포함한 페이지)로 구성되어 있다.

    사용자 지정 분석 시스템은 앞서 언급한 대로 사용자가 지정한 두 가지 상품의 추천수를 통하여 개인 및 특정 그룹의 선호도를 알 수 있도록 하였다.

    또한 후기 작성 페이지로 연결되도록 구현하여 상품에 대한 후기를 작성하고 볼 수 있도록 구현하였다. 후기는 사용자가 별점을 평가하는 부분과 이미지 및 상품에 대한 내용을 작성하는 2페이지로 구성되어있다.

       4.4. 니즈분석 결과 반영

    ① 행동분석 모듈

    행동분석 모듈[7]을 위해 제안한 시스템은 고객들의 다양한 활동들을 정의하여 각각의 가중치를 차별화하여 앱을 종료할 때 사용자의 로그 데이터를 분석하여 니즈분석 결과에 반영하도록 하였다.

    사용자가 카테고리 중 하나를 선택하게 될 경우 사용자의 로그 데이터는 저장된다. 따라서 저장된 로그데이터는 앱이 종료될 때 니즈분석 결과에 반영되게 된다.

    그림 10을 보면 사용자가 선택한 카테고리 데이터를 축적하고 이를 바탕으로 가장 많이 선택된 카테고리를 추출하여 개인 선호도 테이블에 저장한다.

    그림 11은 니즈분석 결과가 반영된 화면으로 사용자가 “신발-여성화” 에 관심이 있음을 알 수 있다. 사용자가 상품을 구매하거나 후기를 남기는 일련의 행동이 없더라도 관심 있는 카테고리를 선택하였을 때의 로그데이터를 분석하여 니즈분석에 활용 하도록 하였다.

    ② 사용자 지정 선호도 분석 모듈 결과

    사용자 지정 선호도 분석 시스템에서 지정된 두 가지 상품 중 하나를 선택 하였을 때 저장된 데이터는 그림 12의 최상단 테이블(ProductChoice)과 같다. 이 정보를 기반으로 하여 개인 선호도 테이블에 반영 하였다.

    ③ 후기 분석 모듈

    등록된 후기는 선호도 수치화 알고리즘에 의하여 데이터베이스에 저장된 별점과 후기 내용에 따라 수치화하여 후기분석 결과 테이블에 저장되게 된다.

    수치화된 결과는 20점을 기준으로 사용자의 선호도 유무를 판단하여 20점 이하는 관심있는 카테고리 내에서도 해당 제품은 제외시키도록 하였으며, 20점 이상부터는 선호도에 따라 정렬되도록 하였다.

    그림 14는 행동 분석 및 성향 분석의 결과에 후기 분석 결과를 결합한 니즈 분석 결과로서 그림 13의 후기 분석 결과(선호도 수치 20 이하)에 따라 상품 번호에 해당하는 “남자 야상” 제품이 니즈분석 결과 화면에서 제외되도록 하였다. 그 결과 고객이 선호하는 카테고리는 니즈 분석 결과에 반영하고, 비선호 하는 상품에 대한 정보는 제외하여 고객 맞춤 정보를 제공할 수 있었다.

    Ⅴ. 결 론

    본 논문에서는 인터넷 쇼핑몰에서 적용 가능한 니즈분석 시스템을 제안하였다. 기존 구매 내역을 단순히 나열하는 방식에서 벗어나 쇼핑몰 사용자의 여러 가지 데이터들을 활용하여 사용할 수 있는 시스템이다.

    제안된 니즈분석 시스템은 사용자가 직접 두 가지 상품을 지정하고 비교할 수 있도록 사용자 지정 선호도 분석 시스템을 구현하였으며, 이를 이용하여 개인 및 타인의 선호도까지 획득 할 수 있도록 하였다. 또한 상품에 대한 후기를 등록할 때 별점 평가 기능을 적용하여 후기 분석의 신뢰도를 향상 시켰다. 따라서 제안된 니즈 분석 시스템은 사용자 지정 시스템으로 획득한 성향 분석, 후기 분석 및 행동 분석의 결과를 통합하여 활용함으로써 니즈분석의 신뢰도를 향상 시킬 수 있었다.

    본 논문에서는 후기분석을 위한 데이터베이스 사전을 구축할 때 단순히 카테고리에 별로 사용되는 단어의 성향을 분석하여 활용 하였으나 향후 상품의 속성까지 고려하여 단어들을 분류하고 활용할 수 있다면 보다 정확한 니즈분석 결과를 획득할 수 있을 것으로 사료된다.

  • 1. Oh Su Yeon 2015 “Catch the showrooming jok“ [Marketing 48th] P.60-63 google
  • 2. Kim Sun Hyoung “Identification of Internet Customer Purchase Pattern Using Web Mining Techniques” google
  • 3. Jang Jung Hee “Qualitative study on how purchasing fashion products in online shopping mall influences on consumer’s attitude toward purchasing” google
  • 4. Park Na Ri “A Study on the Effects of Delivery Service Quality on Customer Satisfaction in Internet Apparel Shopping Mall” google
  • 5. Park Yong Min 2012 “Construction of Korean test collection for social media text sentiment analysis” [KIISE] Vol.39 P.118-120 google
  • 6. Chang Jae Young “A Sentiment Analysis Algorithm for Automatic Product Reviews Classification in On-Line Shopping Mall” google
  • 7. Lee Ahn Hee 2015 “Needs Implementation for SCS“ [KIICE] Vol.19 P.xx-xx google
  • 8. Park Sung Hoon 2015 “Analysis of Consumer Preferences based on Integration of External Social Network with Internal Group” [KIICE] Vol.19 P.xx-xx google
  • 9. Ding Xiaowen, Lui Bing 2007 “The Utility of Linguistic Rules in Opinion Mining,” [SIGIR] P.811-812 google
  • [그림 1.] 시스템 구조
    시스템 구조
  • [그림 2.] 상품별 사용되는 특정 단어
    상품별 사용되는 특정 단어
  • [그림 3.] 쇼핑몰마다 일관되지 않은 상품카테고리
    쇼핑몰마다 일관되지 않은 상품카테고리
  • [표 1.] 정리된 카테고리
    정리된 카테고리
  • [그림 4.] 데이터베이스 사전 구축 과정
    데이터베이스 사전 구축 과정
  • [그림 5.] 사용자 지정 선호도 분석 모듈
    사용자 지정 선호도 분석 모듈
  • [] 
  • [표 2.] 단어별 가중치
    단어별 가중치
  • [그림 6.] 선호도 수치화 알고리즘
    선호도 수치화 알고리즘
  • [표 3.] 별점과 단어의 가중치 비율
    별점과 단어의 가중치 비율
  • [그림 7.] 상품 후기 및 선호도 수치화 결과
    상품 후기 및 선호도 수치화 결과
  • [그림 8.] 모바일 앱 구성화면
    모바일 앱 구성화면
  • [그림 9.] 후기작성 페이지
    후기작성 페이지
  • [그림 10.] 카테고리 선택 후 데이터베이스
    카테고리 선택 후 데이터베이스
  • [그림 11.] 카테고리 선택 후 니즈분석 결과화면
    카테고리 선택 후 니즈분석 결과화면
  • [그림 12.] 상품 지정 후 반영된 선호 상품정보
    상품 지정 후 반영된 선호 상품정보
  • [그림 13.] 저장된 후기 및 수치화된 결과
    저장된 후기 및 수치화된 결과
  • [그림 14.] 니즈분석 결과화면
    니즈분석 결과화면