Copyrightⓒ MOARA® All rights Reserved.
일정한 규격이나 형태를 지닌 숫자데이터가 아님
그림, 영상, 문서처럼 형태와 구조가 다른 구조화되지 않은 데이터를 말함
책, 잡지, 문서의료 기록, 음성정보, 영상정보 등
기업 내 각종 문서, 홈페이지, 고객의 소리, 고객센터 상담메모, 사이버 상담 자료 등
이메일, 트위터, 블로그 처럼 모바일 기기와 온라인에서 생성되는 데이터
Copyrightⓒ MOARA® All rights Reserved.
Voice Calls
E-mails, Chat, SMS
Survey Comments
Blogs
Social Media
Word of Mouth
Internal (Direct)
External (Public)
• 90% of our digital information universe is now unstructured (IDC)
> 90%
품질/기술
차별화(가격, CS, 경험)
정형+비정형
DATA
Copyrightⓒ MOARA® All rights Reserved.
• 소셜미디어 확대에 따른 다양한 고객 반응정보 획득
• 내부 및 외부에 산재된 고객정보의 신속한 통합
• 고객정보 통합을 통한 360도의 다양한 분석 기반 구축
• 방대한 비정형 데이터를 손쉽게 분류 및 의미 파악
• 소셜 데이터에서 기업 및 제품에 대한 감성정보를 추출
• 온톨로지를 추출 및 분석하여 숨은 Needs 도출
• 조직 내 KPI별 기준설정에 따른 조기 경보 및 Alerting
• 기계학습을 통한 지능화 개선 및 선제적 대응
• 패턴 분석을 통한 미래예측 및 대응 시나리오 도출
Decision
360˚ View
Insight
소셜미디어확대
모바일트래픽 증가
IoT 기술발전
비정형
데이터의
부각
서비스강화
혁신강화
전략강화
Copyrightⓒ MOARA® All rights Reserved.
특정부서
회사중심
지정채널
9H-5H
거래중심
IN-OUT
회사전체
고객중심
고객채널
24H
소통중심
OUT-IN
CRM 1.0 CRM 3.0
Copyrightⓒ MOARA® All rights Reserved.
가치 창출
성과 향상(CSI)
시장성과 향상Revenue/
Reputation
활용 / 자산화Customer Insight 분석Channel Mgt.
Internal
수집 배분고객
고객관리
CS
평판/기업이미지
마케팅/영업
위기관리
위기관리
Home pageCall Center
Call Text/상담메모
SNSPortalBlog
문의, 불만
평판, 소문
Risk Mgmt.
Internal CustomerData 연계
External CustomerData 연계
처리 분석
모니터링
모니터링
CRM 마케팅 SFA 각종기간계
CRM 마케팅 SFA 각종 기간계
기획/전략
External
경영혁신 활동
현업 Knowledge Based
현업 Knowledge Based
유형화
In/Ex Channel통합관리
일원화된Control Tower
Copyrightⓒ MOARA® All rights Reserved.
Internal
External
자동수집
가공분류
시각화의미분석
•수집추천
•자동감지
•자동필터
•중복처리
•의미단어
•추출분석
•온톨로지
•텍사노미
•관심주제
•의미분류
•이슈분류
•정보분해
•감성분석
•빈도분석
•연관분석
•랭킹분석
Business
마케팅
상품
영업
서비스
리스크
MOARA Enterprise V3.5Source
•ERP/CRM•SCM/BI
•SNS•Web•기타
•내부문서•그룹웨어
•감성분석•시장분석
•니즈분석•제품분석
•경쟁분석•고객분석
•선제대응•개선도출
•조기경보•미래예측
MOA ARA모아 아라
+ MOARA=모아라
•통합사전
•도메인사전
•기계학습
•인공지능
Copyrightⓒ MOARA® All rights Reserved.
위기관리
고객관리
홍보관리
제품관리
경쟁사관리
평판관리
이슈분석
VOC분석
반응분석
효과분석
인플루엔서분석
선호도분석
가격분석
니즈분석
감성분석
+
태그클라우드
랭킹키워드
핫키워드 추이
분포도 토픽트리
관계분석 군집분석
감성추이
분석결과
시장분석
수익분석
+
정형분석 (Data Mart)
EDW & BI
비정형분석 (Text Mining)
데이터분석
형태소분석
온톨로지
텍사노미
기계학습
개체분석
A.I단어학습
Online
Social
외부 Data
내부 Data+
데이터수집
CallCenter
홈페이지ERP/BI그룹웨어
EDM/KMS
MOARA Enterprise V3.5 적용분야
Copyrightⓒ MOARA® All rights Reserved.
MOA
외부 DATA
News
SNS
Customer Site
WW
W
BBS
Blog
Forum
Government
Company
Research Center
…
내부 DATA
VOC
Sales Memo
Customer IF
…
RDBMS
HDFSSo
cket
Ag
en
t (B
ytew
orx
)
Co
llect
Ro
bo
t A
gen
tRobot Creater
Detail Search
Filtering
Text Parse
ICM/CDC
Result File
List Search
Meta File
수집서버 분석서버(4Node up)
Meta FileSA
ARA-INSPIRE
HBASE
Batch
ML Graph
SQLNoSQL
& Search
다차원분석서버
ARA-OLAPPowered by MSTR
RDBMS
Visualizing 서버
ARA-Visual
Classifying
Document분해
관심주제Sensing
의미분석
RDBMS 서버
Customizing Module
Meta File
Data Integration
대시보드 다양한사용자
전문분석가
My Menu
전문분석 Tool
Email SMS
임원
관리자
담당자
sso
In-Memory CUBE
Visual Insight
AD-Hoc Query
Report & Chart
Drill & Pivot
MO
AR
A
PR
OX
Y
Copyrightⓒ MOARA® All rights Reserved.
TEXT(Ready toInsight)
Social
Internal
Html Tag Filter
Rule Filter
Noise AreaFilter
hacking,Adware Filter
Html/XMLParser
Json Parser
MS-OfficeParser
IncrementalLoading
Change DataCapture
List Search
Detail Search
RobotCreater
SchedulerERP CRM SCM
HR KM 기타
01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN
Copyrightⓒ MOARA® All rights Reserved.
01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN
문서를 문장과 단어로분리 및 문서 구조화(복합단어,신조어 등)
• 국어사전
• 영한사전
• 영영사전
• 백과사전
• 끝말어사전
• 문장분리사전
• 품사사전
• 신조어사전
• 사투리사전
• 유행어사전
• 실시간검색어
• 어휘사전
문장분리(Sentence)
단어분리(Words)
구문분석 단어분리
단어원형비교
조사분리문장형식/Tag 분리
특정품사분리 자/모분리
제외단어처리
Ontology 비교
의미단어확정
구문분석(Syntax)
어휘분석(Lexical)
태킹결과
트리생성
어휘적용
어휘파싱
최적트리선정
태킹결과
트리생성
문법적용
문장파싱
최적트리선정
통합
사전
도메인
사전
모아라 자체엔진(NOT Open Source)
- Rule Base 처리- AI를 탑재하여
강화학습 및 반복학습실시 품질개선
- 고객사별특화 모듈제공
텍스트 타입에 따른문장분리기 제공
- 뉴스- 상담(화자,습관)- 단문 (소셜데이터)- AI를 활용한
문장 패턴 인식
한글에 특화된Rule 및 분류규칙에대한 인공지능 제공
Copyrightⓒ MOARA® All rights Reserved.
01.Collect 02.NLP 03.Inspire 04.Visualizing
12
2
5
4
3
1
2
문서의 구성요소에 대한 연관성과
요약, 점수화
A Priori(데이터 연관성)
KNN(근접이웃알고리즘)
SVM(모형비교 알고리즘)
Naïve Bayesian(문서 자동분류)
LDA(주제분류, 유사도)
K-Means(군집분석)
Hierarchical Clustering(유사도 분석)
M-regression(다중회귀)TF-IDF
Topic
Ranking
MOARA Score
Relation
Subject Score
SVD (특이값분해)
Scoring
Relation
Topic
Ranking
Valuation기본 Rule Algorithm
124.5
① ② ③
계좌 이체3.5
Hot 키워드
Categorizing
05.AI & RNN
Copyrightⓒ MOARA® All rights Reserved.
01.Collect 02.NLP 03.Inspire 04.Visualizing
Domain CategoryOntology
(의미분류)
Taxonomy
(점수화)
Keyword
(단순분류)
• 분류별로 미리 설정한 키워드,조합키워드,온톨로지에 대한점수를 설정해 놓고 문서내에 조건이 검색될 때마다계산식을 이용하여 점수를 계산하고 전체 문서의Taxonomy Score를생성함
• 통계나 기계학습에 의하여 Score값이범위를 만족하면 분류
• 단어 (사전에 등록된 단어)• 음절 (소리나는 대로의 단어)• 카테고리 (음정,단어,온톨로지,텍사노미등 그룹화 단위)• 격문법 (주어+목적어+동사, 문장의 형식을 표현한 Rule)• 정규 표현식등을 조합하여 만들어 놓은 조건
12
2
5
4
3
1
2
135
97
65
32
의미기반 자동분류 및 점수화
사전
기계학습알고리즘
05.AI & RNN
Copyrightⓒ MOARA® All rights Reserved.
01.Collect 02.NLP 03.Inspire 04.Visualizing
•Dashboard
•감성 Dashboard
•Tag Cloud
•Ranking
•분포도
03 자동분류
•Logic Tree
•Clustering
02 이슈분석
•Trend/Relation
•Title Keyword
•Relation Word
•Ranking Relation
•분포 Relation
04 문서요약
•Summarizing
•Ranking Words
•Ontology Score
•Taxonomy Score
01 감성분석
직관적인 UI/UX In-Memory다양한 View
마케팅 영업 서비스 리스크
05.AI & RNN
Copyrightⓒ MOARA® All rights Reserved.
01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN
Taxo1(민원예측)
Taxo2(마케팅)
TaxoN(리스크)
.
.
.
.
긍부정사전
신조어사전
행위단어사전
.
.
.
.
Domain사전
Standard사전
RelationML-AI
PatternML-AI
Etc PatternML-AI
.
.
.
.
Ontology규칙CBOW : continous bag of words modelskip gram model
Copyrightⓒ MOARA® All rights Reserved.
Category정의
DomainKeyword 편집
Taxonomy작성 & 설정
- 주제 선정(리스크,마케팅)
- 분류체계 작성(Depth 설정)
- 등록 및 편집- 검색대상 설정- 검색방법 성정(대상문서,문장)
Ontology편집
- 관련 키워드등록 및 편집
(업무 전문가)
분류실행
관련사전준비
Keyword 자동생성
Taxonomy자동생성
Ontology자동생성
- 관련 분류체계자동 Loading
- 백과사전- 유사사례- 운영중인 사례
- 자동 추출된키워드를이용하여자동으로 조합온톨로지 생성
- 학습문서를이용하여 학습
- 변수정의- 분류모형생성
- 관련사전을이용하여자동으로키워드 및말뭉치 생성
학습문서추출
현업담당자
분류실행
ARA 시스템
- Boolean- Score
검증
- 분류 Rule 설정( 가중치,우선
순위 조정)Retraining
이슈탐색/자동분류/감성분석
- 리스크- 마케팅- 긍부정대표문서 추출
비정형 Taxonomy Rule Set 생성 방법론
Copyrightⓒ MOARA® All rights Reserved.
문장추출 단어추출 단어속성 부여 문장속성 부여 Relation 분석 Ontology 분석
발생빈도(기본적인 통계)
주요태그를 이용한 가중치 부여
• 문서에서 차지하는 위치• 문장에서 차지하는 위치• 문장내의 문법적인 용도• 주요문장에 발생 여부• 주요단어와의 교차사용 여부• 사전적인 중요도 (다항분포)• 비즈니스 중요도 (다항분포)
국어사전백과사전
주요단어(행위단어,지시단어,질문단어,감성단어등)
비즈니스 관련도메인사전
(은행,카드,생보,손보,증권유통,제조,서비스등)
STT
상담메모
인터넷상담/민원
Social Doc
파일파일
Text
• 사전적인 중요도 관리
• 신조어 탐색
• 비즈니스 중요도• 유사어,유의어• 패턴유의어
TAXONOMY Rule(분류목적에 의해 생성된
변수들의 분포)
기계학습 / 인공지능 / 딥러닝
TAXONOMY 분석Category 분석
• 선형변환• SVM• NN
Copyrightⓒ MOARA® All rights Reserved.
ROUND(LN(TOT_DOC/CNT_DOC),6) IDF,ROUND(BTF*ROUND(LN(TOT_DOC/CNT_DOC),6),6) BTF_IDF,ROUND(NTF1*ROUND(LN(TOT_DOC/CNT_DOC),6),6) NTF1_IDF,ROUND(NTF2*ROUND(LN(TOT_DOC/CNT_DOC),10),10) NTF2_IDF,ROUND((LN(BTF)+1)*ROUND(LN(TOT_DOC/CNT_DOC),6),6) NBTF_IDF, ROUND((LN(NTF1)+1)*ROUND(LN(TOT_DOC/CNT_DOC),6),6) NNTF1_IDF,ROUND((LN(NTF2)+1)*ROUND(LN(TOT_DOC/CNT_DOC),10),10) NNTF2_IDF
주의) CNT와 Moara Score 2가지로 계산됨
*. TF-IDF : Term Frequency-Inverse Document Frequency
• Support Vector Machine 이나 Neural Network Model을 이용한
방법은 고품질의 학습데이터를 준비해야 하며, 정확도가 학습데이
터에 의존하므로 수시로 변화하는 문서에 이를 적용하는 것은 한
계가 있음
• 모아라의 TOPIC WORD 생성방식은
-. 단어-문서간 역빈도(TF-IDF)방식을 수용하고 변형하여 BTF(집단
문서 전체에서의 단어빈도), NTF1(Max 단어빈도로 정규화),
NTF2(문서내의 단어빈도와 전체 단어수로 정규화)를 TF 값으로
사용
-. NLP 차원에서의 단어 위치, 문법, 패턴, Action단어의 가중치를
이용한 모아라 고유의 방식을 활용한 Score를 이용
• K-SCORE는 특정 도메인의 문서들에서 나타나는 주제중심어를 추
출하는 것을 목적으로 함
• 한가지 주제에 대한 TF-IDF를 그대로 사용할 경우의 노이즈를 해
결하기 위해서 대조군을 활용하여 노이즈를 제고하고 단어분포에
해당하는 TF(Term Frequency)는 단순 빈도가 아닌 각 문서마다 해
당 단어가 나타나는 확률을 합하여 사용함
• 추출된 Topic Word는 각각의 BTF_IDF, NBTF_IDF, NTF1_IDF,
nNTF1_IDF, NTF2_IDF, NNTF2_IDF, MOARA_IDF중 가장 변별력 있
는 가중치 값을 변수로 이용한 확률 값을 만들어서 Topic의 코퍼스
를 생성함
Copyrightⓒ MOARA® All rights Reserved.
• 주제별로 생성된 Taxonomy (K-Score기반의 Vector모델) 가중치를 이용하여문서를 분류하는 방식은 잠재 디리클레 할당(Latent Dirichlet allocation, LDA)을 활용하였음
• 자연어 처리에서 확률잠재의미분석(pLSA)과 비슷하지만 주어진 각 문서에서어떤 주제들이 존재하는지 주요 특징 단어를 추출하여 계산하는 이산 자료의확률 모형임
• 미리 알고 있는 주제별 단어수 분포(K-Score)를 바탕으로, 주어진 문서에서 발견된 단어수 분포를 분석함으로서 해당 문서가 어떤 주제들을 다루고 있는지를 예측할 수 있음
모아라에서는 K-vector를 공용사전의단어 Score를 이용함
Taxonomy Score (Vector화하는 방법은 여러가지 임)
Copyrightⓒ MOARA® All rights Reserved.
마케팅 서비스
영업리스크관리
상품개발
강점 약점
기회 위협
긍정 부정
70% 30%
평판분석 시장분석
기업, 제품평판분석 시장, 고객, 경쟁분석
Needs 분석 제품분석
고객목소리 -> 제품SPEC 제품경쟁차별화
경쟁분석 고객분석
제품, 서비스경쟁 분석 Single View, 360도분석
사전대응
음성분석
개선도출
서비스수준진단 및대응
상담음성 인사이트 도출
개선과제도출
이슈예측 조기경보
내부및외부이슈 도출 전사 KPI 기준설정및감시
고객외부정보
내부정보
변환 VOEVOC
매력도
경쟁도
당사
경쟁
진단
대응
처리
서비스
STT
음성파일변환
TextData
마케팅
영업
서비스
전사
위험 경고 양호외부
정치적경제적사회적
내부
수익성조직문화직원만족
자동분류
고객서비스의 자동분류및추천
TextData
예약
계약
심사
상품
Copyrightⓒ MOARA® All rights Reserved.
내.외부 정보 수집확대 비정형데이터 분석력 강화 전행관점 활용체계 개발
외부채널
내부채널
SNS
블로그
커뮤니티
기타…
주요매체
공중파방송
기타…
소셜미디어
매스미디어
250여개채널대상(구축형포함)
소비자보호센터
스마트고객센터
스마트금융센터
영업점(CRM)
인터넷/모바일
기타
Text Code
●◑◑●●●
◑●●●-◑
불만정보
고객니즈
상담정보
통합분류체계 수립
다양한 관점의 고객 분석
소비자보호
마케팅스마트고객센터
스마트금융센터
….
전행통합관점분류체계수립
주요키워드분석
긍부정패턴분석
Text 분류 및연관어분석
상품/채널별 분석
고객유형별 분석
당행관점
경쟁사관점
금융관점
고객평판리스크 관리체계 수립
마케팅 Insight 도출 Pilot
향후과제도출
리스크요인분류 정의
모니터링및감지조건 정의
리스크대응체계 수립
1개주체대상마케팅 Insight 도출 Pilot
고객평판리스크 고도화방안
마케팅추가과제 발굴
고객기반 Big Data 발전방향
Copyrightⓒ MOARA® All rights Reserved.
MOARA SOLUTIONChannel
자동분류비즈니스 이벤트
후 선별
I/B 상담(STT,
Memo)
인터넷상담
인터넷민원
EDW
Marketing Target이 아니면서현금서비스/카드론 이용
가능성이 높은 민원
금감원 민원을 제기할가능성이 높은 민원
한도초과승인거절, 고액이용, 한도상향 가능성이 높은 민원
BL등급이 아니면서 재조정가능성이 높은 민원
마이닝 Table
현업 활용 Table
TAXONOMY
MINING
현금서비스/카드론이용 예상 고객 예측
금감원 민원 제기 예상고객 예측
Taxonomy Score
이벤트 징후예상 群
Taxonomy 기법 활용Ontology 기법 활용
대분류 중분류 소분류
73개 924개
Ontology Setting Taxonomy Rule Setting
Event Trigger 모형 개발Segment Setting
SOLUTION Interface Solution Setting & Customizing Interface
상품
서비스/포인트
금융서비스
할부금융
카드이용/한도
심사/발급
가맹점
채널
정보/BL
특수
이슈
오토금융
기타
Copyrightⓒ MOARA® All rights Reserved.
한글분석을 위한 NLP( 분석 ≠ 검색 )
•최대 한글,변형,감성사전 보유•10년 이상의 Knowledge 사전•한글 최적화 온톨로지 구축•기계학습 기반 Taxonomy•RNN (딥러닝)기반의 AI 제공( 사전,Taxonomy 자체 진화 )
대용량 처리 안정성
•Hadoop,Appliances,RDB,File기반대용량 처리
• In-Memory 기반 NoSQL 실시간 지원
•지능형 수집 Robot
적정한 투자금액
• End-to-End 통합 플랫폼으로운영 용이•직접 고객 데이터 운영으로관리비용 절감•점진적 데이터 개선으로유지비용 절감
01 02 03 04
MOARA
경쟁사
사용이 쉬운 솔루션
•Web 기반 UI로 쉬운 사용법(전문가,일반사용자용 UI 제공)•시나리오 기반 분석 편리성•강력한 Discovery Tool 제공•다양한 시각화 기술
Copyrightⓒ MOARA® All rights Reserved.
사업그룹
CRM그룹
빅데이터그룹
기술연구소
계
11명 23명 17명 19명 70명
해당년도 2015 2014 2013
매출액(천원)
9,647,637 5,945,000 5,747,637
안전성장성
대표자 고 영 률 설립년도 2006년 9월 (Since 1999년)
Copyrightⓒ MOARA® All rights Reserved.
연번 사 업 명 발주처 업무수행내용 솔루션
1 삼성카드 TA 시스템(금융마케팅) 삼성카드 비정형분석/시각화 MOARA
2 신한카드 TA 시스템(금융마케팅,채권,민원예측) 신한카드 비정형분석/시각화 MOARA
3 신한은행 VOC3.0 TA빅데이터(리스크,마케팅) 신한은행 비정형분석/시각화 MOARA
4 신한생명 VOC 시스템 ( 수집/분석 ) 활용 신한생명 수집/분석 MOARA
5 조선호텔 VOC 시스템 ( 수집/분석 ) 활용 조선호텔 수집/분석 MOARA
6 ING생명 VOC 시스템 ( 수집/분석 ) 활용 ING생명 비정형분석(감성분석) MOARA
7 현대자동차 Call & VOC 데이터분석시스템구축 현대차 비정형분석(Rank,Search) ARA
8 신한은행 FOCUS 시스템 VOC데이터분석 신한은행 비정형분석(Rank,Search) ARA
9 삼성그룹 HRS(인사) 시스템 감성분석 오라클 비정형분석(감성분석) ARA
10 삼성전자냉장고/에어컨부문 설문분석 KMAC 비정형분석(감성분석) MOARA
11 삼성생명 Call 데이터분석 PoC 삼성생명 비정형분석(자동분류) ARA
12 담배인삼공사 VOC 시스템유형분석 담배인삼공사 비정형분석(Topic,Rank,Search) MOARA
13 POSCO 원자재수요예측정성분석 오라클 비정형분석(온톨로지,마이닝) ARA
14 POSCO CLAB 영업일지분석 오라클 비정형분석(온톨로지,마이닝) ARA
15 SPC그룹외부민원수집및분석 (netVOC) SPC 비정형분석(Topic,Rank,Search) MOARA
16 철도공사외부 VOC 수집및 검색시스템 철도공사 비정형분석(Topic,Rank,Search) MOARA
17 삼성전자MVOC 시스템비정형분석 (자동분류) 삼성전자 비정형분석(자동분류) 외산
18 삼성전자 SVOC 시스템비정형분석 (자동분류) 삼성전자 비정형분석(자동분류) 외산
Copyrightⓒ MOARA® All rights Reserved.
㈜유비원
(05685) 서울특별시송파구 송파대로 43길 4 3층(석촌동, 삼성타운)
TEL 02-422-1240 / FAX 02-422-2247
www.ubqone.com
문의 : 이연상무 ([email protected] )