+ All Categories
Home > Documents > 모아라 솔루션 소개서ª¨아라 TA... · 2016-06-08 ·...

모아라 솔루션 소개서ª¨아라 TA... · 2016-06-08 ·...

Date post: 23-May-2020
Category:
Upload: others
View: 2 times
Download: 0 times
Share this document with a friend
30
Copyright MOARA ® All rights Reserved. MOARA ® 2016.06 비정형 데이터 분석솔루션 제품소개서
Transcript

Copyrightⓒ MOARA® All rights Reserved.

MOARA®

2016.06

비정형데이터 분석솔루션

제품소개서

Copyrightⓒ MOARA® All rights Reserved.

무엇이든 모아서

알아본다.

M O A R A

Copyrightⓒ MOARA® All rights Reserved.

일정한 규격이나 형태를 지닌 숫자데이터가 아님

그림, 영상, 문서처럼 형태와 구조가 다른 구조화되지 않은 데이터를 말함

책, 잡지, 문서의료 기록, 음성정보, 영상정보 등

기업 내 각종 문서, 홈페이지, 고객의 소리, 고객센터 상담메모, 사이버 상담 자료 등

이메일, 트위터, 블로그 처럼 모바일 기기와 온라인에서 생성되는 데이터

Copyrightⓒ MOARA® All rights Reserved.

Voice Calls

E-mails, Chat, SMS

Survey Comments

Blogs

Social Media

Word of Mouth

Internal (Direct)

External (Public)

• 90% of our digital information universe is now unstructured (IDC)

> 90%

품질/기술

차별화(가격, CS, 경험)

정형+비정형

DATA

Copyrightⓒ MOARA® All rights Reserved.

• 소셜미디어 확대에 따른 다양한 고객 반응정보 획득

• 내부 및 외부에 산재된 고객정보의 신속한 통합

• 고객정보 통합을 통한 360도의 다양한 분석 기반 구축

• 방대한 비정형 데이터를 손쉽게 분류 및 의미 파악

• 소셜 데이터에서 기업 및 제품에 대한 감성정보를 추출

• 온톨로지를 추출 및 분석하여 숨은 Needs 도출

• 조직 내 KPI별 기준설정에 따른 조기 경보 및 Alerting

• 기계학습을 통한 지능화 개선 및 선제적 대응

• 패턴 분석을 통한 미래예측 및 대응 시나리오 도출

Decision

360˚ View

Insight

소셜미디어확대

모바일트래픽 증가

IoT 기술발전

비정형

데이터의

부각

서비스강화

혁신강화

전략강화

Copyrightⓒ MOARA® All rights Reserved.

Copyrightⓒ MOARA® All rights Reserved.

특정부서

회사중심

지정채널

9H-5H

거래중심

IN-OUT

회사전체

고객중심

고객채널

24H

소통중심

OUT-IN

CRM 1.0 CRM 3.0

Copyrightⓒ MOARA® All rights Reserved.

가치 창출

성과 향상(CSI)

시장성과 향상Revenue/

Reputation

활용 / 자산화Customer Insight 분석Channel Mgt.

Internal

수집 배분고객

고객관리

CS

평판/기업이미지

마케팅/영업

위기관리

위기관리

Home pageCall Center

Call Text/상담메모

SNSPortalBlog

문의, 불만

평판, 소문

Risk Mgmt.

Internal CustomerData 연계

External CustomerData 연계

처리 분석

모니터링

모니터링

CRM 마케팅 SFA 각종기간계

CRM 마케팅 SFA 각종 기간계

기획/전략

External

경영혁신 활동

현업 Knowledge Based

현업 Knowledge Based

유형화

In/Ex Channel통합관리

일원화된Control Tower

Copyrightⓒ MOARA® All rights Reserved.

Internal

External

자동수집

가공분류

시각화의미분석

•수집추천

•자동감지

•자동필터

•중복처리

•의미단어

•추출분석

•온톨로지

•텍사노미

•관심주제

•의미분류

•이슈분류

•정보분해

•감성분석

•빈도분석

•연관분석

•랭킹분석

Business

마케팅

상품

영업

서비스

리스크

MOARA Enterprise V3.5Source

•ERP/CRM•SCM/BI

•SNS•Web•기타

•내부문서•그룹웨어

•감성분석•시장분석

•니즈분석•제품분석

•경쟁분석•고객분석

•선제대응•개선도출

•조기경보•미래예측

MOA ARA모아 아라

+ MOARA=모아라

•통합사전

•도메인사전

•기계학습

•인공지능

Copyrightⓒ MOARA® All rights Reserved.

위기관리

고객관리

홍보관리

제품관리

경쟁사관리

평판관리

이슈분석

VOC분석

반응분석

효과분석

인플루엔서분석

선호도분석

가격분석

니즈분석

감성분석

+

태그클라우드

랭킹키워드

핫키워드 추이

분포도 토픽트리

관계분석 군집분석

감성추이

분석결과

시장분석

수익분석

+

정형분석 (Data Mart)

EDW & BI

비정형분석 (Text Mining)

데이터분석

형태소분석

온톨로지

텍사노미

기계학습

개체분석

A.I단어학습

Online

Social

외부 Data

내부 Data+

데이터수집

CallCenter

홈페이지ERP/BI그룹웨어

EDM/KMS

MOARA Enterprise V3.5 적용분야

Copyrightⓒ MOARA® All rights Reserved.

MOA

외부 DATA

News

SNS

Customer Site

WW

W

BBS

Blog

Forum

Government

Company

Research Center

내부 DATA

VOC

Sales Memo

Customer IF

RDBMS

HDFSSo

cket

Ag

en

t (B

ytew

orx

)

Co

llect

Ro

bo

t A

gen

tRobot Creater

Detail Search

Filtering

Text Parse

ICM/CDC

Result File

List Search

Meta File

수집서버 분석서버(4Node up)

Meta FileSA

ARA-INSPIRE

HBASE

Batch

ML Graph

SQLNoSQL

& Search

다차원분석서버

ARA-OLAPPowered by MSTR

RDBMS

Visualizing 서버

ARA-Visual

Classifying

Document분해

관심주제Sensing

의미분석

RDBMS 서버

Customizing Module

Meta File

Data Integration

대시보드 다양한사용자

전문분석가

My Menu

전문분석 Tool

Email SMS

임원

관리자

담당자

sso

In-Memory CUBE

Visual Insight

AD-Hoc Query

Report & Chart

Drill & Pivot

MO

AR

A

PR

OX

Y

Copyrightⓒ MOARA® All rights Reserved.

TEXT(Ready toInsight)

Social

Internal

Html Tag Filter

Rule Filter

Noise AreaFilter

hacking,Adware Filter

Html/XMLParser

Json Parser

MS-OfficeParser

IncrementalLoading

Change DataCapture

List Search

Detail Search

RobotCreater

SchedulerERP CRM SCM

HR KM 기타

01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN

Copyrightⓒ MOARA® All rights Reserved.

01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN

문서를 문장과 단어로분리 및 문서 구조화(복합단어,신조어 등)

• 국어사전

• 영한사전

• 영영사전

• 백과사전

• 끝말어사전

• 문장분리사전

• 품사사전

• 신조어사전

• 사투리사전

• 유행어사전

• 실시간검색어

• 어휘사전

문장분리(Sentence)

단어분리(Words)

구문분석 단어분리

단어원형비교

조사분리문장형식/Tag 분리

특정품사분리 자/모분리

제외단어처리

Ontology 비교

의미단어확정

구문분석(Syntax)

어휘분석(Lexical)

태킹결과

트리생성

어휘적용

어휘파싱

최적트리선정

태킹결과

트리생성

문법적용

문장파싱

최적트리선정

통합

사전

도메인

사전

모아라 자체엔진(NOT Open Source)

- Rule Base 처리- AI를 탑재하여

강화학습 및 반복학습실시 품질개선

- 고객사별특화 모듈제공

텍스트 타입에 따른문장분리기 제공

- 뉴스- 상담(화자,습관)- 단문 (소셜데이터)- AI를 활용한

문장 패턴 인식

한글에 특화된Rule 및 분류규칙에대한 인공지능 제공

Copyrightⓒ MOARA® All rights Reserved.

01.Collect 02.NLP 03.Inspire 04.Visualizing

12

2

5

4

3

1

2

문서의 구성요소에 대한 연관성과

요약, 점수화

A Priori(데이터 연관성)

KNN(근접이웃알고리즘)

SVM(모형비교 알고리즘)

Naïve Bayesian(문서 자동분류)

LDA(주제분류, 유사도)

K-Means(군집분석)

Hierarchical Clustering(유사도 분석)

M-regression(다중회귀)TF-IDF

Topic

Ranking

MOARA Score

Relation

Subject Score

SVD (특이값분해)

Scoring

Relation

Topic

Ranking

Valuation기본 Rule Algorithm

124.5

① ② ③

계좌 이체3.5

Hot 키워드

Categorizing

05.AI & RNN

Copyrightⓒ MOARA® All rights Reserved.

01.Collect 02.NLP 03.Inspire 04.Visualizing

Domain CategoryOntology

(의미분류)

Taxonomy

(점수화)

Keyword

(단순분류)

• 분류별로 미리 설정한 키워드,조합키워드,온톨로지에 대한점수를 설정해 놓고 문서내에 조건이 검색될 때마다계산식을 이용하여 점수를 계산하고 전체 문서의Taxonomy Score를생성함

• 통계나 기계학습에 의하여 Score값이범위를 만족하면 분류

• 단어 (사전에 등록된 단어)• 음절 (소리나는 대로의 단어)• 카테고리 (음정,단어,온톨로지,텍사노미등 그룹화 단위)• 격문법 (주어+목적어+동사, 문장의 형식을 표현한 Rule)• 정규 표현식등을 조합하여 만들어 놓은 조건

12

2

5

4

3

1

2

135

97

65

32

의미기반 자동분류 및 점수화

사전

기계학습알고리즘

05.AI & RNN

Copyrightⓒ MOARA® All rights Reserved.

01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN

Copyrightⓒ MOARA® All rights Reserved.

01.Collect 02.NLP 03.Inspire 04.Visualizing

•Dashboard

•감성 Dashboard

•Tag Cloud

•Ranking

•분포도

03 자동분류

•Logic Tree

•Clustering

02 이슈분석

•Trend/Relation

•Title Keyword

•Relation Word

•Ranking Relation

•분포 Relation

04 문서요약

•Summarizing

•Ranking Words

•Ontology Score

•Taxonomy Score

01 감성분석

직관적인 UI/UX In-Memory다양한 View

마케팅 영업 서비스 리스크

05.AI & RNN

Copyrightⓒ MOARA® All rights Reserved.

01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN

Copyrightⓒ MOARA® All rights Reserved.

01.Collect 02.NLP 03.Inspire 04.Visualizing 05.AI & RNN

Taxo1(민원예측)

Taxo2(마케팅)

TaxoN(리스크)

.

.

.

.

긍부정사전

신조어사전

행위단어사전

.

.

.

.

Domain사전

Standard사전

RelationML-AI

PatternML-AI

Etc PatternML-AI

.

.

.

.

Ontology규칙CBOW : continous bag of words modelskip gram model

Copyrightⓒ MOARA® All rights Reserved.

Category정의

DomainKeyword 편집

Taxonomy작성 & 설정

- 주제 선정(리스크,마케팅)

- 분류체계 작성(Depth 설정)

- 등록 및 편집- 검색대상 설정- 검색방법 성정(대상문서,문장)

Ontology편집

- 관련 키워드등록 및 편집

(업무 전문가)

분류실행

관련사전준비

Keyword 자동생성

Taxonomy자동생성

Ontology자동생성

- 관련 분류체계자동 Loading

- 백과사전- 유사사례- 운영중인 사례

- 자동 추출된키워드를이용하여자동으로 조합온톨로지 생성

- 학습문서를이용하여 학습

- 변수정의- 분류모형생성

- 관련사전을이용하여자동으로키워드 및말뭉치 생성

학습문서추출

현업담당자

분류실행

ARA 시스템

- Boolean- Score

검증

- 분류 Rule 설정( 가중치,우선

순위 조정)Retraining

이슈탐색/자동분류/감성분석

- 리스크- 마케팅- 긍부정대표문서 추출

비정형 Taxonomy Rule Set 생성 방법론

Copyrightⓒ MOARA® All rights Reserved.

문장추출 단어추출 단어속성 부여 문장속성 부여 Relation 분석 Ontology 분석

발생빈도(기본적인 통계)

주요태그를 이용한 가중치 부여

• 문서에서 차지하는 위치• 문장에서 차지하는 위치• 문장내의 문법적인 용도• 주요문장에 발생 여부• 주요단어와의 교차사용 여부• 사전적인 중요도 (다항분포)• 비즈니스 중요도 (다항분포)

국어사전백과사전

주요단어(행위단어,지시단어,질문단어,감성단어등)

비즈니스 관련도메인사전

(은행,카드,생보,손보,증권유통,제조,서비스등)

STT

상담메모

인터넷상담/민원

Social Doc

파일파일

Text

• 사전적인 중요도 관리

• 신조어 탐색

• 비즈니스 중요도• 유사어,유의어• 패턴유의어

TAXONOMY Rule(분류목적에 의해 생성된

변수들의 분포)

기계학습 / 인공지능 / 딥러닝

TAXONOMY 분석Category 분석

• 선형변환• SVM• NN

Copyrightⓒ MOARA® All rights Reserved.

ROUND(LN(TOT_DOC/CNT_DOC),6) IDF,ROUND(BTF*ROUND(LN(TOT_DOC/CNT_DOC),6),6) BTF_IDF,ROUND(NTF1*ROUND(LN(TOT_DOC/CNT_DOC),6),6) NTF1_IDF,ROUND(NTF2*ROUND(LN(TOT_DOC/CNT_DOC),10),10) NTF2_IDF,ROUND((LN(BTF)+1)*ROUND(LN(TOT_DOC/CNT_DOC),6),6) NBTF_IDF, ROUND((LN(NTF1)+1)*ROUND(LN(TOT_DOC/CNT_DOC),6),6) NNTF1_IDF,ROUND((LN(NTF2)+1)*ROUND(LN(TOT_DOC/CNT_DOC),10),10) NNTF2_IDF

주의) CNT와 Moara Score 2가지로 계산됨

*. TF-IDF : Term Frequency-Inverse Document Frequency

• Support Vector Machine 이나 Neural Network Model을 이용한

방법은 고품질의 학습데이터를 준비해야 하며, 정확도가 학습데이

터에 의존하므로 수시로 변화하는 문서에 이를 적용하는 것은 한

계가 있음

• 모아라의 TOPIC WORD 생성방식은

-. 단어-문서간 역빈도(TF-IDF)방식을 수용하고 변형하여 BTF(집단

문서 전체에서의 단어빈도), NTF1(Max 단어빈도로 정규화),

NTF2(문서내의 단어빈도와 전체 단어수로 정규화)를 TF 값으로

사용

-. NLP 차원에서의 단어 위치, 문법, 패턴, Action단어의 가중치를

이용한 모아라 고유의 방식을 활용한 Score를 이용

• K-SCORE는 특정 도메인의 문서들에서 나타나는 주제중심어를 추

출하는 것을 목적으로 함

• 한가지 주제에 대한 TF-IDF를 그대로 사용할 경우의 노이즈를 해

결하기 위해서 대조군을 활용하여 노이즈를 제고하고 단어분포에

해당하는 TF(Term Frequency)는 단순 빈도가 아닌 각 문서마다 해

당 단어가 나타나는 확률을 합하여 사용함

• 추출된 Topic Word는 각각의 BTF_IDF, NBTF_IDF, NTF1_IDF,

nNTF1_IDF, NTF2_IDF, NNTF2_IDF, MOARA_IDF중 가장 변별력 있

는 가중치 값을 변수로 이용한 확률 값을 만들어서 Topic의 코퍼스

를 생성함

Copyrightⓒ MOARA® All rights Reserved.

• 주제별로 생성된 Taxonomy (K-Score기반의 Vector모델) 가중치를 이용하여문서를 분류하는 방식은 잠재 디리클레 할당(Latent Dirichlet allocation, LDA)을 활용하였음

• 자연어 처리에서 확률잠재의미분석(pLSA)과 비슷하지만 주어진 각 문서에서어떤 주제들이 존재하는지 주요 특징 단어를 추출하여 계산하는 이산 자료의확률 모형임

• 미리 알고 있는 주제별 단어수 분포(K-Score)를 바탕으로, 주어진 문서에서 발견된 단어수 분포를 분석함으로서 해당 문서가 어떤 주제들을 다루고 있는지를 예측할 수 있음

모아라에서는 K-vector를 공용사전의단어 Score를 이용함

Taxonomy Score (Vector화하는 방법은 여러가지 임)

Copyrightⓒ MOARA® All rights Reserved.

마케팅 서비스

영업리스크관리

상품개발

강점 약점

기회 위협

긍정 부정

70% 30%

평판분석 시장분석

기업, 제품평판분석 시장, 고객, 경쟁분석

Needs 분석 제품분석

고객목소리 -> 제품SPEC 제품경쟁차별화

경쟁분석 고객분석

제품, 서비스경쟁 분석 Single View, 360도분석

사전대응

음성분석

개선도출

서비스수준진단 및대응

상담음성 인사이트 도출

개선과제도출

이슈예측 조기경보

내부및외부이슈 도출 전사 KPI 기준설정및감시

고객외부정보

내부정보

변환 VOEVOC

매력도

경쟁도

당사

경쟁

진단

대응

처리

서비스

STT

음성파일변환

TextData

마케팅

영업

서비스

전사

위험 경고 양호외부

정치적경제적사회적

내부

수익성조직문화직원만족

자동분류

고객서비스의 자동분류및추천

TextData

예약

계약

심사

상품

Copyrightⓒ MOARA® All rights Reserved.

내.외부 정보 수집확대 비정형데이터 분석력 강화 전행관점 활용체계 개발

외부채널

내부채널

SNS

블로그

커뮤니티

기타…

주요매체

공중파방송

기타…

소셜미디어

매스미디어

250여개채널대상(구축형포함)

소비자보호센터

스마트고객센터

스마트금융센터

영업점(CRM)

인터넷/모바일

기타

Text Code

●◑◑●●●

◑●●●-◑

불만정보

고객니즈

상담정보

통합분류체계 수립

다양한 관점의 고객 분석

소비자보호

마케팅스마트고객센터

스마트금융센터

….

전행통합관점분류체계수립

주요키워드분석

긍부정패턴분석

Text 분류 및연관어분석

상품/채널별 분석

고객유형별 분석

당행관점

경쟁사관점

금융관점

고객평판리스크 관리체계 수립

마케팅 Insight 도출 Pilot

향후과제도출

리스크요인분류 정의

모니터링및감지조건 정의

리스크대응체계 수립

1개주체대상마케팅 Insight 도출 Pilot

고객평판리스크 고도화방안

마케팅추가과제 발굴

고객기반 Big Data 발전방향

Copyrightⓒ MOARA® All rights Reserved.

MOARA SOLUTIONChannel

자동분류비즈니스 이벤트

후 선별

I/B 상담(STT,

Memo)

인터넷상담

인터넷민원

EDW

Marketing Target이 아니면서현금서비스/카드론 이용

가능성이 높은 민원

금감원 민원을 제기할가능성이 높은 민원

한도초과승인거절, 고액이용, 한도상향 가능성이 높은 민원

BL등급이 아니면서 재조정가능성이 높은 민원

마이닝 Table

현업 활용 Table

TAXONOMY

MINING

현금서비스/카드론이용 예상 고객 예측

금감원 민원 제기 예상고객 예측

Taxonomy Score

이벤트 징후예상 群

Taxonomy 기법 활용Ontology 기법 활용

대분류 중분류 소분류

73개 924개

Ontology Setting Taxonomy Rule Setting

Event Trigger 모형 개발Segment Setting

SOLUTION Interface Solution Setting & Customizing Interface

상품

서비스/포인트

금융서비스

할부금융

카드이용/한도

심사/발급

가맹점

채널

정보/BL

특수

이슈

오토금융

기타

Copyrightⓒ MOARA® All rights Reserved.

한글분석을 위한 NLP( 분석 ≠ 검색 )

•최대 한글,변형,감성사전 보유•10년 이상의 Knowledge 사전•한글 최적화 온톨로지 구축•기계학습 기반 Taxonomy•RNN (딥러닝)기반의 AI 제공( 사전,Taxonomy 자체 진화 )

대용량 처리 안정성

•Hadoop,Appliances,RDB,File기반대용량 처리

• In-Memory 기반 NoSQL 실시간 지원

•지능형 수집 Robot

적정한 투자금액

• End-to-End 통합 플랫폼으로운영 용이•직접 고객 데이터 운영으로관리비용 절감•점진적 데이터 개선으로유지비용 절감

01 02 03 04

MOARA

경쟁사

사용이 쉬운 솔루션

•Web 기반 UI로 쉬운 사용법(전문가,일반사용자용 UI 제공)•시나리오 기반 분석 편리성•강력한 Discovery Tool 제공•다양한 시각화 기술

Copyrightⓒ MOARA® All rights Reserved.

사업그룹

CRM그룹

빅데이터그룹

기술연구소

11명 23명 17명 19명 70명

해당년도 2015 2014 2013

매출액(천원)

9,647,637 5,945,000 5,747,637

안전성장성

대표자 고 영 률 설립년도 2006년 9월 (Since 1999년)

Copyrightⓒ MOARA® All rights Reserved.

연번 사 업 명 발주처 업무수행내용 솔루션

1 삼성카드 TA 시스템(금융마케팅) 삼성카드 비정형분석/시각화 MOARA

2 신한카드 TA 시스템(금융마케팅,채권,민원예측) 신한카드 비정형분석/시각화 MOARA

3 신한은행 VOC3.0 TA빅데이터(리스크,마케팅) 신한은행 비정형분석/시각화 MOARA

4 신한생명 VOC 시스템 ( 수집/분석 ) 활용 신한생명 수집/분석 MOARA

5 조선호텔 VOC 시스템 ( 수집/분석 ) 활용 조선호텔 수집/분석 MOARA

6 ING생명 VOC 시스템 ( 수집/분석 ) 활용 ING생명 비정형분석(감성분석) MOARA

7 현대자동차 Call & VOC 데이터분석시스템구축 현대차 비정형분석(Rank,Search) ARA

8 신한은행 FOCUS 시스템 VOC데이터분석 신한은행 비정형분석(Rank,Search) ARA

9 삼성그룹 HRS(인사) 시스템 감성분석 오라클 비정형분석(감성분석) ARA

10 삼성전자냉장고/에어컨부문 설문분석 KMAC 비정형분석(감성분석) MOARA

11 삼성생명 Call 데이터분석 PoC 삼성생명 비정형분석(자동분류) ARA

12 담배인삼공사 VOC 시스템유형분석 담배인삼공사 비정형분석(Topic,Rank,Search) MOARA

13 POSCO 원자재수요예측정성분석 오라클 비정형분석(온톨로지,마이닝) ARA

14 POSCO CLAB 영업일지분석 오라클 비정형분석(온톨로지,마이닝) ARA

15 SPC그룹외부민원수집및분석 (netVOC) SPC 비정형분석(Topic,Rank,Search) MOARA

16 철도공사외부 VOC 수집및 검색시스템 철도공사 비정형분석(Topic,Rank,Search) MOARA

17 삼성전자MVOC 시스템비정형분석 (자동분류) 삼성전자 비정형분석(자동분류) 외산

18 삼성전자 SVOC 시스템비정형분석 (자동분류) 삼성전자 비정형분석(자동분류) 외산

Copyrightⓒ MOARA® All rights Reserved.

㈜유비원

(05685) 서울특별시송파구 송파대로 43길 4 3층(석촌동, 삼성타운)

TEL 02-422-1240 / FAX 02-422-2247

www.ubqone.com

문의 : 이연상무 ([email protected] )


Recommended