+ All Categories
Home > Documents > (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭...

(19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭...

Date post: 09-Sep-2020
Category:
Upload: others
View: 2 times
Download: 0 times
Share this document with a friend
18
(19) 대한민국특허청(KR) (12) 등록특허공보(B1) (45) 공고일자 2019년01월14일 (11) 등록번호 10-1937778 (24) 등록일자 2019년01월07일 (51) 국제특허분류(Int. Cl.) G06F 17/30 (2006.01) G06F 17/27 (2006.01) G06K 9/00 (2006.01) G06N 3/08 (2006.01) G10L 13/08 (2006.01) (52) CPC특허분류 G06F 17/30654 (2013.01) G06F 17/2755 (2013.01) (21) 출원번호 10-2017-0026236 (22) 출원일자 2017년02월28일 심사청구일자 2017년02월28일 (65) 공개번호 10-2018-0100001 (43) 공개일자 2018년09월06일 (56) 선행기술조사문헌 KR1020140042994 A (73) 특허권자 서울대학교산학협력단 서울특별시 관악구 관악로 1 (신림동) (72) 발명자 장병탁 서울특별시 관악구 관악로 1 공과대학 컴퓨터공 학부 바이오지능연구실 (신림동,서울대학교) 조휘열 서울특별시 관악구 관악로 1 공과대학 컴퓨터공 학부 바이오지능연구실 (신림동,서울대학교) (뒷면에 계속) (74) 대리인 이철 전체 청구항 수 : 총 13 항 심사관 : 이복현 (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과 방법 및 기록매체 (57) 요 약 인공지능을 이용한 기계 학습(machine-learning) 기반의 한국어 대화 시스템의 이용 방법이 제공된다. 상기 시 스템의 수집부가, 대화 데이터를 수집한다. 상기 시스템의 전처리부가, 상기 수집된 대화 데이터를 심층 신경 망(deep neural network)에 입력할 수 있는 상태로 형태소별로 나누어 벡터화하여 전처리한다. 상기 시스템의 (뒷면에 계속) 대 표 도 - 도1 등록특허 10-1937778 -1-
Transcript
Page 1: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

(19) 민 특허청(KR)

(12) 등 특허공보(B1)

(45) 공고 2019 01월14

(11) 등 10-1937778

(24) 등 2019 01월07

(51) 특허 (Int. Cl.)

G06F 17/30 (2006.01) G06F 17/27 (2006.01)

G06K 9/00 (2006.01) G06N 3/08 (2006.01)

G10L 13/08 (2006.01)

(52) CPC특허

G06F 17/30654 (2013.01)

G06F 17/2755 (2013.01)(21) 원 10-2017-0026236

(22) 원 2017 02월28

심사청 2017 02월28

(65) 공개 10-2018-0100001

(43) 공개 2018 09월06

(56) 술 사 헌

KR1020140042994 A

(73) 특허

울 산 단

울특별시 1 (신림동)

(72)

병탁

울특별시 1 공과 컴퓨 공 지능연 실 (신림동, 울 )

울특별시 1 공과 컴퓨 공 지능연 실 (신림동, 울 )

(뒷 에 계 )

(74) 리

체 청 수 : 13 심사 : 복

(54) 칭 공지능 계 습 어 시스 과 매체

(57)

공지능 계 습(machine-learning) 어 시스 공 다. 상 시

스 수집 가, 수집 다. 상 시스 처리 가, 상 수집 심층 신경

망(deep neural network)에 수 는 상태 태 별 누어 여 처리 다. 상 시스

(뒷 에 계 )

도 - 도1

등록특허 10-1937778

- 1 -

Page 2: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

습 가, 상 처리 태 별 신경 상(neural representation) 습 다. 상 시스

가, 상 연 각각 미 지식(semantic knowledge)

도 계 습 다. 상 시스 가, 사 건 , 상 사 태

별 여 다. 상 는 1 순 신경망(RNN; Recurrent Neural Network) 다.

상 시스 가, 상 에 답 생 다. 상 는 상 에 생

태 별 여 상 답 생 는 2 순 신경망 다. 상 1 순 신경망 상

2 순 신경망 LSTM(Long-Short Term Memory) 수 다.

(52) CPC특허

G06K 9/00228 (2013.01)

G06N 3/08 (2013.01)

G10L 13/08 (2013.01)(72)

강우

울특별시 1 공과 컴퓨 공 지능연 실 (신림동, 울 )

동식

울특별시 1 공과 컴퓨 공 지능연 실 (신림동, 울 )

지원 가연 개 사업

과 고 10044009

처 산업통상 원

연 리 산업 술평가 리원

연 사업 산업 원천 술개 사업

연 과 지 상 통 여 사 복 도 고, 에 95% 상 게 수 는 달 HRI 술 개

여 2/9

주 산 단

연 간 2016.03.01 ~ 2017.02.28

지원 가연 개 사업

과 고 R01261610720001002

처 미 창 과

연 리 보통신 술진

연 사업 보통신. 연 개 사업

연 과 (SW 스타 ) 상생 습 지에 트 SW 개

여 7/9

주 울 산 단

연 간 2016.03.01 ~ 2017.02.28

공지 :

등록특허 10-1937778

- 2 -

Page 3: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

청 1

공지능 계 습(machine-learning) 어 시스 ,

(a) 상 시스 수집 가, 수집 는 단계;

(b) 상 시스 처리 가, 상 수집 심층 신경망(deep neural network)에 수

는 상태 태 별 누어 여 처리 는 단계;

(c) 상 시스 습 가, 상 처리 태 별 신경 상(neural representation) 습 는

단계;

(d) 상 시스 가, 상 연 각각 미 지식

(semantic knowledge) 도 계 습 는 단계;

(e) 상 시스 가, 사 건 , 상 사 태 별 여

는 단계 , 상 는 1 순 신경망(RNN; Recurrent Neural Network) , 단계;

(f) 상 시스 가, 상 에 답 생 는 단계 , 상 는 상 에

생 태 별 여 상 답 생 는 2 순 신경망 , 단계

포 는, 어 시스 .

청 2

1 에 어 ,

상 (e) 단계 처리에 어 , 태 별 여, 미 갖는 만 상 에 고,

미 갖지 는 상 에 지 고 링 는, 어 시스 .

청 3

2 에 어 ,

상 미 갖는 사, 사, 동사 포 ,

상 미 갖지 는 사, 어미 포 는, 어 시스 .

청 4

2 에 어 ,

상 에 지 고 링 고 여, 상 어미 는 말 보

는, 어 시스 .

청 5

1 에 어 ,

상 (d) 단계에 어 , 상 연 규칙 니 계 습에

습 는, 어 시스 .

청 6

1 에 어 ,

상 (e) 단계 는 에,

등록특허 10-1937778

- 3 -

Page 4: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

(e') 상 시스 카 가, 상 사 가 얼 식 여 상 사 감 상태

고, 상 에 시에 고 는 단계

포 는, 어 시스 .

청 7

1 에 어 ,

상 1 순 신경망 상 2 순 신경망 LSTM(Long-Short Term Memory) , 어 시스

.

청 8

공지능 계 습(machine-learning) 어 시스 ,

수집 는 수집 ;

상 수집 심층 신경망(deep neural network)에 수 는 상태 태 별 누어

여 처리 는 처리 ;

상 처리 태 별 신경 상(neural representation) 습 는 습 ;

상 연 각각 미 지식(semantic knowledge) 도

계 습 는 ;

사 건 , 상 사 태 별 여 는 ,

1 순 신경망(RNN; Recurrent Neural Network) , ;

상 에 답 생 는 , 상 에 생 태 별 여 상

답 생 는 2 순 신경망 ,

포 는, 어 시스 .

청 9

8 에 어 ,

상 처리에 어 , 태 별 여, 미 갖는 만 상 에 고, 미

갖지 는 상 에 지 고 링 는, 어 시스 .

청 10

9 에 어 ,

상 에 지 고 링 고 여, 상 어미 는 말 보

는, 어 시스 .

청 11

8 에 어 ,

상 처리에 어 , 상 연 규칙 니 계 습에

습 는, 어 시스 .

청 12

8 에 어 ,

상 사 가 얼 식 는 카 포 고,

상 식 얼 상 사 감 상태 고, 상 에 시에 고 는,

어 시스 .

등록특허 10-1937778

- 4 -

Page 5: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

청 13

1 내지 7 어느 에 재 , 컴퓨 여 수 도 는 그 컴퓨

독 가능 매체.

본 계 습 술 여 습 공지능 에 트 어 실시간 주고 수 는[0001]

시스 과 매체에 것 다.

경 술

사 같 상 는 공지능 만드는 것 공지능 들 꿈 었다. 그 꿈 지[0002]

지도 링 스트 통 어지고 다. 링 스트 계가 생각 수 는지, 지능 는지 단

는 스트 , 재 고 는 상 가 컴퓨 지 사 지 수 없 링 스트 통과 것

여 , 컴퓨 가 간 같 지능 가지고 다고 다.

시 에 사 고 는 많 들 는 에 는 답변만 는 시스 었다[0003]

근 공지능, 러닝 사 같 연 답 가능 들 생겨 고 다.

순 신경망(Recurrent Neural Networks; RNN) 신경망(Deep Neural Networks; 심층 신경망) [0004]

식, 연 언어 처리 등 순차 처리 는 큰 공 가 다. 근 순 신경망 -

(seq2seq) 었는 계 역에 뛰어 능 보 다. 그뿐만 니 ,

seq2seq 간 수 거쳐 QA 도 사 었다.

결 는 과

에는, 규칙 고리 여 매우 큰 리 검색 는 가 루어 다.[0005]

, 리 내에 어 지 에는 답 수 없다. , 스트 그 리에

에 어 다 에 강건(robust) 지 못 다는 가 다.

과 결 수단

본 에 , 공지능 계 습(machine-learning) 어 시스 [0006]

, (a) 상 시스 수집 가, 수집 는 단계; (b) 상 시스 처리 가, 상 수집

심층 신경망(deep neural network)에 수 는 상태 태 별 누어 여 처

리 는 단계; (c) 상 시스 습 가, 상 처리 태 별 신경 상(neural

representation) 습 는 단계; (d) 상 시스 가, 상

연 각각 미 지식(semantic knowledge) 도 계 습 는 단계; (e) 상 시스

가, 사 건 , 상 사 태 별 여 는

단계 , 상 는 1 순 신경망(RNN; Recurrent Neural Network) , 단계; (f) 상 시스

가, 상 에 답 생 는 단계 , 상 는 상 에 생 태

별 여 상 답 생 는 2 순 신경망 , 단계 포 는, 어 시스

공 다.

직 게는, 상 (e) 단계 처리에 어 , 태 별 여, 미 갖는 만 상 에 [0007]

고, 미 갖지 는 상 에 지 고 링 다.

직 게는, 상 미 갖는 사, 사, 동사 포 , 상 미 갖지 는 사, 어[0008]

미 포 다.

직 게는, 상 에 지 고 링 고 여, 상 어미 는[0009]

말 보 다.

등록특허 10-1937778

- 5 -

Page 6: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

직 게는, 상 (d) 단계에 어 , 상 연 규칙 니 연[0010]

습 다.

직 게는, 상 (e) 단계 는 에, (e') 상 시스 카 가, 상 사 가 얼[0011]

식 여 상 사 감 상태 고, 상 에 시에 고 는 단계 포 다.

직 게는, 상 1 순 신경망 상 2 순 신경망 LSTM(Long-Short Term Memory) 다.[0012]

본 에 , 공지능 계 습(machine-learning) 어 시스 , [0013]

수집 는 수집 ; 상 수집 심층 신경망(deep neural network)에 수 는 상태

태 별 누어 여 처리 는 처리 ; 상 처리 태 별 신경 상(neural

representation) 습 는 습 ; 상 연 각각 미 지식

(semantic knowledge) 도 계 습 는 ; 사 건 , 상 사

태 별 여 는 , 1 순 신경망(RNN; Recurrent Neural

Network) , ; 상 에 답 생 는 , 상 에 생

태 별 여 상 답 생 는 2 순 신경망 , 포 는, 어 시

스 공 다.

직 게는, 상 처리에 어 , 태 별 여, 미 갖는 만 상 에 [0014]

고, 미 갖지 는 상 에 지 고 링 다.

직 게는, 상 에 지 고 링 고 여, 상 어미 는[0015]

말 보 다.

직 게는, 상 처리에 어 , 상 연 규칙 니[0016]

연 습 다.

직 게는, 상 사 가 얼 식 는 카 포 고, 상 얼 식 상[0017]

사 감 상태 고, 상 에 시에 고 다.

본 에 , 술 , 컴퓨 여 수 도 는 그 컴퓨 독 가능 [0018]

매체가 공 다.

본 어 주 에 사 과 공지능 에 트가 눌 수 는 시스 [0019]

공 다. 시스 태 릿, 드폰 등에 내 어 사 수 , 실시간

가 루어지는 특징 가지고 다. 규칙 시스 과는 달리 다 질 에 답변 가능

단어 상(Representation) 습 통 미(Semantic) 보 고 여 답 생

에 보다 다 사 수 다.

계 습 고리 습 공지능 에 트 실시간 수 수 , 습 어 지 [0020]

질 에 도 에 트 체 여 답변 수 고, 스트 실수 태 (Distributed

Representation) 에 어 다 에 도 강건 게 수 다.

, 시 리에 는 식 니 에 욱 많 습시 도 시스 차지 는[0021]

크 는 크게 늘어 지 는다.

도 간단

도 1 본 에 도 타낸다.[0022]

도 2는 본 에 수집 에 개 도 다.

도 3a는 가 경 사 실험실 습 다.

도 3b는 본 시스 탑재 과 사 상 ( ) 는 습 다.

도 4는 본 에 시스 개 타낸다.

도 5는 어 는 타낸다.

등록특허 10-1937778

- 6 -

Page 7: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

도 6 어 는 타낸다.

도 7 어 는 타낸다.

도 8 어 는 타낸다.

도 9는 본 에 시스 처리 타낸다.

도 10 값과 값 계 타내는 도 다.

실시 체 내

, 도 참 여 본 에 시스 다.[0023]

도 1 본 에 도 타낸다.[0024]

본 고리 랫폼(PC, , 스마트폰 등)과 사 직 여 (demonstrate)[0025]

수 다. 들어, 고리 컴퓨 에 실 고 다 컴퓨 직 키보드 통 수 고,

랫폼에 실 는 경우에는 식 술, 스 치 스트(Speech-To-Text), 스트 스 치

(text-to-Speech), 통신 술과 께 여 시스 수 다.

단계 102에 , , 사 과 사 사 에 루어질 수 는 들 수집 여, 뉴럴 트워크[0026]

(Deep Neural Network)에 태 처리 다. 처리 는 후술 는 워드 , 리트

드(pre-trained) 워드 수 다. 러 수집 본 시스 수집 에 진다.

단계 104에 , 수집 여 각 단어 뉴럴 상(Neural Representation) 습 다. 는 본[0027]

시스 습 에 진다.

단계 106에 , 연 , 각각 미 지식(Semantic Knowledge) 다. 는 본[0028]

시스 에 진다.

단계 108에 , 사 가 에게 어 건 , 단계 110에 , 고리 단계 102 내지 단계 106에[0029]

지식 여 고 다. 는 본 시스 에 진다.

단계 112에 , 그 결과 가 답 생 고, 그 여 새 운 생 [0030]

간다. 는 본 시스 에 진다.

도 2는 본 에 수집 에 개 도 다.[0031]

술 같 , 본 고리 랫폼(PC, , 스마트폰 등)과 사 직 여 [0032]

수 다. 들어, 고리 컴퓨 에 실 고 다 컴퓨 직 키보드 통 수

고, 랫폼에 실 는 경우에는 식 술, 스 치 스트, 스트 스 치, 통신

술과 께 여 시스 수 다.

과 에 , 사 과 사 사 (도 2에 Person A(201) Person B(202) 사 살 시 ), 사[0033]

(201)과 공지능 스(203) 사 가 여러 는 것 , 러 가 어

(204) 게 다. 특 , 후술 겠 , 어는 에 어 어 등과 차 갖는

므 , 러 에도 어 ( , 어 ) 다.

게 수집 어 (204) 여 러닝 (205) 다. 게 [0034]

(205) 고 어 것 니 , 술 사 들(201, 202) 사 사 (201)과 공 지능

스(203) 사 에 에 가 가 , 다시 드 재차 복 습

루어지 보 다.

수집 는 것 에 다. [0035]

- 시 리 - [0036]

상 첫 단계 , 돌보 침 상 시 리 보 다. 돌보 침 상[0037]

상 보다는 보다 고 간단 들 가지만 엄마 역 신 는 과 계 상

다는 에 는 시 리 생각 수 다. 본 들 돌보 침 시 리

크게 (1) 상, (2) 침 운동, (3) 침 식사, (4) , (5) , (6) 등 6가지 누었다. 그리

등록특허 10-1937778

- 7 -

Page 8: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

고, 보다 연스러운 실 가 경 사 실험실 꾸미고 식과 스트 스 치

(text-to-speech; TTS) 술 여 과 사 상 수 는 경 만들었다.

도 3a는 가 경 사 실험실 습 다. [0038]

도 3b는 본 시스 탑재 과 사 상 ( ) 는 습 다.[0039]

- 수집 - [0040]

시 리 수집 간단 수 는 만들 가 었다. 30[0041]

상 사 10,000여개 수집 다. 복 는 고, 수

는 다 게 각 사 들 6개 시 리 에 당 어 300 , 체 시 리 에

300 만들도 다. 각 가 질 꺼내고 그에 답

도 어 다. 가지고 만든 후, 어, 등에 시연

그 통 계 새 운 수집 다.

- 실험 - [0042]

에 는 결과가 지 지 단 수 는 근거가 재[0043]

어 다. , 실 실험 결과 시 고 그에 도 다.

- 돌 시 리 - [0044]

가 본 는 시 리 다 과 같 가 여 후, 다 실험 시도 다. [0045]

에 BOT 본 에 공지능 에 트 타내고, CHILD는 사 ( ) 타낸다.[0046]

BOT: 침 어[0047]

CHILD: 주 어[0048]

BOT: 그 니[0049]

CHILD: 워 새벽에 어[0050]

BOT: 런 못 겠 [0051]

CHILD: 니에 어 께[0052]

BOT: 거실 가 침 체 같 볼[0053]

BOT: 고 [0054]

CHILD: 고 갈께[0055]

BOT: 엄마는 식사 고 게[0056]

CHILD: [0057]

BOT: 어 고 침 [0058]

CHILD: 지 찬 다[0059]

BOT: 계 도 니 맛 게 [0060]

CHILD: 맛 겠다[0061]

BOT: 그럼 맛 게 어[0062]

CHILD: 맛 없어[0063]

BOT: 도 어 게 수 는걸[0064]

CHILD: 싫어[0065]

BOT: 다 그러는 거[0066]

CHILD: 었습니다[0067]

등록특허 10-1937778

- 8 -

Page 9: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

BOT: 갈 고 갈 [0068]

CHILD: 슨 [0069]

BOT: 우니 지 는게 어[0070]

CHILD: 지에 색 티 츠 고 싶어[0071]

BOT: 그 다 챙겼니[0072]

CHILD: 공 어 어[0073]

BOT: 어 산 공 말 는거지 같 찾 보[0074]

CHILD: 찾 어[0075]

BOT: 다 니 에 가 지[0076]

CHILD: 다 겠습니다[0077]

BOT: 그 건 차 심 고[0078]

CHILD: [0079]

- 시 리 내 가능 -[0080]

째 실험 는 같 침 돌보 시 리 에 생 수 는 스크립트 실험 보 다.[0081]

에 * 시는 , ** 시는 매 지만 지는 , *** 시는 [0082]

미 다.

* CHILD: 어[0083]

* BOT: 지 신[0084]

*** CHILD: 가 지[0085]

*** BOT: 엄마 말 들어 진짜 고마워[0086]

*** CHILD: 운동[0087]

*** BOT: 어 리 고 [0088]

** CHILD: 늘 운동 [0089]

** BOT: 늘 겠습니다[0090]

* CHILD: 고[0091]

* BOT: 심 었니[0092]

* CHILD: 주[0093]

* BOT: 니 엄마가 곤 단다[0094]

** CHILD: 언 어[0095]

** BOT: 엄마는 게[0096]

*** CHILD: 심 뉴 에[0097]

*** BOT: 그 게 맛 어[0098]

* CHILD: 늘 심 [0099]

* BOT: 돈 스[0100]

* CHILD: 다 었어[0101]

등록특허 10-1937778

- 9 -

Page 10: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

* BOT: 게 었니[0102]

*** CHILD: [0103]

*** BOT: 그 고 [0104]

** CHILD: 귀찮[0105]

** BOT: 그러니[0106]

* CHILD: 트 [0107]

* BOT: 겨울 에 거[0108]

* CHILD: 경 어 어[0109]

* BOT: 에 없니[0110]

* CHILD: 갔다 게[0111]

* BOT: 다[0112]

* CHILD: 다 게[0113]

* BOT: 다 거 차 심 고[0114]

실험 결과, 본 시스 , 같 맥 다 어느 도 수 다는 것 수 었다.[0115]

결과에 , 수 는 는 침 돌보 시 리 뿐 는 , 그리고, 도 지만

여 역에 습 가능 어 다는 수

었다. 그러 , 계 습(machine-learning) 특수 고 , 상 같 결과가 다고는

볼 수 없다. 그 동 과 질에 에 달 질 수 다.

량 많 질수 상 에 ** 시( 매 지만 지는 ), *** 시(

) * 시 같 어 갈 것 , 본 실시 에 든 10000 는 300 보다는

많 다고 수도 것 다.

, 규칙 에 는 가능 연 가 가능 다는 것 수 었다.[0116]

도 4는 본 에 시스 개 타낸다.[0117]

본 seq2seq (시퀀스- -시퀀스 워크, - )에 다. seq2seq [0118]

개 RNN(순 신경망; Recurrent Neural Network) 어 는 , 첫 째 RNN 단어

단 쪼개어 는 업 다. 째 RNN 단어

여 만든다. 감독 습 , 었 진

도 습 다.

도 4 참 여 과 다시 다.[0119]

, 본 가 도수 상 n개 단어들 룩업(lookup) 에 등 다. [0120]

사 는 RNN 든 드 수 동 다. , Long-Short Term Memory(LSTM) 사 는

, LSTM에 는 에 당 는 각 단어별 쪼개어 는다. ( 든 단

어) 었 는 거친 든 상태 가 게 는

다.

도 4에 는 LSTM에 "엄마, 말 사 " 는 는 가 타 다. 단어별[0121]

뉘어 [엄마], [ 말], [사 ]가 에 다. 는 에 든 상태

다.

는 든 상태 단어 다. 도 4 에 는 [ ], [ 겠는 ] 는 단어가[0122]

는 것 어 다. 각 들 softmax 수 체 연결층(fully-connected

layer) 통 계산 다. 는 워드 업 트 습 다.

도 5는 어 는 타낸다.[0123]

등록특허 10-1937778

- 10 -

Page 11: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

도 5에 , 측 러닝 고리 에 "Hello, how is the weather today?" 는 다. [0124]

경우, 어 어쓰 단 어 처리 다.

, 측 러닝 고리 에 "Hello", "how", "is", "the", "weather", "today?" 어 처리[0125]

다.

그리고, 측 러닝 고리 에 는 "Yeah,", "Great!" 는 어쓰 단어가 어 "Yeah, Grea[0126]

t!" 는 게 다.

도 6 어 는 타낸다.[0127]

도 6에 , 측 러닝 고리 에 " , 늘 참 지?" 는 다. 에 는[0128]

사 는 타 어미 등 사 지 계 , 도 5에 든 어 과 마찬가지 어쓰

단 어 처리 든 태 단 처리 든 동 결과 낳는다.

, 측 러닝 고리 에 " ,", " 늘", " ", "참", " 지?" 어 처리 다.[0129]

그리고, 측 러닝 고리 에 는 " ,", " !" 는 어쓰 단어가 어 " , !" 는[0130]

게 다.

도 5, 도 6만 보 , 어 어 차 는 동 보 지만, 는 도 6에 든 어 에 사 [0131]

는 타 어미가 사 지 , 러 어에 것 고 보 는 들

것 다.

도 7 어 는 타낸다.[0132]

도 7에 , 측 러닝 고리 에 " 늘 가 참 것 같죠?" 는 [0133]

다. 에 는 사 는 타 어미 등 사 어 는, 도 5에 든 어 는

도 6에 든 어 과는 다 상 다.

어에 능통 사 보 에는 도 6에 든 " , 늘 참 지?" 도 7에 든 "[0134]

늘 가 참 것 같죠?" 는 큰 차 가 없는 것 느 수 , 공지능 에

는 매우 다 것 들여질 것 다. , 어에는 슷 미 가지고 다 변

재 다. 도 6 시 과 도 7 시 , 사 지만 다 단어들 질

에, 컴퓨 ( 공지능)에게는 도 6 시 도 7 시가 같 질 지 들 수 다.

어쓰 경우에, ' 늘'과 ' 늘 ' 컴퓨 가 에는 다 단어 다.

도 8 어 는 타낸다.[0135]

도 8에 는, 어쓰 러닝 고리 ( 측)에 는 것 니 태 단 리 [0136]

후에 다.

, " 늘 가 참 것 같죠?"가 도 7에 는 " ", " 늘 ", " 가", "참", "[0137]

", "것", "같죠?" 리 어 러닝 고리 에 것과는 달리, 도 8에 는 " ", " ", "시",

"어 ", " 늘", " ", " ", "가", "참", " ", " ", "것", "같", "죠" 고 태 단 리 여 러

닝 고리 ( 측)에 다.

같 , 태 고리 에 " " + " 늘" + " " + "참" + " " 타 는 [0138]

본 들 수 다. 태 습 경우, 어쓰 단어별 습 에

훨 상(Representation) 습 가능 다. 컨 , 도 8에 /NNG는 사 타내고, /EC는

어미 타내고, /JKS /JX는 사 타내는 것 수 다.

만 도 습 었 경우, 도 8에 색칠 어 지 태 들( 컨 , " ", "시", "어[0139]

") 미에 는 별 지 는다는 것 고, 고 결과에 큰 치

지 도 상(Representation) 습 다. 그리고 다 변 에 처 가능 다. , 같

여 상 미가 없는 태 들 직 링 수도 다. 다만, 미가 없다는 것 , 실질

내 우 는 것 니 식 사 (말 등) 결 다는 것 , 경우에 는

에 보가 므 쓸 없 진다는 것 니다.

도 9는 본 에 시스 처리 타낸다.[0140]

등록특허 10-1937778

- 11 -

Page 12: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

도 4에 어 에 " 침 어 " 고 가 . 도 8과 여 [0141]

에 , 컨 " 침", " ", " ", " 어 ", " " 태 수 다. 들 각각

사, 어미, 사, 동사, 어미 수 고, 미 갖는 태 ( 사, 사, 동사 등) 미 갖지

는 태 (어미 등) 낼 수 다. 에 미 갖는 " 침", " ", " 어 " 다.

미 갖지 는 " ", " " 에 지 수도 다. 다만, " ", " " 그냥

지는 것 니고, 다 , 에 답(후술 ) 말 는 에 수도 다.

도 4 에 " 침", " ", " 어 "가 다고 가 . " 침" 시스 X1 상태가[0142]

다. 그에 어 " "가 시스 X2 상태가 다. 게는 " 침"에 어 " "가

것( , " 침" " "가 순차 것)에 상태가 X2 다. 그에 어 " 어 "가

( , 게는 " 침", " ", " 어 "가 순차 ) 시스 X3 상태가 다. " 어 " 에

는 타내는 ( 컨 , End of Sequence; EoS)가 재 여 말 마쳤 미 다고 가 .

그러 , 시스 상 처리 여, 다 단어( , 답 첫 째 단어) " "가 다[0143]

고 단 다. 는 러닝 등 습에 도 는 결과 다. 상태는 X4 다. X4는 "

침", " ", " 어 ", 타 " "(답 미 ) 지 고 상태 말 다. X4 상태에 직 답

지 고, 그 후에는 "주 어 "가 어 다고 단 다. 러닝 등 습에 도

는 결과 다. 상태가 X5 , 답 단 다. 그러 , 시스 에 "

주 어 " 다.

편 상, 답 말 (어미 등)에 는 별도 언 지 , " 침 어 "에 [0144]

링 었 " ", " " 감 여 답 말 결 는 에 참 여도 다. 컨 , - 에

는 " 침", " ", " 어 "가 , " ", "주 시"가 고, 에 별도 어미

가 여 " ", "주 시었어 (주 어 )" 여도 다.

도 10 값과 값 계 타내는 도 다.[0145]

식 값과 값 계 시 리에 다. , 매 재[0146]

다. A 는 질 에는 B 는 답변 다는 식 값과 값 매 어 는 것 다. 러

결 지(fuzzy) 식 과 도 , 과

시키는 것 니지만, 과 간에 계가 다.

, 매 , 스에 A1~A100 가 고 스에 B1~B100 가 [0147]

다 A1 B1에 , A2는 B2에 , ... A100 B100에 는 식 미리 는 것 다. 지

식 매 과는 다 다 게, A1 는 에 드시 B1 답 는 것 니다. 다만,

지 식도, A1 는 에 B1 가능 상당 고, 낮 B1 닌 다

도 것 다.

컨 , A1 " ", B1 " " 고, 사 에 매 어 다 , 사 공지능 에 트에게[0148]

" "( , A1) 고 말 걸 , 공지능 " "( , B1) 고 답 도 어 는 것 매

다.

는, 사 공지능 에 트에게 " "( , A1) 고 말 걸 , 공지능 " "( , B1) 고[0149]

답 90% 고, " , 니"( , B2) 고 답 10% 도 어 다 , 는 지

식 고 볼 수도 다.

그러 , 본 A1 는 에 어 것 지 미리 지 다. 러닝 고리[0150]

에 값(A set; A1~A100) 고, 값(B set; B1~B100) 다. , 실

보 어 질 ( )에 는 어떻게 답( ) 는지 습 다. 편 상, '질 ', '답' 고

, 가 드시 질 과 답 태는 니므 는 미 수 것 다.

, A1 는 것 드시 단어 미 는 것 니고, 미 단 ( , 등)가 수도

다.

본 에 는, A1 는 ( )에 B1 는 ( ) 미리 는 것 니 , [0151]

에 A1 는 질 에 B1 는 답 많 A1 에 B1 도 습 다. 에

, A1에 B1 는 시 매 수는 , 는 에 습 계

등록특허 10-1937778

- 12 -

Page 13: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

루어지 얼마든지 수 다. , 특 어 가 에 민감 경우에는 특 시 에는 매 값 달

질 수 다. , 근에 에 가 치 어 과 매 습 도 ,

에 민감 가 루어질 수 다. 컨 , 미 그 능 그 에 특 어 가

어 많 쓰 는 경우 , 에는 A1 질 에 B1 는 답 많 것 특 시 에는 A1

질 에 B10 는 답 많 수 것 다. 는, 드시 어 감 것 니 도, 시간

에 는 가 커감에 실생 에 주 사 는 상 어 에 다 변 가 수도

감 수도 것 다.

, 만 고리 , 갯수 매 도 습시키 , 에 A1에 B1 는 답 [0152]

것 900개 고, A1에 B10 는 답 것 100개 , A1→B1 매 가능 것 다. 그

지 고, 고리 , 갯수 뿐만 니 , 근 지 여 ( 시 )도 삼도 매

시키 , 갯수 생각 A1→B1 매 여 지만, A1에 B10 는 답 것 체

상 900개 보다 근 갯수가 다 도 A1→B10 매 에 어, 어도

재 는 A1 는 질 에 B10 는 답 도 매 수 것 다. 러 매 는

것 니 , 습 가 가 에 얼마든지 수 것 다.

다만, 본 에 습에 매 지만, 규칙 매 (가 극단 는, 매 )[0153]

는 것 니다. 러닝에 습만 매 는 경우, 틀리 치 수 는

질 에 답 는 경우에 험 수 므 , 규칙 매 다 가미 여 어느 도

(boundary) 내에 습 도 수 것 다.

편, 본 에 여, 리트 드 워드 (pre-trained word embedding) 수도 다. [0154]

, 워드 에 다.[0155]

는 스트 처리 는 공 신경망 개 층 어 다. 말 치(corpus) [0156]

말 치 단어 는 찾는 , 값 말 치에 단어가 가지는 미 역

주는 값 어 다. 게 단어 미 맥 고 여 단어 것 워드

(word embeddings) 고 , 심층 신경망(deep neural network) 처리 단계 쓰 수 다. 러

처리는 도 1 단계 102과 여 언 처리에 당 수 다.

리 , 각 단어마다 단어에 당 는 고, 다시 심층 신경망(deep neural network)에[0157]

집어 어 가 수도 고 단어 사 등 계 수 다.

스트 여, 컨 , 단어간 사 수 다. 원 워드 ,[0158]

사 단어 수 가 운 거리에 치 도 각 단어에 당 는 값 찾는 것 다. 습 사

여 지 말 치 만 사 다.

워드 단어 미 게 다. 그리고 단어[0159]

뿐만 니 여러 단어 계 낸다. 들어 단어 계 ‘ ’:’ ’ = ‘여

’:x 같 계식 주 x=’ ’ 는 답 수 다. 단어 뿐만 니 큰 단 스트

는 에도 워드 사 다. 들어, 집 에 결과 검

색 엔진에 별 검색(과 , , 경 등) 감 , 천 시스 만들 수 다.

, 가 주어지 , 당 습 통 , "스웨 " 는 단어에 " 웨 ", "[0160]

마크", " 드", "스 스", " 에", " 드", " 슬 드", "에스 니 ", "슬 니 " 등 럽,

스칸 도 가들 사도가 것 미리 수 다.

러닝에 사 는 신경망과 연결 통 , 말 치 에 는 단어 단어 계 [0161]

단어 미 습 다. 주변 단어가 만드는 맥 타겟 단어 측 수도 고, 단어

주변에 수 는 단어 측 수도 다.

, 본 에 여, 티 루 (multi-resolution) 수도 다. [0162]

단어 상(word representation) 습 , 어 경우는 어쓰 , 경우는 태 단 [0163]

에 상 습 는 것 상 수도 지만, (character) 단 , + +( ) 단

습 수도 다. 들어, " 늘 가 참 것 같죠?" 습 , + + + +

등록특허 10-1937778

- 13 -

Page 14: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

+ +늘+ +...+같+죠+? 고 여 습 수도 고, ㅇ+ㅏ+ㄴ+ㄴ+ㅕ+ㅇ+ㅎ+ㅏ+ㅅ+ㅔ+ㅇ+ㅛ+ㅇ+ㅗ+ㄴ+

ㅡ+ㄹ+ㅇ+ㅡ+ㄴ+...+ㄱ+ㅏ+ㅌ+ㅈ+ㅛ+? 고 여 습 수도 다. , 단어/ / 습

는 어느 것 가 상(representation) 습 지는, 습 보 에 는

들지만, 에 여러 다 청킹 식( , multi-resolution) 시도 여 그 가 고 수

다.

, 본 에 여, 카 미지 보 시각 시 수도 다. 본 는 [0164]

다수 시 고, 각 태 단 고 그 만들고 그 미

는 것 지만, 그에 가 여 는 사 얼 에 보 가 공 여 수도 다.

, 같 말 지 도 웃 담 는 경우가 고 색 고 진지 게 는 경우가 는 ,

는 만 는 든 경우가 다. , 어 (tone, intonation) 참고 수도 것 다.

그러 , 시각 보가 가 는 경우 그 욱 수 것 다. 러 시각 보는

식 술, 식 술에 얻 수 고, 당 에 감 고 여 어 갈 수

도 수 것 다.

사 얼 식에 사 는 Gabor LBP(Local binary pattern) 드 드에 수[0165]

도 러리(Library) 태 여 수도 다. 카 (Live Filter) 통

리뷰 미지 여 얼 검 고, 얼 , 얼 에 눈, 치 가능 도

다. 스에 지 는 공개 트웨어 러리 OpenCV 등 얼 식 도 개

가능 다. OpenCV에 공 는 C언어 얼 식 드 드 드 포 거 NDK 변

여 사 는 것도 가능 것 다.

본 PC 상에 , 스마트 (스마트 드, 스마트폰) 상에 , 는 별도 독립 ( 등) 상에[0166]

수 것 다.

에 는 특 들어 , 본 상 실시 에 지 , 당 통상 지식[0167]

가진 에 여 많 변 첨 특허청 에 재 본 본질 사상 내에 가능

다. 본 본 사상 어 지 는 , 그 다 변 도 본 주에 는 것 보

것 다.

201: 사[0168]

202: 사

203: 공지능 스

204: 어

205: 러닝

등록특허 10-1937778

- 14 -

Page 15: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

도 1

도 2

등록특허 10-1937778

- 15 -

Page 16: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

도 3a

도 3b

도 4

등록특허 10-1937778

- 16 -

Page 17: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

도 5

도 6

도 7

도 8

등록특허 10-1937778

- 17 -

Page 18: (19) 대한민국특허청(KR) (12) 등록특허공보(B1) · 2019. 2. 2. · (54) 발명의 명칭 인공지능을 이용한 기계학습 기반의 한국어 대화 시스템과

도 9

도 10

등록특허 10-1937778

- 18 -


Recommended