+ All Categories
Home > Documents > 온톨로지(Ontology) · 2020-05-22 ·...

온톨로지(Ontology) · 2020-05-22 ·...

Date post: 05-Jul-2020
Category:
Upload: others
View: 0 times
Download: 0 times
Share this document with a friend
11
수년 전 온톨로지라는 말을 웹과 관련하여 처음 들었을 때 제일 먼저 생각 이난것은듀이십진분류법이었다. 그중에서도‘100 철학’의하위주제인‘형 이상학’아래위치한분야인‘ontology’즉, ‘존재론’이었다. 그러나이용어 가 우리 분야에서 언급되면서 철학에서 말하는 존재론을 의미하지는 않을 것 같았고, “대체 뭘까?”하는 호기심도 생겼지만, 선뜻 자료를 찾아서 공부할 마 음이 생기지는 않았다. 그 이유 중 하나는 온톨로지는 거의 항상 시맨틱 웹 (Semantic Web) , RDF (Resource Description Framework: 자원기술구조) , OWL Web Ontology Language 등과 같이 이해하려는 대상보다 더 어려운 다른 용어들 과 같이 나오는 것이다. 그 이외에도 해석은 되지만 의미가 와 닿지 않는 생소 한 용어들이 설명의 대부분을 차지하니, 어디부터 시작해야 좋을지 엄두가 나 지 않았던 것이다. 또 어쩌다 큰 마음을 먹고 몇몇 자료를 살펴본 결과는“한 글이 이렇게 어려울 수도 있구나”하는 좌절감이 들거나, “왜 글을 쓰면서 읽 는 사람이 이해하기 쉽게 쓰지 않는 것일까?”하는 애꿎은 저자에 대한 원망과 동시에 괜한 열등감에 빠지는 것이었다. 사실 국내 학술지에 수록된 대다수 연구논문들은 온톨로지가 무엇인가를 다루기보다는“온톨로지를 적용한 결과가 이렇다”또는“온톨로지를 이러한 분야에 저렇게 응용해 보았다”라는 내용을 주로 다루고 있다. 말하자면 독자 들이 온톨로지가 무엇인지는 알 것이라는 전제로 연구의 결과를 보고하는 것 이기 때문에 교과서와 같이 일일이 그 개념을 설명해 주지 않는다. 그러다보 니 실무에 종사하는 일반 독자들은 온톨로지의 기본 개념이 무엇인지를 정확 알기 어렵고, 그런 논문을 아무리 열심히 읽어 보아도 그 내용을 이해하기 어려울 수밖에 없다. 하지만 천리 길도 한 걸음부터라고, 일단 기본이라도 이 온톨로지(Ontology) 지상(紙上) 블로그 정보학박사 한국도서관협회 평생회원 (주)아이리스닷넷 대표 [email protected]
Transcript
Page 1: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각

이난것은듀이십진분류법이었다. 그중에서도‘100 철학’의하위주제인‘형

이상학’아래위치한분야인‘ontology’즉, ‘존재론’이었다. 그러나이용어

가우리분야에서언급되면서철학에서말하는존재론을의미하지는않을것

같았고, “대체뭘까?”하는호기심도생겼지만, 선뜻자료를찾아서공부할마

음이 생기지는 않았다. 그 이유 중 하나는 온톨로지는 거의 항상 시맨틱 웹

(Semantic Web), RDF(Resource Description Framework: 자원기술구조), OWL Web

Ontology Language 등과같이이해하려는대상보다더어려운다른용어들

과같이나오는것이다. 그이외에도해석은되지만의미가와닿지않는생소

한용어들이설명의대부분을차지하니, 어디부터시작해야좋을지엄두가나

지않았던것이다. 또어쩌다큰마음을먹고몇몇자료를살펴본결과는“한

글이이렇게어려울수도있구나”하는좌절감이들거나, “왜글을쓰면서읽

는사람이이해하기쉽게쓰지않는것일까?”하는애꿎은저자에대한원망과

동시에괜한열등감에빠지는것이었다.

사실국내학술지에수록된대다수연구논문들은온톨로지가무엇인가를

다루기보다는“온톨로지를적용한결과가이렇다”또는“온톨로지를이러한

분야에저렇게응용해보았다”라는내용을주로다루고있다. 말하자면독자

들이온톨로지가무엇인지는알것이라는전제로연구의결과를보고하는것

이기때문에교과서와같이일일이그개념을설명해주지않는다. 그러다보

니실무에종사하는일반독자들은온톨로지의기본개념이무엇인지를정확

히알기어렵고, 그런논문을아무리열심히읽어보아도그내용을이해하기

어려울수밖에없다. 하지만천리길도한걸음부터라고, 일단기본이라도이

온톨로지(Ontology)

지상(紙上) 블로그

정보학박사한국도서관협회 평생회원

(주)아이리스닷넷 대표

[email protected]

Page 2: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

해해보겠다는마음으로여기저기에서찾아보니제법온톨로지에관한얘깃거리가생겨나는것같다.

그결과로이글에서는온톨로지의기본개념을이해하는데도움이되는몇가지주제를다루어보기

로하였다. 먼저온톨로지라는용어가사용되기시작한역사를살펴보고, 자주인용되는온톨로지의몇

가지정의를비교하며생소한용어를하나씩풀어서설명하였다. 그럼에도개념을이해하기가쉽지않으

므로우리에게비교적친숙하고종종온톨로지의한종류라고일컬어지기도하는시소러스와온톨로지

를비교하여개념에좀더다가가도록시도하였다. 마지막으로온톨로지종류에대한몇가지분류를소

개하여개별온톨로지간의관계를정리해보았다.

온톨로지의역사

온톨로지라는 용어는 상당히 오랫동안 사용되어 왔다. 예를 들면, 웹스터 사전은 온톨로지를 대략

1721년에출현한용어로기록하며: 1) 존재의본질과관계에관심을가지는형이상학의한분야; 2) 존재

의본질또는존재의종류에관한특정이론이라는두가지정의를제공한다. 여기에제시된추상적인철

학개념의온톨로지는점차좀더수학적이고세밀한영역(domain)으로움직였으며, 형식온톨로지(formal

ontology)라는개념은최소한1900년이래로존재해왔다.

온톨로지는이처럼원래철학의한분야였지만보다광범한분야에서수용되어왔다. 우리가이글에

서이해하려고하는세상(world) 또는 그일부분에대한지식표현(knowledge representation)의 한 형태라

는 새로운 개념의 온톨로지는 인공지능, 시맨틱 웹, 소프트웨어 공학, 생명의학정보학(biomedical

informatics), 도서관학, 정보설계(information architecture) 분야등에적용되고있다. 또한과리노(Guarino,

N.)는 지식공학(knowledge engineering), 지식표현, 정성적 모델링(qualitative modeling), 언어공학(language

engineering), 데이터베이스디자인, 정보검색과추출, 지식관리와조직등의분야에온톨로지가수용되

었다고한다1).

이렇게온톨로지라는용어가철학이외의학문분야에서본격적으로사용된것은1970년중반이후인

공지능분야의연구자들이대규모의강력한인공지능시스템을구축하기위해서는지식의획득(capturing

knowledge)이필수적이라는것을깨닫기시작하면서부터이다. 인공지능학자들은일종의자동추론을가능

하게하는전산모델(computational models)로서 새로운온톨로지들을생성할수있다고주장하였다. 그리

고1980년대에들어인공지능부문에서“모델화된세상에대한이론(theory of a modeled world)”과“지식시

스템의 한 구성요소(a component of knowledge systems)”를 지칭하기 위해 온톨로지라는 용어를 사용하기

도서관문화 Vol.50 No.10(2009.10)

Page 3: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

시작하였다2). 그러니우리가요즘듣는온톨로지의개념은인공지능분야에서시작된것이라고봐도괜

찮을듯하다.

인공지능은문헌정보학분야에도전혀새로운것은아니다. 1970년대에인공지능이활기를띠면서우

리분야에서도문헌색인을위한의미표현과지능형정보검색시스템(intelligent information retrieval systems)

이라는주제와더불어인공지능기법의적용에대한연구가유행하였으나, 1980년대말경에이르러그

추세가잠잠해졌다3). 이처럼우리분야와멀어졌다고생각한인공지능이우리에게는새로운개념인온톨

로지로문헌정보학분야에다시부각되기시작한것은근래월드와이드웹과관련하여등장한시맨틱

웹이라는새로운움직임과관련이있다고할수있다. 이시맨틱웹이란웹상의데이터나콘텐츠를응용

프로그램, 플랫폼또는영역에관계없이컴퓨터가이해하고처리하도록하자는것이다. 현재웹에서제

공하는콘텐츠는검색엔진과같은컴퓨터가검색해오지만, 컴퓨터는웹상의정보나콘텐츠를“이해”하

지못하기때문에그검색결과가부정확하거나사람이결과를보고적합성을결정하고연관자료를찾는

등의추가노력을해야한다. 따라서과거웹상의키워드일치방식을의미부여가가능한지식표현으로

컴퓨터가웹상의데이터나콘텐츠의의미를이해하도록하여웹콘텐츠에대한이용자요구를만족시키

자는움직임이다. 예를들면, 뉴욕여행에서하나씩사는티셔츠에인쇄된“I ♡New York”을사람은금

방이해하지만, 컴퓨터는알길이없는데, 이러한것을시맨택웹으로가능케하자는것이다. 좀더우리

분야에가까운예를들자면, 은행(銀行)을 검색한이용자에게은행(銀杏)에 관한자료를제공하지않게되

는것이다. 온톨로지는이러한시맨틱웹에서지식표현을가능하게해주되, 인간보다는기계가이해하

고추론할수있도록하는요소기술또는핵심기술로서근래우리의관심을끌고있는것이다.

그럼 온톨로지가 어떻게 생겼길래 이런 일이 가능할까? 어쩌면 너무 과격한 단순화일 수도 있으나,

문헌정보학의기법에비유하자면, 온톨로지는시소러스처럼문자그대로특정분야나대상을개념화해

놓은명세이다. 여기 개념화라는 말의의미는뒤에서상세히 설명한다. 물론 이와같은온톨로지가 그

자체로웹콘텐츠의의미를이해하도록하는것은아니다. 우리가시소러스도미리등록된디스크립터

를이용하여수작업으로문헌을색인하여문헌주제의상하관계등을표현한후검색시활용할수있듯

이온톨로지도컴퓨터가이해하도록표현해주는언어인RDF나OWL 등으로대상에적용되어야그빛

을발한다.

위내용의이해를돕기위하여RDF와OWL에대한간략한설명이필요하다. RDF는웹자원에관한

메타데이터를표현하기위하여W3C가개발한언어로서웹상에서“의미(semantic)”정보를손상없이응

지상(紙上) 블로그

Page 4: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

용프로그램간에상호교환할수있는공통의틀을제공하는것이다. 한편OWL은온톨로지선언문을작

성하는언어로서의미를표현하는데XML, RDF, RDFS보다적합하며, 따라서이들보다웹상의기계가

독형콘텐츠를표현하는능력이탁월하다고여겨진다. 이언어들은우리가알고있는일반프로그램언

어와는달리복잡한논리적관계를표현할수있는능력을가지며주로 XML 구문을활용한다. 위에서

OWL이RDF보다의미표현에적합하다는것은복잡한온톨로지의개념표현및논리적관계를표현하는

데좀더최적화되어있다고이해하면된다.

온톨로지란무엇인가?

온톨로지의 정의들 가운데 가장 자주 인용되는 것은“온톨로지는 공유된 개념화(shared

conceptualization)의 정형화되고 명시적인 명세(formal and explicit specification)”라는 그루버(Gruber, T.R.)의

것으로서, 그는나아가“지식의공유(knowledge sharing)와 재사용(reuse)이 가능케할목적으로”온톨로지

를만든다고하였다4). 또 위키피디아의정의를살펴보면, “전산학과정보학에서온톨로지는한영역내

에서일련의개념과그개념들간의관계에대한정형화된표현(formal representation)이다. 이는그영역의

속성에대한추론(reason)에사용되며, 그영역을정의하는데사용될수있다…하나의온톨로지는공유된

어휘(shared vocabulary), 즉한영역을모델화하는데사용될수있는어휘를제공한다. 다시말하여, 존재

하는객체(objects) 및/또는개념(concepts)의유형, 그리고그들의속성과관계를말한다”5)라고기술한다.

두정의는설명방법의함축성에차이가있을뿐, 논리학, 언어학, 철학과인공지능분야에서유래한용

어가많아이들에대한사전지식없이그의미를이해하기는어렵다. 우선“공유된(shared)”이란대상커

뮤니티및그구성원은물론컴퓨터간에도합의가되었다는의미로서우리분야의MARC포맷을생각해

보면이해가쉽다. 이는온톨로지의중요한속성으로이를통하여지식의공유와재사용이가능할것이

다. “개념화(conceptualization)”는특정목적을위하여표현하고자하는대상세계(world)에서일어나는현상

에연관된개념들을파악하기위한추상적모델(abstract model)6)을의미한다. “정형화된(formal)”이란컴퓨

터가 읽고 처리할 수 있는 기계가독형이어야 한다는 것을 뜻하고, “명시적(explicit)”이란 개념의 종류와

도서관문화 Vol.50 No.10(2009.10)

Page 5: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

그들간의관계및그개념들을사용하는데적용되는제한점들(constraints)을명백하게정의하는것을의

미한다7). 그리고“공유된어휘”란이러한영역내의개념은주로어휘로표현되기때문이다.

결국위정의를종합해보면온톨로지란특정영역이나세계를개념(즉어휘)과개념간의관계로표현한

것이다. 여기서영역또는세계는우리가도서관환경에서주로다루는특정주제분야일수도있고, 특정

업무분야일수도있으며, 이를확장하여이론적으로는세상전체가될수도있다8). 이런대상을표현하는

방법으로개념과이들간의관계를사용하는데(개념화), 이표현은사람이아닌컴퓨터가이해하도록구현

되어야한다(formal). 또한이러한관계는컴퓨터가이해하고추론을하기위하여는애매하지않고명백하

게정의해주어야하는것이다(explicit). 마지막으로이와같은절차를통하여온톨로지가구성되어도이

들이반드시가져야하는속성은“공유”이다(shared)9).

이러한설명을종합해보면온톨로지는우리가익숙한시소러스와비슷한구조또는특성을가지는것

을알수있고, 실제그모습도시소러스와매우유사하다.

시소러스는온톨로지의한종류인가?

우리가새로운대상을이해할때이미알고있는대상과비교하여유사점이나차이점을살펴보면서다

가가는것도좋은방법이다. 온톨로지는개념과그들간의관계를명시한다는점에서, 그리고개념을어

휘로표현한다는점에서그구조가정보검색분야에서60여년전부터10) 사용해오던제어어휘집(controlled

vocabulary)인시소러스와유사하다. 그렇다면시소러스는온톨로지의한종류이고, 온톨로지는시소러스

를 조금 복잡하게 만든 버전일 뿐일까? 이에 대한 답변은 단순하지 않다. 실제 웹에서‘thesaurus’와

‘ontology’를함께검색하면적지않은문헌을발견할수있으며, 그수만큼이나의견도분분하다. 근본

적으로이러한혼돈은전산및다른분야에서온톨로지라는용어를무분별하게사용한데기인한다고도

할수있다.

어쨌든앞서언급한온톨로지의정의를기반으로<그림1>의온톨로지스펙트럼을보면서결론을내리

지는못하더라도차이점이무엇인지살펴보자. 먼저온톨로지는개념과개념과의관계를통하여지식표

지상(紙上) 블로그

Page 6: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

현을한다고하였는데, 개념은흔히용어(term)로표현된다. 따라서온톨로지는용어의의미를명확히용

어명과용어의미의구체적명세를제공하는용도로사용될수도있다. 이와같이온톨로지를용어의개

념화명세라는관점에서보면<그림 1>과같은스펙트럼상에온톨로지의다양한종류를개념에따라나

열할수있다. 이스펙트럼의양극중왼쪽은의미관계(semantic relations)가미약하고, 오른쪽극은의미관

계가강한것을나타낸다. 여기서의미관계가강하고약하다는것은기계가이해하고추론하도록표현한

개념및논리관계의상세성또는정확성의정도라고보면이해하기가쉬울것이다.

이스펙트럼에서카탈로그는의미관계가제일약하게표현된가장단순한형태의온톨로지라할수있

다. 카탈로그의특정용어(예, 자동차)는동일한식별자(예, 25)를 사용하도록한다. 예를들면, 상품카탈로

그에서식별자 1은주방용품, 2는전자제품… 25는자동차인셈이다. 이관계는그카탈로그내에서는

구분이뚜렷하지만이관계로기계가의미를해석하거나단순한것일지라도추론을하기에는역부족임

을쉽게알수있다. 그다음으로용어사전(glossary)은용어와그의미를수록한리스트로서자연어설명

은사람들에게용어에대한설명을제공하므로카탈로그보다는좀더많은정보를제공한다. 하지만이

러한자연어설명은사람에게는이해가쉽지만컴퓨터에게는애매하여기계처리를위한명세로는적합

하지않다. 시소러스는이들보다는용어간의관계에약간의추가적인의미(semantics)를제공하는데, 광

의어와협의어관계를통하여계층관계를추론할수있지만일반적으로명확한계층관계를제공하지는

않는다11). 그 다음비정형(informal)“is-a”12)도 시소러스와유사하게계층관계를제공하지만, 비정형이란

표현이시사하듯이논리적으로명확한“is-a”관계는아니라는뜻이다. 다시말하여, 명확한“is-a”계

층체계에서는만약A가B의상위클래스(superclass)일때, 한객체가B의사례이면이는그객체가반드시

A의사례여야하는데이비정형“is-a”관계에서는이원칙이항상준수되지는않는다는뜻이다. 결과적

으로시맨틱웹을위한온톨로지의핵심은앞서설명한‘정형적(formal)’이란특성의기계가독성을가져

야하는데, 비정형“is-a”관계는논리적일관성의결여로기계가이해하기어렵게된다. 이와같이엄격

한하위클래스(subclass) 계층구조는프로그램에서상속(Inheritance) 원리를활용하는데반드시필요하며,

추론을가능케하므로시맨틱웹을위한온톨로지가필요로하는특징이다.

도서관문화 Vol.50 No.10(2009.10)

Page 7: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

지상(紙上) 블로그

<그림 1> 온톨로지 스펙트럼 13)

보다 확실한 이해를 위하여 계층구조에서 비형식적이라는 뜻을 예를 들어 살펴보자. 야후에서

‘apparel(의복)’은하위에‘women(숙녀)’를포함하고, 이범주는다시하위범주로‘accessories(액세서리)’

와‘dresses(드레스)’가있으며, ‘accessories(액세서리)’아래‘fragrance(향수)’가있다. 여기서‘apparel(의

복)’이‘women(숙녀)’를포함하지만, 이는정확히‘women’s apparel(숙녀복)’이어야하며, ‘women(숙녀)’

는‘apparel(의복)’의한사례가아니다. 이어서‘accessories(액세서리)’와‘dresses(드레스)’도‘women(숙

녀)’의 사례가 아니기는 마찬가지이며, 숙녀‘accessories(액세서리)’의 한 사례인‘fragrance(향수)’는

‘apparel(의복)’의사례가아니다. 이와같이전문화(specialization)된계층관계로일반화(generalization)될수

없는관계를비형식적이라하며, 이런계층관계는기계가이해하기어려울뿐아니라, 그온톨로지를공

유하는것또한문제가있다.

지금까지설명한 <그림 1>의슬래쉬(“/”) 앞부분에속하는대상을온톨로지로간주하는이는소수이며,

일반적으로 온톨로지로 간주되기 위하여는 명확한 계층관계(explicit hierarchy)를 가지는 것을 선호한다.

따라서시소러스는온톨로지의한종류인가라는초기질문에대한답은각자가결정할수있겠으나, 흔

히말하는시맨틱웹에서활용하는온톨로지의한종류로는적합하지않다고하겠다.

그럼시소러스에존재하는계층관계가명확하지못한것이우리가주로말하는온톨로지와의유일한

차이일까? <그림2>가이둘의차이점을좀더상세히보여주고있다. 온톨로지는개념표현을단순한용

어와그들과의관계보다다양한사실을표현할수있는장치를가지고있다고할수있다. 여기서다양한

사실이란개념의속성, 명확한논리적관계, 그리고이들에대한공리와원칙을정의하여복잡한의미정

보를포함할뿐아니라, 컴퓨터의자동추론과계산을가능하도록해준다.

Page 8: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

<그림 2> 시소러스 vs. 온톨로지 14)

온톨로지의분류

온톨로지라는용어가다양하고폭넓은대상(referents)에무차별하게사용되어그정확한의미전달이어

렵자“온톨로지”앞에수식어를부가하여지칭하는대상을구분하였다. 그러나, 이런명칭의온톨로지들

간의차이도구분하기어렵자이들간의특성을비교함으로써차이점을제시하기위한분류가시도되었

다. 소와(Sowa, J. F.)는 <그림 1>과유사하게의미(semantics) 표현의강도에따라온톨로지를다음세가지

로구분하였다15).

●온톨로지(Ontology): 특정도메인또는주제분야에존재하거나존재가능한엔티티종류의명세이

다. 형식적으로 온톨로지는 개념명칭(names for concept)의 집합과 유형-하위유형 관계(type-

subtype relation)에기반한일부분에대한순위화(partial ordering)로조직된관계유형들로명시된다.

한온톨로지내에존재하는일부또는모든개념과관계에형식공리(formal axiom)와정의를연관

시킬수있다.

도서관문화 Vol.50 No.10(2009.10)

Page 9: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

●용어온톨로지(Teminological ontology): 모든개념과관계가이들의활용을위한필요충분조건을결

정하는 공리(axioms)16)나 정의에 의하여 명시되지는 않는(not fully specified) 온톨로지이다. 개념은

하위유형-상위유형(subtype-supertype) 또는 부분-전체(part-whole) 관계에 의하여 부분적으로 명

시될수있으며, 이러한관계는개념사이에서특정개념의상대적위치를결정할뿐, 완전하게

정의를하지는않는다.

●공리온톨로지(Axiomatized ontology): 개념과관계가논리(logic) 또는논리로자동번역되는어떤컴

퓨터지향언어(some computer-oriented language)로선언된관련공리와정의를가진용어온톨로지

이다. 공리와정의를선언하기위하여사용되는논리의복잡성에대한아무런제한이없다.

결국소와의분류에포함된온톨로지의종류는앞선 <그림 1>에구분된온톨로지들의특정범위에명

칭을부여한것으로볼수있다. 정확하지않을수있고해석의차이가존재할수있지만, 위분류에서온

톨로지는<그림1>의카탈로그와용어사전에가깝고, 용어온톨로지는시소러스와비정형“is-a”범주에

속하는온톨로지를의미하고, 공리온톨로지가슬래쉬우측에위치한범주의온톨로지를의미한다고이

해할수있다.

반면, 팬젤(Fensel, D.)은 온톨로지의일반성수준(generality level)17)이 낮은것에서높은순으로다음네

가지로구분하고, 이외의두가지다른형태를제시하였다.

●영역 온톨로지(Domain ontology): 전자, 의학, 기계, 디지털 영역과 같이 특정 영역에만 통용되는

지식을표현한온톨로지이다.

●메타데이터온톨로지(Metadata ontology): 더블린코어와같이온라인정보원의내용을기술하기위

한어휘를제공하는온톨로지를지칭한다.

●일반온톨로지(Generic or common sense ontology): 시간, 공간, 상태, 사건등과같은사물의기본적

관념과개념을제공하는세상에대한일반지식을포함하는온톨로지이다. 결과적으로이형태의

온톨로지는여러영역에공통으로적용될수있다. 예를들면부분전체론(mereology)에관한온톨

로지는많은기술적영역에적용가능하다.

●표현 온톨로지(Representational ontology): 영역 온톨로지처럼 특정 영역을 대상으로 하지 않는다.

지상(紙上) 블로그

Page 10: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

무엇을표현해야하는지언급하지않고표현개체(representational entities)를 제공하는온톨로지이

다. 유명한표현온톨로지는그루버의 Frame Ontology으로서이는지식표현이개체지향또는

프레임기반방식으로표현가능하도록프레임, 슬럿(slots)과슬럿제약과같은개념을정의한다.

이와더불어팬젤은방법온톨로지(method ontology)와 과업온톨로지(task ontology)18)를 제시하였다. 전

자는 특정 문제해결방법(Problem Solving Methods)에 제한된 용어(terms)를 제공하고, 후자는 특정 과업에

제한되는용어를제공한다.

그밖에일반성을기준으로맨달(Mandal, C.)은최상위온톨로지(Top-level ontology), 영역온톨로지, 과업

온톨로지와응용온톨로지(Application ontology) 순으로나누었으며19), 애셔프(Aschoff, F. R.)는표현온톨로

지, 일반온톨로지, 영역온톨로지와응용온톨로지로구분하였다20). 위에제시된온톨로지형태중이글

에서는처음나온최상위온톨로지와응용온톨로지에대한설명이필요하다.

●최상위온톨로지: 이는상위온톨로지(upper ontology) 또는기초온톨로지(foundation ontology)라고

도하며, 모든영역에거쳐동일한아주일반적인개념을기술한것이다. 정확한대칭관계를이루

지는않겠지만, 영역온톨로지를우리가아는시소러스종류중특정주제분야의시소러스인마

이크로시소러스(micro thesaurus)라고한다면최상위온톨로지는모든주제를망라하는매크로시

소러스(macro thesaurus)와유사하다고하겠다. 그러나매크로시소러스가모든분야의제어어휘를

제공한다면, 최상위온톨로지는어느하나의특정문제영역에속하지않는일반개체를기술하

는개체의계층과연관법칙을기술한다는것이차이점이다. 다시말하여최상위온톨로지의가장

중요한기능은모든영역을지원하는온톨로지자체를제공하는것이아니라, 많은온톨로지들이

최상위 온톨로지“아래에서(under)”매우 포괄적인 의미 상호운용성을 가질 수 있도록 지원하기

위한것이다. 이러한온톨로지의구축이가능한가에대한논쟁은아직도진행중이다21).

●응용온톨로지: 일반성에있어가장협의적(specific) 온톨로지로서예를들면의학분야중급성방

사선증후군치료와같이특정응용분야에대한지식을표현한다.

도서관문화 Vol.50 No.10(2009.10)

Page 11: 온톨로지(Ontology) · 2020-05-22 · 수년전온톨로지라는말을웹과관련하여처음들었을때제일먼저생각 이난것은듀이십진분류법이었다. 그중에서도

이와같은온톨로지에대한구분은주장하는이에따라다소차이가있으나옳고그름을판단하기위

한것이아니다. 그러므로어느분류가가장옳은것인가를고민하기보다는앞서지적한바와같이다양

하고때로는무분별하기까지한온톨로지관련용어에대하여개념정리를시도한것으로받아들이면적

절할것이다.

결언

온톨로지라는 용어를 피상적으로 접한 초기에는“조금 복잡한 시소러스구나”라는 느낌과 더불어 수

많은전문용어로인하여혼란스러웠다. 그래서가능하면문헌정보학배경을가진사람이그기본개념만

이라도이해할수있도록설명하려하였지만, 제한된필자의지식과할당된지면탓에그것마저무모한

시도였는지도모르겠다. 물론이과정에서지나친단순화, 부족한용어설명등만족스럽지않은점이있

겠지만, 온톨로지라는개념에대하여독자들이“가까이하기엔너무먼당신”은아니라는느낌을가졌

으면한다.

이글을읽고온톨로지에대한이해와판단은독자마다차이가있을수있겠지만, 필자는그루버가언급

한온톨로지구축의가장기본적인목적인“지식의공유와재사용”을생각하면, 문득10 여년전국내에서

XML이유행하던시기가떠오른다. 당시 XML도지금온톨로지와상당히유사한기치아래정보의호환

성, 재활용성등을외치며, 여러분야에서유행처럼퍼져나갔다. 하지만XML 그자체는이를위한기반을

갖추고있는것이지XML로구축된모든데이터, 문서등이재활용성은물론호환성을무조건가지는것

은아니다. 당시우리분야에서많은XML 문서와메타데이터들이구축되었는데, 이들의문제는통일된

DTD22)가아닌독자적으로개발하여원래목표인재활용성과호환성모두를상실한것이대부분이었다. 온

톨로지도각자가구축한다고지식의공유와재사용이가능한것은아니라는점을주지할필요가있다.

이글을통하여짧게나마우리는온톨로지와수인사(修人事)(?)를나눈셈이다. 이제온톨로지가우리분

야에어떤영향을미치며, 이를적용하였을때이점이무엇인가, 또 우리가사서로서할일이무엇인가

등보다현실적인문제를생각해보아야할것이다.

지상(紙上) 블로그


Recommended