+ All Categories
Home > Documents > Art Organization

Art Organization

Date post: 09-Apr-2018
Category:
Upload: aysgl91
View: 218 times
Download: 0 times
Share this document with a friend

of 10

Transcript
  • 8/8/2019 Art Organization

    1/10

    , - . , .

    S e l f - O r g a n i z a t i o n o f V e r y L a r g e

    D o c u m e n t C o l l e c t i o n s : S t a t e o f t h e A r t

    T e u v o K o h o n e n

    H e l s i n k i U n i v e r s i t y o f T e c h n o l o g y , N e u r a l N e t w o r k s R e s e a r c h C e n t r e

    P . O . B o x 2 2 0 0 , F I N - 0 2 0 1 5 H U T , F i n l a n d

    E m a i l : t e u v o . k o h o n e n @ h u t .

    A b s t r a c t

    T h e S e l f - O r g a n i z i n g M a p ( S O M ) f o r m s a n o n l i n e a r p r o j e c t i o n f r o m a

    h i g h - d i m e n s i o n a l d a t a m a n i f o l d o n t o a l o w - d i m e n s i o n a l g r i d . A r e p r e -

    s e n t a t i v e m o d e l o f s o m e s u b s e t o f d a t a i s a s s o c i a t e d w i t h e a c h g r i d p o i n t .

    T h e S O M a l g o r i t h m c o m p u t e s a n o p t i m a l c o l l e c t i o n o f m o d e l s t h a t a p -

    p r o x i m a t e s t h e d a t a i n t h e s e n s e o f s o m e e r r o r c r i t e r i o n a n d a l s o t a k e s

    i n t o a c c o u n t t h e s i m i l a r i t y r e l a t i o n s o f t h e m o d e l s . T h e m o d e l s t h e n b e -

    c o m e o r d e r e d o n t h e g r i d a c c o r d i n g t o t h e i r s i m i l a r i t y . W h e n t h e S O M

    i s u s e d f o r t h e e x p l o r a t i o n o f s t a t i s t i c a l d a t a , t h e d a t a v e c t o r s c a n b e

    a p p r o x i m a t e d b y m o d e l s o f t h e s a m e d i m e n s i o n a l i t y . W h e n m a p p i n g

    d o c u m e n t s , o n e c a n r e p r e s e n t t h e m s t a t i s t i c a l l y b y t h e i r w o r d f r e q u e n c y

    h i s t o g r a m s o r s o m e r e d u c e d r e p r e s e n t a t i o n s o f t h e h i s t o g r a m s t h a t c a n

    b e r e g a r d e d a s d a t a v e c t o r s . W e h a v e m a d e S O M s o f c o l l e c t i o n s o f o v e r

    o n e m i l l i o n d o c u m e n t s . E a c h d o c u m e n t i s m a p p e d o n t o s o m e g r i d p o i n t ,

    w i t h a l i n k f r o m t h i s p o i n t t o t h e d o c u m e n t d a t a b a s e . T h e d o c u m e n t s

    a r e o r d e r e d o n t h e g r i d a c c o r d i n g t o t h e i r c o n t e n t s a n d n e i g h b o r i n g d o c -

    u m e n t s c a n b e b r o w s e d r e a d i l y . K e y w o r d s o r k e y t e x t s c a n b e u s e d t o

    s e a r c h f o r t h e m o s t r e l e v a n t d o c u m e n t s r s t . N e w e e c t i v e c o d i n g a n d

    c o m p u t i n g s c h e m e s o f t h e m a p p i n g a r e d e s c r i b e d .

    1 I n t r o d u c t i o n

    V i s u a l o v e r v i e w s o f l a r g e d a t a s e t s c a n b e p r o d u c e d b y v a r i o u s c l u s t e r i n g 1 ]

    o r p r o j e c t i o n 2 ] m e t h o d s . T h e S e l f - O r g a n i z i n g M a p ( S O M ) 3 ] f o r m s t h e p r o -

    j e c t i o n o f a h i g h - d i m e n s i o n a l d a t a d i s t r i b u t i o n o n t o a t w o - d i m e n s i o n a l r e g u l a r

    g r i d , w h e r e b y a l s o t h e c l u s t e r s t r u c t u r e o f t h e d a t a i s p r e s e r v e d .

    A r e p r e s e n t a t i v e m o d e l o f s o m e s u b s e t o f o b s e r v a t i o n s i s a s s o c i a t e d w i t h

    e a c h g r i d p o i n t . T h e S O M a l g o r i t h m c o m p u t e s t h e o p t i m a l c o l l e c t i o n o f m o d e l s

    t h a t a p p r o x i m a t e s a n a r b i t r a r y d i s t r i b u t i o n o f i n p u t o b s e r v a t i o n s i n t h e s e n s e

    o f s o m e o v e r a l l e r r o r c r i t e r i o n . T h i s c r i t e r i o n a l s o i n v o l v e s t h e s p a t i a l o r d e r i n g

    o f t h e m o d e l s : t h e m o s t s i m i l a r m o d e l s s h a l l b e f o u n d a t a d j a c e n t g r i d p o i n t s ,

    a n d t h e m o r e d i s s i m i l a r o n e s s h a l l b e l o c a t e d f a r t h e r a w a y f r o m e a c h o t h e r o n

    t h e g r i d . I n t h i s s e n s e t h e S O M i s a s i m i l a r i t y g r a p h o f d a t a .

    T h e g r i d m a y b e m a d e t o a c t a s a g r o u n d w o r k f o r v a r i o u s k i n d s o f i l l u s t r a t i v e

    d i s p l a y s . F o r i n s t a n c e , o n e c a n u s e s h a d e s o f g r a y 4 ] o n t h e g r o u n d w o r k t o

    i n d i c a t e t h e c l u s t e r i n g t e n d e n c y ( e . g . , v e c t o r i a l d i s t a n c e s o f t h e n e i g h b o r i n g

    m o d e l v e c t o r s ) , o r t h e v a l u e s o f a n y c o m p o n e n t o f a l l t h e m o d e l v e c t o r s c a n b e

    d i s p l a y e d s e p a r a t e l y t o s t u d y t h e i r c o n t r i b u t i o n t o t h e c l u s t e r s t r u c t u r e 5 ] .

  • 8/8/2019 Art Organization

    2/10

    I n t h e v a s t m a j o r i t y o f S O M a p p l i c a t i o n s , t h e i n p u t d a t a c o n s t i t u t e h i g h -

    d i m e n s i o n a l r e a l f e a t u r e v e c t o r s x 2 <

    n

    , a n d t h e m o d e l v e c t o r s m

    i

    2 <

    n

    a r e

    t h e n a p p r o x i m a t i o n s o f t h e x i n a s o m e w h a t s i m i l a r s e n s e a s t h e c o d e b o o k

    v e c t o r s i n c l a s s i c a l v e c t o r q u a n t i z a t i o n a r e . H o w e v e r , t h e m o d e l s n e e d n o t

    n e c e s s a r i l y b e r e p l i c a o f t h e i n p u t v e c t o r s : t h e y m a y b e , e . g . , p a r a m e t r i c r e p r e -

    s e n t a t i o n s o f o p e r a t o r s t h a t g e n e r a t e s e q u e n c e s o f d a t a 6 ] . O n t h e o t h e r h a n d ,

    t h e r e e x i s t m e a n s t o a p p r o x i m a t e a l s o n o n v e c t o r i a l d a t a , e . g . , s e t s o f s y m b o l

    s t r i n g s c a n b e a p p r o x i m a t e d b y " a v e r a g e s t r i n g s " 7 ] .

    I n t h e S O M s t h a t f o r m s i m i l a r i t y g r a p h s o f d o c u m e n t s , t h e m o d e l s c a n s t i l l

    b e t a k e n a s r e a l v e c t o r s t h a t d e s c r i b e c o l l e c t i o n s o f w o r d s i n t h e d o c u m e n t s .

    T h e m o d e l s c a n s i m p l y b e w e i g h t e d h i s t o g r a m s o f t h e w o r d s , b u t u s u a l l y s o m e

    d i m e n s i o n a l i t y r e d u c t i o n o f t h e h i s t o g r a m s i s c a r r i e d o u t , a s w e s h a l l s e e n e x t .

    2 S t a t i s t i c a l m o d e l s o f d o c u m e n t s

    2 . 1 T h e p r i m i t i v e v e c t o r s p a c e m o d e l

    I n t h e b a s i c v e c t o r s p a c e m o d e l 8 ] t h e s t o r e d d o c u m e n t s a r e r e p r e s e n t e d a s r e a l

    v e c t o r s i n w h i c h e a c h c o m p o n e n t c o r r e s p o n d s t o t h e f r e q u e n c y o f o c c u r r e n c e

    o f a p a r t i c u l a r w o r d i n t h e d o c u m e n t : t h e m o d e l o r d o c u m e n t v e c t o r c a n b e

    v i e w e d a s a w e i g h t e d w o r d h i s t o g r a m . F o r t h e w e i g h t i n g o f a w o r d a c c o r d i n g

    t o i t s i m p o r t a n c e o n e c a n u s e t h e S h a n n o n e n t r o p y o v e r d o c u m e n t c l a s s e s , o r

    t h e i n v e r s e o f t h e n u m b e r o f t h e d o c u m e n t s i n w h i c h t h e w o r d o c c u r s ( \ i n v e r s e

    d o c u m e n t f r e q u e n c y " ) . T h e m a i n p r o b l e m o f t h e v e c t o r s p a c e m o d e l i s t h e

    l a r g e v o c a b u l a r y i n a n y s i z a b l e c o l l e c t i o n o f f r e e - t e x t d o c u m e n t s , w h i c h m e a n s

    a v a s t d i m e n s i o n a l i t y o f t h e m o d e l v e c t o r s .

    2 . 2 L a t e n t s e m a n t i c i n d e x i n g ( L S I )

    I n a n a t t e m p t t o r e d u c e t h e d i m e n s i o n a l i t y o f t h e d o c u m e n t v e c t o r s , o n e o f t e n

    r s t f o r m s a m a t r i x i n w h i c h e a c h c o l u m n c o r r e s p o n d s t o t h e w o r d h i s t o g r a m

    o f a d o c u m e n t , a n d t h e r e i s o n e c o l u m n f o r e a c h d o c u m e n t . A f t e r t h a t t h e

    f a c t o r s o f t h e s p a c e s p a n n e d b y t h e c o l u m n v e c t o r s a r e c o m p u t e d b y a m e t h o d

    c a l l e d t h e s i n g u l a r - v a l u e d e c o m p o s i t i o n ( S V D ) , a n d t h e f a c t o r s t h a t h a v e t h e

    l e a s t i n u e n c e o n t h e m a t r i x a r e o m i t t e d . T h e d o c u m e n t v e c t o r f o r m e d o f t h e

    h i s t o g r a m o f t h e r e m a i n i n g f a c t o r s h a s t h e n a m u c h s m a l l e r d i m e n s i o n a l i t y .

    T h i s m e t h o d i s c a l l e d t h e l a t e n t s e m a n t i c i n d e x i n g ( L S I ) 9 ] .

    2 . 3 R a n d o m l y p r o j e c t e d h i s t o g r a m s

    I t h a s b e e n s h o w n e x p e r i m e n t a l l y t h a t t h e d i m e n s i o n a l i t y o f t h e d o c u m e n t v e c -

    t o r s c a n b e r e d u c e d r a d i c a l l y b y a r a n d o m p r o j e c t i o n m e t h o d 1 0 ] , 1 1 ] w i t h o u t

    e s s e n t i a l l y l o s i n g t h e p o w e r o f d i s c r i m i n a t i o n b e t w e e n t h e d o c u m e n t s . C o n s i d e r

    t h e o r i g i n a l d o c u m e n t v e c t o r ( w e i g h t e d h i s t o g r a m ) n

    i

    2 <

    n

    a n d a r e c t a n g u -

    l a r r a n d o m m a t r i x R , t h e e l e m e n t s i n e a c h c o l u m n o f w h i c h a r e a s s u m e d t o

  • 8/8/2019 Art Organization

    3/10

    b e n o r m a l l y d i s t r i b u t e d . L e t u s f o r m t h e d o c u m e n t v e c t o r s a s t h e p r o j e c t i o n s

    x

    i

    2 <

    m

    , w h e r e m n :

    x

    i

    = R n

    i

    : ( 1 )

    I t h a s t r a n s p i r e d i n o u r e x p e r i m e n t s t h a t i f m i s a t l e a s t o f t h e o r d e r o f 1 0 0 ,

    t h e s i m i l a r i t y r e l a t i o n s b e t w e e n a r b i t r a r y p a i r s o f p r o j e c t i o n v e c t o r s ( x

    i

    ; x

    j

    ) a r e

    v e r y g o o d a p p r o x i m a t i o n s o f t h e c o r r e s p o n d i n g r e l a t i o n s b e t w e e n t h e o r i g i n a l

    d o c u m e n t v e c t o r s ( n

    i

    ; n

    j

    ) , a n d t h e c o m p u t i n g l o a d o f t h e p r o j e c t i o n s i s r e a -

    s o n a b l e ; o n t h e o t h e r h a n d , w i t h t h e r a d i c a l l y d e c r e a s e d d i m e n s i o n a l i t y o f t h e

    d o c u m e n t v e c t o r s , t h e t i m e n e e d e d t o c l a s s i f y a d o c u m e n t i s r a d i c a l l y d e c r e a s e d .

    I n o u r r e c e n t e x p e r i m e n t s w e h a v e a l w a y s s e l e c t e d n = 3 1 5 ( t o c o m p a r e o u r

    r e s u l t s w i t h e a r l i e r e x p e r i m e n t s i n w h i c h t h i s d i m e n s i o n a l i t y w a s u s e d ) .

    2 . 4 H i s t o g r a m s o n t h e w o r d c a t e g o r y m a p

    I n t h e \ s e l f - o r g a n i z i n g s e m a n t i c m a p " m e t h o d 1 2 ] t h e w o r d s o f f r e e n a t u r a l

    t e x t a r e c l u s t e r e d o n t o n e i g h b o r i n g g r i d p o i n t s o f a s p e c i a l S O M . S y n o n y m s a n d

    c l o s e l y r e l a t e d w o r d s s u c h a s t h o s e w i t h o p p o s i t e m e a n i n g s a n d t h o s e f o r m i n g

    a c l o s e d s e t o f a t t r i b u t e v a l u e s a r e o f t e n m a p p e d o n t o t h e s a m e g r i d p o i n t .

    I n t h i s s e n s e t h i s c l u s t e r i n g s c h e m e i s e v e n m o r e e e c t i v e t h a n t h e t h e s a u r u s

    m e t h o d i n w h i c h s e t s o f s y n o n y m s a r e f o u n d m a n u a l l y .

    T h e i n p u t t o t h e \ s e l f - o r g a n i z i n g s e m a n t i c m a p " u s u a l l y c o n s i s t s o f a d j a c e n t

    w o r d s i n t h e t e x t t a k e n o v e r a m o v i n g w i n d o w . L e t a w o r d i n t h e v o c a b u l a r y

    b e i n d e x e d b y k a n d r e p r e s e n t e d b y a u n i q u e r a n d o m v e c t o r r

    k

    . L e t u s t h e n

    s c a n a l l o c c u r r e n c e s o f w o r d ( k ) i n t h e t e x t i n t h e p o s i t i o n s j ( k ) , a n d c o n s t r u c t

    f o r w o r d ( k ) i t s \ a v e r a g e c o n t e x t v e c t o r "

    x

    k

    =

    2

    4

    E f r

    j ( k ) ? 1

    g

    " r

    j ( k )

    E f r

    j ( k ) + 1

    g

    3

    5

    ; ( 2 )

    w h e r e E m e a n s t h e a v e r a g e o v e r a l l j ( k ) , r

    j ( k )

    i s t h e r a n d o m v e c t o r r e p r e s e n t -

    i n g w o r d ( k ) i n p o s i t i o n j = j ( k ) o f t h e t e x t , a n d " i s a s c a l i n g ( b a l a n c i n g )

    p a r a m e t e r . N o t i c e t h a t t h i s e x p r e s s i o n h a s t o b e c o m p u t e d o n l y o n c e f o r e a c h

    d i e r e n t w o r d , b e c a u s e t h e r

    j ( k )

    f o r a l l t h e j = j ( k ) a r e i d e n t i c a l .

    I n m a k i n g t h e \ s e m a n t i c S O M " o r t h e w o r d c a t e g o r y m a p , a l l t h e x

    k

    f r o m

    a l l t h e d o c u m e n t s a r e i n p u t i t e r a t i v e l y a s u c i e n t n u m b e r o f t i m e s . A f t e r t h a t

    e a c h g r i d p o i n t i s l a b e l e d b y a l l t h o s e w o r d s ( k ) , t h e x

    k

    o f w h i c h a r e m a p p e d

    t o t h a t p o i n t . I n t h i s w a y t h e g r i d p o i n t s u s u a l l y g e t m u l t i p l e l a b e l s .

    I n f o r m i n g t h e \ w o r d c a t e g o r y h i s t o g r a m " f o r a d o c u m e n t , t h e w o r d s o f t h e

    d o c u m e n t a r e s c a n n e d a n d c o u n t e d a t t h o s e g r i d p o i n t s o f t h e S O M t h a t w e r e

    l a b e l e d b y t h a t w o r d . I n c o u n t i n g , t h e w o r d s c a n b e w e i g h t e d b y t h e S h a n n o n

    e n t r o p y o r t h e i n v e r s e o f t h e n u m b e r o f d o c u m e n t s i n t h e t e x t c o r p u s i n w h i c h

    t h i s w o r d h a d o c c u r r e d ( = \ i n v e r s e d o c u m e n t f r e q u e n c y " ) .

    T h e \ w o r d c a t e g o r y h i s t o g r a m s " c a n b e c o m p u t e d r e a s o n a b l y f a s t , m u c h

    f a s t e r t h a n , e . g . , t h e L S I .

  • 8/8/2019 Art Organization

    4/10

    2 . 5 R a n d o m l y p r o j e c t e d w o r d c a t e g o r y h i s t o g r a m s

    I n a g r e a t n u m b e r o f e x p e r i m e n t s p e r f o r m e d b y u s i t h a s t r a n s p i r e d t h a t i f

    t h e h i s t o g r a m s o n t h e w o r d c a t e g o r y m a p s a r e u s e d a s m o d e l s , t h e a b i l i t y

    o f o u r m e t h o d t o d i s c r i m i n a t e b e t w e e n t h e d o c u m e n t s i s r e d u c e d i f t h e g r i d

    p o i n t s i n t h e w o r d c a t e g o r y m a p c o n t a i n m o r e t h a n , s a y , t e n w o r d s o n t h e

    a v e r a g e : s p e c i c i n f o r m a t i o n c o n t a i n e d i n t h e w o r d s i s t h e n l o s t . W e h a v e b e e n

    i n t e r e s t e d i n v e r y l a r g e d o c u m e n t c o l l e c t i o n s t h a t m a y c o n t a i n , s a y , h u n d r e d s

    o f t h o u s a n d s o f u n i q u e w o r d s , a n d e v e n a f t e r d i s c a r d i n g v e r y r a r e w o r d s , t h e

    r e m a i n i n g v o c a b u l a r y c o n s i s t e d o f t e n s o f t h o u s a n d s o f w o r d s . I n o r d e r t o

    k e e p t h e n u m b e r o f w o r d s o n e a c h p o i n t o f t h e w o r d c a t e g o r y m a p a t t h e

    t o l e r a b l e l e v e l , t h e w o r d c a t e g o r y m a p t h e r e f o r e h a d t o b e r e a s o n a b l y l a r g e , f o r

    e x a m p l e 1 3 , 4 3 2 g r i d p o i n t s i n s o m e o f o u r l a t e s t e x p e r i m e n t s . T h e h i s t o g r a m s o f

    t h i s d i m e n s i o n a l i t y w e t h e n a g a i n p r o j e c t e d r a n d o m l y t o f o r m 3 1 5 - d i m e n s i o n a l

    s t a t i s t i c a l d o c u m e n t v e c t o r s .

    T h e c o m b i n a t i o n o f w o r d c a t e g o r i z a t i o n a n d r a n d o m p r o j e c t i o n g u a r a n t e e s

    a c e r t a i n d e g r e e o f i n v a r i a n c e w i t h r e s p e c t t o t h e c h o i c e o f , e . g . , s y n o n y m s , w h i l e

    a h i g h d e g r e e o f d i s c r i m i n a t i o n b e t w e e n d o c u m e n t s c a n s t i l l b e m a i n t a i n e d , f o r

    s i m i l a r r e a s o n s a s i n t h e r a n d o m p r o j e c t i o n m e t h o d .

    2 . 6 C o n s t r u c t i o n o f t h e r a n d o m p r o j e c t i o n s b y p o i n t e r s

    N o w I w o u l d l i k e t o r e p o r t a n e w i d e a f o r t h e s p e e d u p o f c o m p u t a t i o n o f t h e

    d o c u m e n t v e c t o r s . F o r t h e p r e s e n t i t i s b e i n g p r o g r a m m e d i n t o t h e n e x t l a r g e

    d e m o n s t r a t i o n .

    2 . 6 . 1 P r e l i m i n a r y t e s t s

    I t i s a d v i s a b l e t o r e a d S e c . 3 b e f o r e r e t u r n i n g t o t h i s p o i n t .

    B e f o r e d e t a i l e d d e s c r i p t i o n o f t h e t o t a l s y s t e m I h a v e t o p r e s e n t s o m e e x -

    p e r i m e n t a l r e s u l t s t h a t m o t i v a t e t h e i d e a d i s c u s s e d i n t h i s s e c t i o n . T a b l e 1

    c o m p a r e s a f e w p r o j e c t i o n m e t h o d s i n w h i c h t h e m o d e l v e c t o r s , e x c e p t i n t h e

    r s t c a s e , w e r e a l w a y s 3 1 5 - d i m e n s i o n a l .

    A s t h e m a t e r i a l i n t h i s e x p e r i m e n t w e u s e d 1 8 , 5 4 0 E n g l i s h d o c u m e n t s ( d i s -

    c u s s i o n s e t c . ) f r o m 2 0 U s e n e t n e w s g r o u p s o f I n t e r n e t . W h e n t h e t e x t w a s

    p r e p r o c e s s e d a s w i l l b e e x p l a i n e d i n S e c . 3 . 1 . 1 , t h e r e m a i n i n g v o c a b u l a r y c o n -

    s i s t e d o f 5 , 7 8 9 w o r d s o r w o r d f o r m s . T h e d o c u m e n t s , r e p r e s e n t e d b y d i e r e n t

    k i n d s o f d o c u m e n t v e c t o r s , w e r e c l a s s i e d i n t h e f o l l o w i n g w a y . W h e n t h e d o c -

    u m e n t m a p d i s c u s s e d m o r e c l o s e l y i n S e c . 3 w a s f o r m e d , e a c h d o c u m e n t w a s

    m a p p e d o n t o o n e o f i t s g r i d p o i n t s . T h e s e p o i n t s w e r e t h e n c l a s s i e d a c c o r d i n g

    t o t h e m a j o r i t y o f n e w s g r o u p n a m e s i n t h e m . A l l d o c u m e n t s t h a t r e p r e s e n t e d

    a m i n o r i t y g r o u p a t a n y g r i d p o i n t w e r e c o u n t e d a s c l a s s i c a t i o n e r r o r s .

    O n e h a s t o t a k e i n t o a c c o u n t t h a t m a n y n e w s g r o u p s h a v e a l m o s t i d e n t i c a l

    t o p i c s a l t h o u g h t h e i r n a m e s a r e d i e r e n t . H o w e v e r , m i s c l a s s i c a t i o n s d u e t o

    t h i s r e a s o n w e r e s i m p l y c o u n t e d a s e r r o r s . O f t e n t h e d i s c u s s i o n s a r e a l s o s o

    d i u s e t h a t t h e y d o n o t i d e n t i f y t h e g r o u p . T h e r e f o r e t h e " a c c u r a c i e s " r e p o r t e d

    h e r e s e e m m u c h m o r e p e s s i m i s t i c t h a n t h e y r e a l l y a r e , a n d o n e m u s t r e g a r d t h e

  • 8/8/2019 Art Organization

    5/10

    g i v e n g u r e s a s r e l a t i v e o n e s , m e a n t f o r c o m p a r i s o n o f t h e d i e r e n t m e t h o d s

    o n l y .

    T h e c l a s s i c a t i o n a c c u r a c y o f 6 8 . 0 p e r c e n t r e p o r t e d o n t h e r s t r o w o f

    T a b l e 1 r e f e r s t o a c l a s s i c a t i o n t h a t w a s c a r r i e d o u t w i t h t h e v e c t o r - s p a c e

    m o d e l w i t h f u l l 5 7 8 9 - d i m e n s i o n a l h i s t o g r a m s a s d o c u m e n t v e c t o r s . I n p r a c t i c e ,

    t h i s k i n d o f c l a s s i c a t i o n w o u l d b e o r d e r s o f m a g n i t u d e t o o s l o w .

    R a n d o m p r o j e c t i o n ( w i t h m a t r i x R ) o f t h e o r i g i n a l d o c u m e n t v e c t o r s o n t o a

    3 1 5 - d i m e n s i o n a l s p a c e , w i t h n o r m a l l y d i s t r i b u t e d m a t r i x e l e m e n t s a n d n o r m a l -

    i z e d c o l u m n s o f R y i e l d e d , w i t h i n t h e s t a t i s t i c a l a c c u r a c y o f c o m p u t a t i o n , t h e

    s a m e g u r e s a s t h e b a s i c v e c t o r s p a c e m e t h o d . T h i s i s r e p o r t e d o n t h e s e c o n d

    r o w . T h e g u r e s a r e a v e r a g e s f r o m s e v e n s t a t i s t i c a l l y i n d e p e n d e n t t e s t s , l i k e i n

    t h e r e s t o f t h e c a s e s .

    T h e f o l l o w i n g r o w s h a v e t h e f o l l o w i n g m e a n i n g : T h i r d r o w , t h e m a t r i x

    e l e m e n t s o f R w e r e t h r e s h o l d e d t o + 1 o r ? 1 ; f o u r t h r o w , e x a c t l y 5 r a n d o m l y

    d i s t r i b u t e d o n e s w e r e g e n e r a t e d i n e a c h c o l u m n o f R , a n d t h e o t h e r e l e m e n t s

    w e r e z e r o e s ; f t h r o w , t h e n u m b e r o f o n e s w a s 3 ; a n d s i x t h r o w , t h e n u m b e r o f

    o n e s w a s 2 , r e s p e c t i v e l y .

    I t c a n b e c o n c l u d e d t h a t a s p a r s e b i n a r y p r o j e c t i o n m a t r i x i s a l m o s t a s g o o d

    i n p r a c t i c e a s t h e n o r m a l l y d i s t r i b u t e d R , w h i c h a g a i n w a s a b o u t a s g o o d a s

    t h e v e c t o r s p a c e m o d e l . H o w e v e r , n o w w e c a n a p p l y a f a s t c o m p u t i n g m e t h o d .

    T a b l e 1 : C l a s s i c a t i o n a c c u r a c i e s o f d o c u m e n t s , i n p e r c e n t , w i t h d i e r e n t

    p r o j e c t i o n m a t r i c e s R . T h e g u r e s a r e a v e r a g e s f r o m s e v e n t e s t r u n s w i t h

    d i e r e n t r a n d o m e l e m e n t s o f R .

    A c c u r a c y S t a n d a r d d e v i a t i o n d u e t o

    d i e r e n t r a n d o m i z a t i o n o f R

    V e c t o r s p a c e m o d e l 6 8 . 0 ?

    N o r m a l l y d i s t r i b u t e d R 6 8 . 0 0 . 2

    T h r e s h o l d i n g t o + 1 o r ? 1 6 7 . 9 0 . 2

    5 o n e s i n e a c h c o l u m n 6 7 . 8 0 . 3

    3 o n e s i n e a c h c o l u m n 6 7 . 4 0 . 2

    2 o n e s i n e a c h c o l u m n 6 7 . 3 0 . 2

    2 . 6 . 2 F a s t c o m p u t a t i o n o f t h e p r o j e c t e d h i s t o g r a m s

    T h e m a t r i x p r o d u c t x = R n i n e q . ( 1 ) ( w h e r e w e d r o p t h e d o c u m e n t i n d e x ) ,

    w i t h a s p a r s e m a t r i x R , c a n b e c o m p u t e d v e r y f a s t . C o n s i d e r r s t t h e f o l l o w i n g

    t r i v i a l - l o o k i n g p i e c e o f p s e u d o c o d e .

    f o r i : = 1 s t e p 1 u n t i l m d o x ( i ) : = 0 ;

    f o r a l l ( i , j ) s u c h t h a t R ( i , j ) = 1 b e g i n

    x ( i ) : = x ( i ) + n ( j ) ;

    e n d

    T h i s s c h e m e i s s u p p o s e d t o g i v e u s t h e i d e a t h a t i f w e r e s e r v e a m e m o r y

    a r r a y f o r x = ( x

    1

    ; x

    2

    ; : : : ; x

    m

    ) t h a t a c t s l i k e a n a c c u m u l a t o r , a n o t h e r a r r a y f o r

  • 8/8/2019 Art Organization

    6/10

    n = ( n

    1

    ; n

    2

    ; : : : ; n

    n

    ) , a n d p e r m a n e n t a d d r e s s p o i n t e r s f r o m a l l t h e l o c a t i o n s n

    j

    t o a l l t h e l o c a t i o n s x

    i

    f o r w h i c h t h e m a t r i x e l e m e n t R

    i j

    o f R i s e q u a l t o o n e ,

    w e c a n a c c u m u l a t e t h e v a l u e s o f x

    i

    v e r y f a s t b y f o l l o w i n g t h e p o i n t e r s . I f R i s

    v e r y s p a r s e , t h i s s c h e m e w o r k s v e r y f a s t .

    A f t e r t h e a b o v e i n t r o d u c t i o n i t m a y b e e a s i e r t o u n d e r s t a n d t h e v e r s i o n o f

    t h e m e t h o d t h a t w a s a c t u a l l y u s e d . N o w w e d o n o t p r o j e c t r e a d y h i s t o g r a m s ,

    b u t t h e p o i n t e r s a r e a l r e a d y u s e d w i t h e a c h w o r d i n t h e t e x t i n t h e c o n s t r u c t i o n

    o f t h e l o w - d i m e n s i o n a l d o c u m e n t v e c t o r s .

    A s s u m e t h a t w e h a v e p r e c o m p u t e d f o r e a c h w o r d i n t h e v o c a b u l a r y i t s

    w e i g h t ( e n t r o p y o r \ i n v e r s e d o c u m e n t f r e q u e n c y " ) . T h e v o c a b u l a r y a n d i t s

    w e i g h t s r e s i d e i n a t a b l e , t h e e n t r i e s o f w h i c h a r e f o u n d b y h a s h c o d i n g ( f o r

    a t e x t b o o k a c c o u n t , c f . , e . g . , 1 3 ] o r 3 ] ) . T h e h a s h a d d r e s s e s a r e f o r m e d o n

    t h e b a s i s o f t h e A S C I I c o d e s o f t h e w o r d s . A t e a c h h a s h a d d r e s s o r i t s s p a r e

    l o c a t i o n , c o r r e s p o n d i n g t o a w o r d e n t r y w e s t o r e a s m a l l n u m b e r o f , s a y , t h r e e

    r a n d o m p o i n t e r s t o t h e e l e m e n t s o f t h e x a r r a y .

    W h e n s c a n n i n g t h e t e x t , t h e h a s h a d d r e s s f o r e a c h w o r d i s f o r m e d , a n d i f

    t h e w o r d r e s i d e s i n t h e h a s h t a b l e , t h o s e e l e m e n t s o f t h e x a r r a y t h a t a r e f o u n d

    b y t h e ( s a y , t h r e e ) a d d r e s s p o i n t e r s a r e i n c r e m e n t e d b y t h e w e i g h t v a l u e o f t h a t

    w o r d .

    T h e w e i g h t e d , r a n d o m l y p r o j e c t e d w o r d h i s t o g r a m o b t a i n e d i n t h e a b o v e

    w a y m a y b e n o r m a l i z e d ( o p t i o n a l l y ) .

    T h e c o m p u t i n g t i m e n e e d e d t o f o r m t h e h i s t o g r a m s i n t h e a b o v e c a s e i s

    a b o u t 2 0 p e r c e n t o f t h a t o f t h e m a t r i x - p r o d u c t m e t h o d . W e h a v e g o o d r e a s o n s

    t o a s s u m e t h a t a t l e a s t t h e s a m e s p e e d u p h o l d s f o r l a r g e r m a p s , t o o .

    3 C o n s t r u c t i o n o f t h e d o c u m e n t m a p

    O u r o r i g i n a l d o c u m e n t - o r g a n i z a t i o n s y s t e m n a m e d t h e W E B S O M ( h t t p :

    / / w e b s o m . h u t . / w e b s o m / ) u s e d w o r d - c a t e g o r y h i s t o g r a m s a s s t a t i s t i c a l m o d e l s

    o f t h e d o c u m e n t s . C e r t a i n r e a s o n s , a m o n g t h e m t h e a c c u r a c y o f c l a s s i c a t i o n ,

    h a v e r e c e n t l y l e d u s t o p r e f e r t h e s t r a i g h t f o r w a r d r a n d o m p r o j e c t i o n ( o r i t s

    s h o r t c u t c o m p u t a t i o n b y t h e p o i n t e r s ) i n f o r m i n g t h e s t a t i s t i c a l m o d e l s o f t h e

    d o c u m e n t s . W e h a v e c a r r i e d o u t n u m e r o u s e x p e r i m e n t s w i t h m a p s o f v e r y

    d i e r e n t s i z e s , b u t t h e f o l l o w i n g c o m p a r a b l e g u r e s i n T a b l e 2 a r e g i v e n h e r e

    f o r t h e s a m e d o c u m e n t c o l l e c t i o n u s e d e a r l i e r . I n t h e s e e x p e r i m e n t s t h e w o r d

    c a t e g o r y m a p h a d 1 5 9 8 g r i d p o i n t s , a n d t h e d i m e n s i o n o f t h e p r o j e c t e d m o d e l

    w a s 2 7 0 .

    I t m u s t a l s o b e t a k e n i n t o a c c o u n t t h a t w i t h t h e w o r d c a t e g o r y m a p m e t h o d

    w e h a v e t o d e a l w i t h a n e x t r a s e l f - o r g a n i z i n g p r o c e s s , w h e r e a s f o r m i n g t h e

    r a n d o m p r o j e c t i o n i s a s t r a i g h t f o r w a r d c o m p u t a t i o n .

    3 . 1 T h e W E B S O M m e t h o d

    O u r m e t h o d i s a c o l l e c t i o n o f p r o g r a m s t h a t c a n b e c o m b i n e d i n d i e r e n t w a y s .

    A b r i e f o v e r v i e w o f t h e c o m p u t i n g p h a s e s i s g i v e n i n t h e f o l l o w i n g .

  • 8/8/2019 Art Organization

    7/10

    T a b l e 2 : C l a s s i c a t i o n a c c u r a c i e s w i t h s i m i l a r m a t e r i a l a s i n T a b l e 1

    M a t r i x p r o d u c t P o i n t e r m e t h o d

    ( 3 p o i n t e r s / c o l u m n )

    R a n d o m p r o j e c t i o n 6 8 . 0 6 7 . 5

    R a n d o m l y p r o j e c t e d

    w o r d c a t e g o r y 6 6 . 0 6 7 . 0

    h i s t o g r a m

    3 . 1 . 1 P r e p r o c e s s i n g

    F r o m t h e r a w t e x t , n o n t e x t u a l a n d o t h e r w i s e n o n r e l e v a n t i n f o r m a t i o n ( p u n c -

    t u a t i o n m a r k s , a r t i c l e s a n d o t h e r s t o p w o r d s , m e s s a g e h e a d e r s , U R L s , e m a i l

    a d d r e s s e s , s i g n a t u r e s , i m a g e s , a n d n u m b e r s ) w a s r e m o v e d . T h e m o s t c o m m o n

    w o r d s , a n d w o r d s o c c u r i n g r a r e l y ( e . g . , l e s s t h a n 5 0 t i m e s i n t h e c o r p u s ) w e r e

    a l s o d i s c a r d e d . E a c h r e m a i n i n g w o r d w a s r e p r e s e n t e d b y a u n i q u e r a n d o m

    v e c t o r o f d i m e n s i o n a l i t y 9 0 .

    F o r a l a n g u a g e l i k e F i n n i s h t h a t h a s p l e n t y o f i n e c t i o n s , w e h a v e u s e d

    a s t e m m e r . I n o u r e x p e r i m e n t s w e h a v e s o f a r r e g a r d e d t h e v a r i o u s E n g l i s h

    w o r d f o r m s a s d i e r e n t " w o r d s " i n v o c a b u l a r y , b u t a s t e m m e r c o u l d b e u s e d

    f o r E n g l i s h , t o o .

    3 . 1 . 2 F o r m a t i o n o f s t a t i s t i c a l m o d e l s

    T o r e d u c e t h e d i m e n s i o n a l i t y o f t h e m o d e l s , w e h a v e u s e d b o t h r a n d o m l y p r o -

    j e c t e d w o r d c a t e g o r y h i s t o g r a m s a n d r a n d o m l y p r o j e c t e d w o r d h i s t o g r a m s ,

    w e i g h t e d b y t h e S h a n n o n e n t r o p y o r " i n v e r s e d o c u m e n t f r e q u e n c y . "

    3 . 1 . 3 F o r m a t i o n o f t h e d o c u m e n t m a p

    T h e d o c u m e n t m a p s w e r e f o r m e d a u t o m a t i c a l l y b y t h e S O M a l g o r i t h m , f o r

    w h i c h t h e s t a t i s t i c a l m o d e l s o f d o c u m e n t s w e r e u s e d a s i n p u t . T h e s i z e o f t h e

    S O M w a s d e t e r m i n e d s o t h a t o n t h e a v e r a g e 1 0 t o 1 5 a r t i c l e s w e r e m a p p e d

    o n t o e a c h g r i d p o i n t ; t h i s g u r e w a s m a i n l y d e t e r m i n e d f o r t h e c o n v e n i e n c e o f

    b r o w s i n g .

    T h e s p e e d o f c o m p u t a t i o n , e s p e c i a l l y o f l a r g e S O M s c a n b e i n c r e a s e d b y

    s e v e r a l m e t h o d s : f o r i n s t a n c e , t h e w i n n e r s e a r c h c a n b e a c c e l e r a t e d b y s t a r t i n g

    t h e s e a r c h i n t h e n e i g h b o r h o o d o f c o r r e s p o n d i n g w i n n e r s a t t h e l a s t c y c l e o f

    i t e r a t i o n ( 3 ] , S e c . 3 . 1 5 . 1 ) , a n d i n c r e a s i n g t h e s i z e ( n u m b e r o f g r i d n o d e s )

    s t e p w i s e d u r i n g l e a r n i n g u s i n g a n e s t i m a t i o n p r o c e d u r e ( 3 ] , S e c . 3 . 1 5 . 2 ) .

    3 . 1 . 4 U s e r i n t e r f a c e

    T h e d o c u m e n t m a p w a s p r e s e n t e d a s a s e r i e s o f H T M L p a g e s t h a t e n a b l e e x -

    p l o r a t i o n o f t h e g r i d p o i n t s : w h e n c l i c k i n g t h e l a t t e r w i t h a m o u s e , l i n k s t o t h e

  • 8/8/2019 Art Organization

    8/10

    d o c u m e n t d a t a b a s e e n a b l e r e a d i n g t h e c o n t e n t s o f t h e a r t i c l e s . D e p e n d i n g o n

    t h e s i z e o f t h e g r i d , s u b s e t s o f i t c a n r s t b e v i e w e d b y z o o m i n g . U s u a l l y w e

    u s e t w o z o o m i n g l e v e l s f o r b i g g e r m a p s b e f o r e r e a d i n g t h e d o c u m e n t s .

    T h e r e i s a l s o a n a u t o m a t i c m e t h o d f o r a s s i g n i n g d e s c r i p t i v e s i g n p o s t s t o

    m a p r e g i o n s ; i n d e e p e r z o o m i n g , m o r e s i g n s a p p e a r . T h e s i g n p o s t s a r e w o r d s

    t h a t a p p e a r o f t e n i n t h e a r t i c l e s i n t h a t m a p r e g i o n a n d r a r e l y e l s e w h e r e .

    3 . 1 . 5 C o n t e n t - a d d r e s s a b l e s e a r c h

    T h e H T M L p a g e c a n b e p r o v i d e d w i t h a f o r m e l d i n t o w h i c h t h e u s e r c a n t y p e

    a n o w n q u e r y i n t h e f o r m o f a s h o r t \ d o c u m e n t . " T h i s q u e r y i s p r e p r o c e s s e d

    a n d a d o c u m e n t v e c t o r ( h i s t o g r a m ) i s f o r m e d i n t h e s a m e w a y a s f o r t h e s t o r e d

    d o c u m e n t s . T h i s h i s t o g r a m i s t h e n c o m p a r e d w i t h t h e \ m o d e l s " o f a l l g r i d

    p o i n t s , a n d a s p e c i e d n u m b e r o f b e s t - m a t c h i n g p o i n t s a r e m a r k e d w i t h a

    r o u n d s y m b o l , t h e d i a m e t e r o f w h i c h i s t h e l a r g e r , t h e b e t t e r t h e m a t c h i s .

    T h e s e s y m b o l s p r o v i d e g o o d s t a r t i n g p o i n t s f o r b r o w s i n g .

    A p r o b l e m , h o w e v e r , m a y b e e n c o u n t e r e d i f t h e u s e r w a n t s t o u s e a s i n g l e

    k e y w o r d o r a f e w k e y w o r d s o n l y a s a " k e y d o c u m e n t . " S u c h q u e r i e s m a k e v e r y

    b a d \ h i s t o g r a m s . " I n t h i s c a s e i t i s m o r e a d v i s a b l e t o u s e t w o d i e r e n t m o d e s

    o f u s e o f t h e W E B S O M : t h e u s e r m u s t t h e n s p e c i f y w h e t h e r a d o c u m e n t - t y p e

    o r k e y w o r d - t y p e q u e r y h a s t o b e u s e d . I n t h e f o r m e r c a s e t h e o p e r a t i o n i s

    l i k e d e s c r i b e d b e f o r e ; i n t h e l a t t e r c a s e o n e h a s t o i n d e x e a c h w o r d o f t h e

    v o c a b u l a r y b y p o i n t e r s t o t h o s e d o c u m e n t s w h e r e t h e s e w o r d s o c c u r , a n d u s e

    a r a t h e r c o n v e n t i o n a l i n d e x e d s e a r c h t o n d t h e m a t c h e s .

    4 A n e x a m p l e

    T h e b i g g e s t d o c u m e n t m a p w e h a v e m a d e u p t o t h i s w r i t i n g c o n s i s t s o f 1 0 4 , 0 4 0

    g r i d p o i n t s . E a c h m o d e l i s 3 1 5 - d i m e n s i o n a l , a n d h a s b e e n m a d e b y p r o j e c t i n g a

    w o r d c a t e g o r y m a p w i t h 1 3 , 4 3 2 g r i d p o i n t s r a n d o m l y o n t o t h e 3 1 5 - d i m e n s i o n a l

    s p a c e . T h e t e x t m a t e r i a l w a s t a k e n f r o m 8 0 v e r y d i e r e n t U s e n e t n e w s g r o u p s

    a n d c o n s i s t e d o f 1 , 1 2 4 , 1 3 4 d o c u m e n t s w i t h a v e r a g e l e n g t h o f 2 1 8 w o r d s . T h e

    s i z e o f t h e n a l l y a c c e p t e d v o c a b u l a r y w a s 6 3 , 7 7 3 w o r d s . T h e w o r d s w e r e

    w e i g h t e d b y t h e S h a n n o n e n t r o p y c o m p u t e d f r o m t h e d i s t r i b u t i o n o f t h e w o r d s

    i n t o 8 0 c l a s s e s ( n e w s g r o u p s ) . I t t o o k a b o u t 1 m o n t h t o p r o c e s s t h e t w o S O M s

    w i t h o u t o u r n e w e s t s p e e d u p m e t h o d s ; s e a r c h i n g o c c u r s i n n e a r l y r e a l t i m e .

    T h e a c c u r a c y o f c l a s s i f y i n g a d o c u m e n t i n t o o n e o f t h e 8 0 g r o u p s w a s a b o u t

    8 0 p e r c e n t .

    F i g . 1 e x e m p l i e s a c a s e o f c o n t e n t - a d d r e s s a b l e s e a r c h . T h e d o c u m e n t m a p

    h a s b e e n d e p i c t e d i n t h e b a c k g r o u n d , a n d t h e s h a d e s o f g r a y c o r r e s p o n d t o

    d o c u m e n t c l u s t e r s . T h e 2 0 g r i d p o i n t s , t h e m o d e l s o f w h i c h m a t c h e d b e s t w i t h

    t h e s h o r t q u e r y , a r e v i s i b l e a s a s m a l l b l a c k h e a p o n t h e l e f t - h a n d s i d e o f t h e

    d o c u m e n t m a p . U s i n g a b r o w s e r , t h e d o c u m e n t s m a p p e d t o g r i d p o i n t s o f t h e

    d o c u m e n t m a p c a n b e r e a d o u t f r o m t h e H T M L p a g e . T w o t i t l e p a g e s a r e

    s h o w n .

  • 8/8/2019 Art Organization

    9/10

    A c t u a l l y t h e r e i s o n l y o n e a r t i c l e i n F i g . 1 t h a t d e a l s w i t h N N c h e s s . H o w -

    e v e r , t h e o t h e r c o m p u t e r c h e s s d o c u m e n t s w e r e s o s i m i l a r t h a t t h e y w e r e r e -

    t u r n e d , t o o . A b o u t o n e f o u r t h o f t h e f o u n d d o c u m e n t s o b v i o u s l y d o e s n o t d e a l

    w i t h c h e s s .

    QUERY: chess playing neural nets,NN chess player vs. human player

    F i g u r e 1 : C o n t e n t - a d d r e s s a b l e s e a r c h f r o m a 1 , 1 2 4 , 1 3 4 - d o c u m e n t W E B S O M

    5 C o n c l u s i o n s

    I t h a s t r a n s p i r e d i n o u r e x p e r i m e n t s t h a t t h e e n c o d i n g o f d o c u m e n t s f o r t h e i r

    s t a t i s t i c a l i d e n t i c a t i o n c a n b e p e r f o r m e d m u c h m o r e e e c t i v e l y t h a n b e l i e v e d

    a f e w y e a r s a g o 9 ] . I n p a r t i c u l a r , t h e v a r i o u s r a n d o m - p r o j e c t i o n m e t h o d s a r e

    a s a c c u r a t e i n p r a c t i c e a s t h e i d e a l t h e o r e t i c a l v e c t o r s p a c e m e t h o d , b u t m u c h

    f a s t e r t o c o m p u t e t h a n t h e e i g e n v a l u e m e t h o d s ( e . g . , L S I ) t h a t h a v e b e e n u s e d

    e x t e n s i v e l y t o s o l v e t h e p r o b l e m o f l a r g e d i m e n s i o n a l i t y .

  • 8/8/2019 Art Organization

    10/10

    T h e c o n t e n t - a d d r e s s a b l e s e a r c h m u s t o b v i o u s l y b e i m p l e m e n t e d d i e r e n t l y

    w h e n c o m p l e t e n e w \ d o c u m e n t s " a r e u s e d a s k e y i n f o r m a t i o n v s . w h e n o n l y

    a f e w k e y w o r d s a r e u s e d . T o t h i s e n d o n e m u s t r s t i d e n t i f y t h e u s e r s ' n e e d s ,

    e . g . , w h e t h e r b a c k g r o u n d i n f o r m a t i o n t o a g i v e n a r t i c l e i s w a n t e d , o r w h e t h e r

    t h e m e t h o d i s u s e d a s a k i n d o f k e y w o r d - d i r e c t e d s e a r c h e n g i n e .

    F i n a l l y i t o u g h t t o b e e m p h a s i z e d t h a t t h e o r d e r t h a t e n s u e s i n t h e W E B -

    S O M m a y n o t r e p r e s e n t a n y t a x o n o m y o f t h e a r t i c l e s a n d d o e s n o t s e r v e a s a

    b a s i s f o r a n y a u t o m a t i c i n d e x i n g o f t h e d o c u m e n t s ; t h e s i m i l a r i t y r e l a t i o n s h i p s

    b e t t e r s e r v e \ n d i n g " t h a n \ s e a r c h i n g f o r " r e l e v a n t i n f o r m a t i o n .

    R e f e r e n c e s

    1 ] J a i n A K , D u b e s R C . A l g o r i t h m s f o r c l u s t e r i n g d a t a . P r e n t i c e H a l l , E n g l e w o o d

    C l i s , N J , 1 9 8 8

    2 ] K r u s k a l J B , W i s h M . M u l t i d i m e n s i o n a l s c a l i n g . S a g e U n i v e r s i t y P a p e r s e r i e s o n

    Q u a n t i t a t i v e A p p l i c a t i o n s i n t h e S o c i a l S c i e n c e s , n o 0 7 - 0 1 1 . S a g e P u b l i c a t i o n s ,

    N e w b u r y P a r k , C A , 1 9 7 8

    3 ] K o h o n e n T . S e l f - o r g a n i z i n g m a p s . S e r i e s i n I n f o r m a t i o n S c i e n c e s , v o l 3 0 ,

    S p r i n g e r - V e r l a g , H e i d e l b e r g , 1 9 9 5 ; s e c o n d e d 1 9 9 7 ; J a p a n e s e e d 1 9 9 6 , S p r i n g e r -

    V e r l a g , T o k y o

    4 ] U l t s c h A . S e l f - o r g a n i z i n g n e t w o r k s f o r v i s u a l i z a t i o n a n d c l a s s i c a t i o n . I n : O p i t z

    O , L a u s e n B , K l a r R ( e d s ) I n f o r m a t i o n a n d c l a s s i c a t i o n . S p r i n g e r - V e r l a g ,

    B e r l i n , 1 9 9 3 , p p 3 0 7 - 3 1 3

    5 ] G o s e r K , H i l l e r i n g m a n n U , R u e c k e r t U , S c h u m a c h e r K . V L S I t e c h n o l o g i e s f o r

    a r t i c i a l n e u r a l n e t w o r k s . I E E E M i c r o 1 9 8 9 ; 9 : 2 8 - 4 4

    6 ] L a m p i n e n J , O j a E . S e l f - o r g a n i z i n g m a p s f o r s p a t i a l a n d t e m p o r a l A R m o d e l s .

    I n : P i e t i k a i n e n M , R o n i n g J ( e d s ) P r o c 6 S C I A , S c a n d C o n f o n I m a g e A n a l y s i s .

    S u o m e n H a h m o n t u n n i s t u s t u t k i m u k s e n S e u r a r y , H e l s i n k i , 1 9 8 9 , p p 1 2 0 - 1 2 7

    7 ] K o h o n e n T . S e l f - o r g a n i z i n g m a p s o f s y m b o l s t r i n g s . R e p o r t A 4 2 . H e l s i n k i U n i -

    v e r s i t y o f T e c h n o l o g y , L a b o r a t o r y o f C o m p u t e r a n d I n f o r m a t i o n S c i e n c e , E s p o o ,

    F i n l a n d , 1 9 9 6

    8 ] S a l t o n G , M c G i l l M J . I n t r o d u c t i o n t o m o d e r n i n f o r m a t i o n r e t r i e v a l . M c G r a w -

    H i l l , N e w Y o r k , 1 9 8 3

    9 ] D e e r w e s t e r S , D u m a i s S , F u r n a s G , L a n d a u e r K . I n d e x i n g b y l a t e n t s e m a n t i c

    a n a l y s i s . J A m S o c I n f o r m S c i , 1 9 9 0 ; 4 1 : 3 9 1 - 4 0 7

    1 0 ] K a s k i S . D a t a e x p l o r a t i o n u s i n g s e l f - o r g a n i z i n g m a p s . A c t a P o l y t e c h n i c a S c a n -

    d i n a v i c a , M a t h e m a t i c s , C o m p u t i n g a n d M a n a g e m e n t i n E n g i n e e r i n g S e r i e s N o

    8 2 , 1 9 9 7 . D r T e c h T h e s i s , H e l s i n k i U n i v e r s i t y o f T e c h n o l o g y , F i n l a n d

    1 1 ] K a s k i S . D i m e n s i o n a l i t y r e d u c t i o n b y r a n d o m m a p p i n g . I n : P r o c o f I J C N N ' 9 8 ,

    I n t J o i n t C o n f o n N e u r a l N e t w o r k s . I E E E P r e s s , P i s c a t a w a y , N J , 1 9 9 8 , p p 4 1 3 -

    4 1 8

    1 2 ] R i t t e r H , K o h o n e n T . S e l f - o r g a n i z i n g s e m a n t i c m a p s . B i o l C y b , 1 9 8 9 ; 6 1 : 2 4 1 - 2 5 4

    1 3 ] K o h o n e n T . C o n t e n t - a d d r e s s a b l e m e m o r i e s . S p r i n g e r - V e r l a g , H e i d e l b e r g , 1 9 8 0 ;

    s e c o n d e d 1 9 8 7


Recommended