+ All Categories
Home > Documents > Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using...

Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using...

Date post: 13-Apr-2018
Category:
Upload: michael-pearson
View: 220 times
Download: 0 times
Share this document with a friend

of 8

Transcript
  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    1/8

    P r e d i c t i o n o f t h e R o d e n t C a r c i n o g e n i c i t yo f O r g a n i c Compounds f r o m T h e i r C h e m i c a lS t r u c t u r e s U s i n g t h e F A L S MethodI k u o M o r i g u c h i , l H i r o y u k i H i r a n o , 2 a n d S h u i c h i H i r o n o l1 S c h o o l o f P h a r m a c e u t i c a l S c i e n c e s , K i t a s a t o U n i v e r s i t y , T o k y o , J a p a n ;2 Z e r i a P h a r m a c e u t i c a l C o . , L t d . , T o k y o , J a p a nF u z z y a d a p t i v e l e a s t - s q u a r e s ( F A L S ) , a p a t t e r n r e c o g n i t i o n m e t h o d r e c e n t l y d e v e l o p e d i n ou rl a b o r a t o r y f o r c o r r e l a t i n g s t r u c t u r e w i t h a c t i v i t y r a t i n g , was u s e d t o g e n e r a t e q u a n t i t a t i v es t r u c t u r e - a c t i v i t y r e l a t i o n s h i p ( Q S A R ) m o d e l s o n t h e c a r c i n o g e n i c i t y o f o r g a n i c c o m p o u n d s o fs e v e r a l c h e m i c a l c l a s s e s . U s i n g t h e p r e d i c t i v e m o d e l s o b t a i n e d f r o m t h e c h e m i c a l c l a s s - b a s e dF A L S QSAR a p p r o a c h , t he r o d en t c a r c i n o g e n i c i t y or n o n c a r c i n o g e n i c i t y o f a group o f o r g a n i cc h e m i c a l s c u r r e n t l y b e i n g t e s t e d b y t h e U . S . N a t i o n a l T o x i c o l o g y P r o g r a m was e s t i m a t e d f r o mt h e i r c h e m i c a l s t r u c t u r e s . E n v i r o n H e a l t h P e r s pe c t 1 0 4 ( S u p pl 5 ) : 1 0 5 1 - 1 0 5 8 ( 1 9 9 6 )K e y w o r d s : Q S A R , F A L S , r o d e n t c a r c i n o g e n i c i t y , p r e d i c t i v e m o d e l s

    2 , . . . , p ) = w e i g h t c o e f f i c i e n t , a n d Z=d i s c r i m i n a n t s c o r e . A n o v e l f e a t u r e o f F A L Si s t h a t t h e d e g r e e t o w h i c h e a c h c o m p o u n db e l o n g s t o i t s a c t i v i t y c l a s s i s g i v e n b y af u z z y m e m b e r s h i p f u n c t i o n ( 9 ) . I n F A L S ,a b e l l - s h a p e d m e m b e r s h i p f u n c t i o n f o re a c h a c t i v i t y c l a s s i s a s s u m e d t o g i v e t h em e m b e r s h i p g r a d e f o r t h e c l a s s m e m b e r s .I n t h e s i m p l e s t c a s e , i n w h i c h t h e n u m -b e r o f a c t i v i t y r a t i n g c l a s s e s i s o n l y t w o ,e . g . , c a r c i n o g e n i c / n o n c a r c i n o g e n i c d i c h o t o -m i z a t i o n a s i n t h i s s t u d y , t h e m e m b e r s h i pf u n c t i o n , M ( Z ) , f o r e a c h a c t i v i t y c l a s s i sg i v e n a s :F o r c a r c i n o g e n i c a c t i v i t y ,M(Z) = 1 / [ 1 + { ( Z - B o u n d a r y ) / O . 1 _ 1 } 1 4 ]w h e n Z < B o u n d a r y + 0 . 1 ,o t h e r w i s e M(Z) = 1 [ 2 ]

    I n t r o d u c t i o nT h e p r e d i c t i o n o f c a r c i n o g e n i c i t y h a sb e c o m e a s u b j e c t o f g r e a t i m p o r t a n c e f o rr e g u l a t o r y p e r s p e c t i v e s a n d e c o t o x i c i t ya s s e s s m e n t s . E s p e c i a l l y , p r e d i c t i o n o n l yf r o m t h e c h e m i c a l s t r u c t u r e i s d e s i r e d ,s i n c e i t c a n b e u t i l i z e d e v e n w h e n a t e s tc o m p o u n d i s u n a v a i l a b l e o r d o e s n o t e x i s t .A p p r o a c h e s u s i n g s o m e c o r r e l a t i v e m e t h -o d s f o r n o n c o n g e n e r i c c h e m i c a l s w e r er e v i e w e d b y R i c h a r d ( 1 ) , w h o f o u n d t h a tp u b l i s h e d p r e d i c t i o n a c c u r a c i e s w e r e i ne x c e s s o f 9 0 , w h i l e p r o s p e c t i v e p r e d i c t i o na c c u r a c i e s w e r e l e s s t h a n 70 i n t h e s ea p p r o a c h e s . M o r e o v e r , w o r s e r e s u l t s w e r ep u b l i s h e d f o r a p r o s p e c t i v e p r e d i c t i o n o fr o d e n t c a r c i n o g e n i c i t y u s i n g a v a r i e t y o fq u a n t i t a t i v e s t r u c t u r e - a c t i v i t y r e l a t i o n s h i p( Q S A R ) a p p r o a c h e s ( 2 ) . F u r t h e r s t u d i e sa r e r e q u i r e d t o i m p r o v e t h e p r e d i c t i v er e l i a b i l i t y .We h a v e r e c e n t l y d e v e l o p e d f u z z y a d a p -t i v e l e a s t - s q u a r e s ( F A L S ) ( 3 , 4 ) , a p a t t e r nr e c o g n i t i o n m e t h o d f o r c o r r e l a t i n g s t r u c -t u r e w i t h a c t i v i t y r a t i n g , a n d a p p l i e d t h e

    T h i s p a p e r i s p a r t o f t h e N I E H S P r e d i c t i v e - T o x i c o l o g yE v a l u a t i o n P r o j e c t . M a n u s c r i p t r e c e i v e d 1 5 F e b r u a r y1 9 9 6 ; m a nu s c r i pt a c c e p te d 3 0 M a y 1 9 9 6 .A d d r e s s c o r r e s p o n d e n c e t o D r . I k u o M o r i g u c h i ,S c h o o l o f P h a r m a c e u t i c a l S c i e n c e s , K i t a s a t oU n i v e r s i t y , S h i r o k a n e , M i n a t o - k u , T o k y o 1 0 8 , J a p a n .T e l e p h o n e : 0 3 - 3 4 4 4 - 6 1 6 1 . F a x : 0 3 - 3 4 4 0 - 5 2 4 6 .A b b r e v i a t i o n s u s e d : F A L S , f u z z y a d a p t i v e l e a s ts q u a r e s ; Q S A R , q u a n t i t a t i v e s t r u c t u r e - a c t i v i t y r e l a -t i o n s h i p ; I A R C , I n t e r n a t i o n a l A g e n c y f o r R e s e a r c h o nC a n c e r ; N T P , N a t i o n a l T o x i c o l o g y P r o g r a m ; N I E H S ,N a t i o n a l I n s t i t u t e o f E n v i r o n m e n t a l H e a l t h S c i e n c e s .

    m e t h o d t o a n o n c o n g e n e r i c s t r u c t u r e -c a r c i n o g e n i c i t y c o r r e l a t i o n ( 5 ) . I d e a l l y ,r a t i o n a l p r e c l a s s i f i c a t i o n o f c o m p o u n d sb a s e d o n p o s s i b l e c a r c i n o g e n i c m e c h a n i s m ss h o u l d b e e x t e n s i v e l y i n v e s t i g a t e d t oe n h a n c e t h e p r e d i c t i v e a c c u r a c y o f n o n c o n -g e n e r i c QSAR a p p r o a c h e s . U n f o r t u n a t e l y ,f o r t h i s p u r p o s e t h e r e i s s t i l l n o t s u f f i c i e n tk n o w l e d g e c o n c e r n i n g m o l e c u l a r m e c h a -n i s m s o f c a r c i n o g e n i c i t y . I n t h i s s t u d y , ar o u g h c h e m i c a l c l a s s i f i c a t i o n w a s a d o p t e dt o g e n e r a t e t h e p r e d i c t i v e m o d e l s . U s i n gd a t a f r o m t h e I n t e r n a t i o n a l A g e n c y f o rR e s e a r c h o n C a n c e r ( I A R C ) ( 6 ) a n dt h e N a t i o n a l T o x i c o l o g y P r o g r a m ( N T P )( 7 , 8 ) o n c a r c i n o g e n i c i t y a s t r a i n i n g s e t s ,F A L S QSAR m o d e l s f o r e i g h t c h e m i c a lc l a s s e s w e r e g e n e r a t e d . B a s e d o n t h e s em o d e l s , p r o s p e c t i v e p r e d i c t i o n s o f r o d e n tc a r c i n o g e n i c i t y o f 2 5 o r g a n i c c h e m i c a l si s s u e d b y t h e N a t i o n a l I n s t i t u t e o fE n v i r o nm en t a l H e a l t h S c i e n c e s ( N I E H S )w e r e a c c o m p l i s h e d .M e t h o d sF A L S M e t h o d o l o g yF A L S i s a n o n p a r a m e t r i c p a t t e r n c l a s s i f i e r .I t f o r m u l a t e s QSAR i n a s i n g l e d i s c r i m i -n a n t f u n c t i o n i r r e s p e c t i v e o f t h e n u m b e r o fa c t i v i t y r a t i n g c l a s s e s , a s :

    Z = w o + w 1 x 1 + W 2 X 2 + - - - + W p X p [ 1 ]I n t h i s e q u a t i o n , x k = k t h d e s c r i p t o r( k = 1 , 2 , . . . p ) f o r s t r u c t u r e s , w k ( k = 0 , 1 ,

    F o r n o n c a r c i n o g e n i c a c t i v i t y ,M(Z) = 1 / [ 1 + { ( B o u n d a r y - Z ) / O . 1 - 1 } 4 ]

    w h e n Z. B o u n d a r y - 0 . 1 ,o t h e r w i s e M ( Z ) = 1 [ 3 ]I n t h e s e e q u a t i o n s , B o u n d a r y t a k e s t h ev a l u e o f ( n 1 - n 2 ) / ( n 1 + n 2 ) , w h e r e n 1 a n dn 2 a r e t h e n u m b e r s o f n o n c a r c i n o g e n s a n dc a r c i n o g e n s , r e s p e c t i v e l y , i n t h e t r a i n i n gs e t . T h e c a l c u l a t e d v a l u e o f M(Z) i s t h em e m b e r s h i p g r a d e .T h e w e i g h t c o e f f i c i e n t s i n t h e d i s -c r i m i n a n t f u n c t i o n a r e g e n e r a t e d s o a s t om a x i m i z e t h e sum o f t h e m e m b e r s h i pg r a d e o v e r t h e s e t o f c o m p o u n d s b y a na d a p t i v e l e a s t - s q u a r e s i t e r a t i o n . T h e r e s u l -t a n t d i s c r i m i n a n t f u n c t i o n s t h a t h a v e v a r i -o u s d e s c r i p t o r s a r e v a l i d a t e d b y t h el e a v e - o n e - o u t p r e d i c t i o n . T h e d i s c r i m i n a n tf u n c t i o n w i t h a s c i e n t i f i c a l l y r e a s o n a b l e s e to f s t r u c t u r a l d e s c r i p t o r s g i v i n g t h e b e s tl e a v e - o n e - o u t p r e d i c t i o n i s f i n a l l y a d o p t e da s t h e QSAR m o d e l . T h e F A L S m e t h o d o l -o g y h a s b e e n d e s c r i b e d o n a n u m b e r o fo c c a s i o n s ( 3 - 5 ) .D a t a b a s e a n d C h e m i c a l C l a s s e sA d a t a b a s e i n c l u d i n g a t o t a l o f 5 8 6 c o m -p o u n d s l i s t e d i n T a b l e 1 w a s u s e d f o r t h et r a i n i n g s e t s . T h e c o m p o u n d s h a d b e e nd e s i g n a t e d a s c a r c i n o g e n i c o r n o n c a r c i n o -g e n i c b y IARC ( 6 ) a n d / o r NTP ( 7 , 8 )b a s e d u p o n e v a l u a t i o n o f r o d e n t t e s t d a t a .I f t h e t w o a g e n c i e s ' c a r c i n o g e n i c i t y / n o n -c a r c i n o g e n i c i t y a s s i g n m e n t s d i f f e r e d f o ra n y g i v e n c o m p o u n d , t h e NTP d e s i g n a t i o nw a s a d o p t e d . C o m p o u n d s g i v i n g e q u i v o c a l

    E n v i r o n m e n t a l H e a l t h P e r s p e c t i v e s * V o l 1 0 4 , S u p p l e m e n t 5 * O c t o b e r 1 9 9 6 1 0 5 1

  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    2/8

    MORIGUCHI E T A L .

    T a b l e 1 . T r a i n i n g s e t c o m p o u n d s .N o n c a r c i n o g e n s N o n c a r c i n o g e n s N o n c a r c i n o g e n sA c e t a n i l i d eA c e t i c a c i dA c e t o h e x a m i d eA c e t o n e4 - A c e t y l a m i n o f l u o r e n eA c e t y l s a l i c y l i c a c i dA c r i d i n eA l d i c a r b2 - A m i n o n a p h t h a l e n e - 1 - s u l f o n i c a c i dA m i n o p h e n o l4 - A m i n o q u i n o l i n e - 1 - o x i d ed , / - A m p h e t a m i n eA n i l a z i n eA n t h r a c e n eA n t h r a n i l i c a c i dA n t h r o n eL - A s c o r b i c a c i dA z i n p h o s m e t h y lB e n z a n t h r o n eB e n z i m i d a z o l eB e n z o [ e l p y r e n eB e n z o i c a c i dB e n z o i n1 H B e n z o t r i a z o l eB e n z y l a l c o h o lB H TB i p h e n y l5 - B r o m o d e o x y u r i d i n en - B u t y l c h l o r i d eB u t y l u r e ay - B u t y r o l a c t o n eC a f f e i n eC a l m a g i t eC a l m o i s i n eC a m p h o rC a p r o l a c t a mC a r b a z o l eC a r b r o m a ld - C a r v o n eC h l o r a m i n eC h l o r o - p - p h e n y l e n e d i a m i n e3 - C h l o r o - p - t o l u i d i n eC h l o r o a c e t i c a c i d4 - C h l o r o a c e t y l a c e t a n i l i d eo - C h l o r o a n i l i n eo - C h l o r o b e n z a l m e l a n o n i t r i l e2 - C h l o r o e t h a n o lC h l o r o e t h y l t r i m e t h y l a m m o n i u m2 - C h l o r o m e t h y l ) p y r i d i n eC h l o r o p h e n y l a m i n eC h l o r o p r o p h a m2 - C h l o r o q u i n o l i n eC h l o r p r o p a m i d eC i s - 9 , 1 0 - e p o x y s t e a r i c a c i dC l o n i t r a l i dC o l c h i c i n eC o u m a p h o sC y c l o h e x y l a m i n e

    D & C r e d 9D D TD e x o n4 , 4 - D i a m i n o - 2 , 2 - s t i l b e n e d i s u l f o n i c a c i dD i a r y l a n i l i d e Y e l l o wD i a z i n o nD i b e n z [ a , h ] a n t h r a c e n e - 5 , 6 - o x i d eD i b e n z o - p - d i o x i nD i b e n z y l n i t r o s a m i n e1 , 2 - D i c h l o r o b e n z e n e1 M 1 - D i c h l o r o e t h a n e2 , 4 - D i c h l o r o p h e n o lD i m e t h o a t e2 , 4 - D i m e t h o x y a n i l i n eD i m e t h y l s u l f o x i d e1 , 1 - D i m e t h y l - 4 , 4 ' - b i p y r i d i n i u m d i c h l o r i d eD i m e t h y l a m i n ep - D i m e t h y l a m i n o b e n z a l d e h y d eD i m e t h y l f o r m a m i d e2 , 3 - D i m e t h y l q u i n o x a l i n em - D i n i t r o b e n z e n e2 , 4 - D i n i t r o p h e n o lD i n i t r o s o p e n t a m e t h y l e n e t e t r a m i n eD i o x a t h i o nE n d r i nE p h e d r i nE t h a n o lE t h i o n a m i d eE t h y l e n e g l y c o l1 , 1 - E t h y l e n e - 2 , 2 - b i p y r i d i n i u m d i b r o m i d eE t h y l e n e d i a m i n e t e t r a a c e t i c a c i dF l u o r e n e5 - F l u o r o d e o x y u r i d i n eF o l p e tG e r a n y l a c e t a t eG i b b e r e l l i c a c i dG l y c i d y l s t e a r a t eH C b l u e 2H e x a c a r b a t eH e x a c h l o r o c y c l o p e n t a d i e n e - 1 , 3H y d r o c o r t i s o n e - H y d r o x y - 2 - a c e t y l a m i n o f l u o r e n e3 - H y d r o x y - 2 - a c e t y l a m i n o f l u o r e n e5 - H y d r o x y - 2 - a c e t y l a m i n o f l u o r e n e7 - H y d r o x y - 2 - a c e t y l a m i n o f l u o r e n e8 - H y d r o x y q u i n o l i n eI n d o l e5 - l o d o d e o x y u r i d i n el o d o f o r mL i t h o c h o l i c a c i dM a l a o x o nM a l a t h i o nM a l e i c h y d r a z i d eD - M a n n i t o ld , / - M e n t h o lM e t h a n o lM e t h i o n i n eM e t h o x y c h l o r

    M e t h y l b r o m i d eM e t h y l m e t h a c r y l a t eM e t h y l p a r a t h i o n3 - M e t h y l - 4 - n i t r o q u i n o l i n e - N - o x i d e2 - M e t h y l i n d o l e2 - N a p h t h o lN - 1 - N a p h t h y l ) e t h y l e n e d i a m i n e2 - N a p h t h y l a m i n e - 1 , 5 - d i s u l f o n i c a c i dN i c o t i n e5 - N i t r o - 2 - f u r o i c a c i d4 - N i t r o - o - p h e n y l e n e d i a m i n e4 - N i t r o a n t h r a n i l i c a c i dN i t r o b e n z e n e1 - N i t r o n a p h t h a l e n ep - N i t r o p h e n o lN i t r o s o s t y r e n eO r a n g e GO r o t i c a c i dP e n i c i l l i n VP e r y l e n eP h e n a n t h r e n eP h e n o l - P h e n y l - 3 - m e t h y l - 5 - p y r a z o l o n eP h e n y l e p h r i n eo - P h e n y l p h e n o lP h o t o d i e l d r i nP h t h a l a m i d eP h t h a l i c a n h y d r i d eP i p e r o n y l b u t o x i d eP o n c e a u S XP r o m e t h a z i n eP r o p y l p - h y d r o x y b e n z o a t eP r o p y l e n eP y r a z i n a m i d eP y r e n eP y r i m e t h a m i n eQ u i n t o z e n eR e s o r c i n o lR i b o f l a v i nS u c c i n i c a n h y d r i d eS u l f a g u a n i d i n eS u l f i s o x a z o l e3 - S u l f o l e n eS u n s e t y e l l o w F C FT e t r a c e n e2 , 3 , 5 , 6 - T e t r a c h l o r o - 4 - n i t r o a n i s o l eT e t r a c y c l i n eT o l a z a m i d eT o l b u t a m i d eT o l u e n eL - T r y p t o p h a nV i n y l i d e n e c h l o r i d em - V i n y l t o l u e n ep - V i n y l t o l u e n em - X y l e n eo - X y l e n ep - X y l e n e

    C a r c i n o g e n s C a r c i n o g e n s C a r c i n o g e n sA c e t a m i d eN - A c e t o x y - 2 - a c e t y l a m i n o f l u o r e n e - A c e t o x y s a f r o l e4 - A c e t y l a m i n o b i p h e n y l2 - A c e t y l a m i n o f l u o r e n e

    E n v i r o n m e n t a l H e a l t h P e r s p e c t i v e s V o l 1 0 4 , S u p p l e m e n t 5 * O c t o b e r 1 9 9 6

    A c r o n y c i n eA c t i n o m y c i n DA F - 2A f l a t o x i n B 1A f l a t o x i n B 2

    A f l a t o x i nA f l a t o x i n M lA l d r i nA l l y l c h l o r i d eA l l y l g l y c i d y l e t h e r C o n t i n u e d ) 0 5 2

  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    3/8

    PREDICTION O F CARCINOGENICITY USING F A L S

    T a b l e 1 . C o n t i n u e d .C a r c i n o g e n s C a r c i n o g e n s C a r c i n o g e n sA l l y l i s o v a l e r a t e3 - A m i n o - 1 H - 1 , 2 , 4 - t r i a z o l e1 - A m i n o - 2 - m e t h y l a n t h r a q u i n o n e4 - A m i n o - 2 - n i t r o p h e n o l3 - A m i n o - 4 - e t h o x y a c e t a n i l i d e2 - A m i n o - 4 - n i t r o p h e n o l2 - A m i n o - 5 - 5 - n i t r o - 2 - f u r y l ) - 1 , 3 , 4 - t h i a d i a z o l e2 - A m i n o - 5 - n i t r o p h e n o l2 - A m i n o - 5 - n i t r o t h i a z o l e3 - A m i n o - 9 - e t h y l c a r b a z o l e2 - A m i n o a n t h r a q u i n o n e 1 - A m i n o u n d e c a n o i c a c i do - A n i s i d i n eA r a m i t e5 - A z a c y t i d i n eA z a s e r i n eA z i r i d i n e2 - 1 - A z i r i d i n y l ) e t h a n o lA z i r i d y l b e n z o q u i n o n eA z o x y m e t h a n eB e n z [ a ] a n t h r a c e n eB e n z [ a ] a n t h r a c e n e - 5 , 6 - o x i d eB e n z [ c ] a c r i d i n eB e n z a l d e h y d eB e n z e n eB e n z o [ a ] p y r e n eB e n z o [ a l p y r e n e - 4 , 5 - o x i d eB e n z o [ b ] f l u o r a n t h e n eB e n z o L U ] f l u o r a n t h e n eB e n z o f u r a nN - B e n z o y l o x y - 4 - m e t h y l a m i n o a z o b e n z e n eB e n z y l a c e t a t eB e n z y l c h l o r i d eB e n z y l v i o l e t 4 Bo - B e n z y l - p - c h l o r o p h e n o lB i s i - a z i r i d i n y l ) - m o r p h o l i n o p h o s p h i n eB i s 2 - c h l o r o - 1 - m e t h y l e t h y l ) e t h e rB i s 2 - c h l o r o e t h y l ) e t h e rB i s ( 2 - h y d r o x y m e t h y l ) d i t h i o c a r b a m a t e1 , 2 - B i s c h l o r o m e t h o x y ) e t h a n e , 4 - B i s ( c h l o r o m e t h o x y m e t h y l ) b e n z e n eB i s c h l o r o m e t h y l ) e t h e r2 , 2 - B i s p - h y d r o x y p h e n y l ) p r o p a n e d i g l y c i d y l e t h e rB l u e V R SB r i l l i a n t b l u e F C F d i a m m o n i u mB r o m o c h l o r o m e t h a n eB r o m o e t h a n e7 - B r o m o m e t h y l - 1 2 - m e t h y l b e n z [ a l a n t h r a c e n e1 , 3 - B u t a d i e n e1 , 4 - B u t a n e s u l t o n eB u t y l b e n z y l p h t h a l a t e, B - B u t y r o l a c t o n eC . l . A c i d O r a n g e 3C l . A c i d R e d i 1 4C . l . D i r e c t B l u e 1 5C . l . D i r e c t B l u e 2 1 8C . l . D i s p e r s e B l u e 1C . l . D i s p e r s e Y e l l o w 3C . l . P i g m e n t R e d 3C . l . V A T Y e l l o w 4C a n t h a r i d i nC a p t a nC a r b o n t e t r a c h l o r i d eC h l o r a m b e nC h l o r a m b u c i lC h l o r d a n eC h l o r d e c o n e ( k e p o n e )

    C h l o r e n d i c a c i dC h l o r m a d i n o n e a c e t a t eC h l o r n a p h a z e n3 - C h l o r o - 2 - m e t h y l p r o p e n e4 - C h l o r o - n - p h e n y l e n e d i a m i n e4 - C h l o r o - o - p h e n y l e n e d i a m i n e5 - C h l o r o - o - t o l u i d i n ep - C h l o r o a n i l i n eC h l o r o b e n z i l a t eC h l o r o d i b r o m o m e t h a n eC h l o r o e t h a n eC h l o r o f o r m3 - ( C h l o r o m e t h y l ) p y r i d i n e 0 - C h l o r o m e t h y l - 9 - c h l o r o a n t h r a c e n e1 i - C h l o r o m e t h y l - 9 - m e t h y l a n t h r a c e n e7 - C h l o r o m e t h y l b e n z [ a ] a n t h r a c e n e1 4 - C h l o r o p h e n y l ) - 3 , 3 - d i m e t h y l t r i a z i n eC h l o r o t h a l o n i lC h r y s e n eC i n n a m y l a n t h r a n i r a t eC i t r u s r e d 2C o u m a r i nm - C r e s i d i n ep - C r e s i d i n eC u p f e r r o nC y c a s i nC y c l a m a i c a c i dC y c l o c h l o r o t i n eC y c l o p h o s p h a m i d eC y t e m b e n aD a c a r b a z i n eD a m i n o z i d eD a p s o n eD a u n o r u b i c i np , p ' - D D ED e c a b r o m o d i p h e n y l o x i d ef - D e o x y - 6 - t h i o g u a n o s i n eD i 2 - e t h y l h e x y l ) a d i p a t eD i 2 - e t h y l h e x y l ) p h t h a l a t eN , N V - D i a c e t y l b e n z i d i n eD i a l l a t e2 , 4 - D i a m i n o a n i s o l e2 , 4 - D i a m i n o p h e n o lD i a z o a c e t y l g l y c i n e h y d r a z i d eD i a z o a c e t y l g l y c i n e a m i d eD i b e n z [ a , c l a n t h r a c e n eD i b e n z [ a , h ] a c r i d i n eD i b e n z [ a , h ] a n t h r a c e n eD i b e n z [ a , j l a c r i d i n eD i b e n z o [ a , e ] p y r e n eD i b e n z o [ a , h ] p y r e n eD i b e n z o [ a , i l p y r e n eD i b e n z o [ a , / ] p y r e n e7 H - D i b e n z o [ c , g ] c a r b a z o l eD i b e n z o [ h , r s t l p e n t a p h e n e2 , 3 - D i b r o m o - 1 - p r o p a n o l , 2 - D i b r o m o - 3 - c h l o r o p r o p a n e

    , i - D i b r o m o - 3 - c h l o r o p r o p a n eD i b r o m o m a n n i t o l3 , 3 - D i c h l o r o - 4 , 4 - d i a m i n o d i p h e n y l e t h e r2 , 6 - D i c h l o r o - p - p h e n y l e n e d i a m i n e1 , 4 - D i c h l o r o b e n z e n e3 , 3 - D i c h l o r o b e n z i d i n e1 , 2 - D i c h l o r o e t h a n eD i c h l o r o m e t h a n e9 , 1 0 - D i c h l o r o m e t h y l a n t h r a c e n e1 , 2 - D i c h l o r o p r o p a n e

    1 , 3 - D i c h l o r o p r o p e n eD i c h l o r v o sD i c o f o l1 , 2 , 3 , 4 - D i e p o x y b u t a n e1 , 2 , 7 , 8 - D i e p o x y o c t a n eD i e t h y l s u l f a t eD i e t h y l s t i l b e s t r o lD i e t h y l s t i l b e s t r o l d i p r o p i o n a t eD i g l y c i d y l r e s o r c i n o l e t h e r7 , 8 - D i h y d r o b e n z o [ a ] p y r e n e3 , 4 - D i h y d r o c o u m a r i nD i h y d r o s a f r o l e3 , 3 ' - D i m e t h o x y b e n z i d i n e3 , 3 ' - D i m e t h o x y b e n z i d i n e - 4 , 4 ' - d i i s o c y a n a t eD i m e t h y l m o r p h o l o n o p h o s p h o r a m i d a t eD i m e t h y l s u l f a t e1 , 2 - D i m e t h y l - 5 - n i t r o i m i d a z o l e D i m e t h y l a m i n o ) - m e t h y l e n e i m i n o ) - 5 - 2 - 5 - n i t r o - 2 -f u r a n ) v i n y l ) o x a d i a z o l e9 , 1 0 - D i m e t h y l a n t h r a c e n e7 , 1 2 - D i m e t h y l b e n z [ a l a n t h r a c e n e7 , 9 - D i m e t h y l b e n z [ c l a c r i d i n eD i m e t h y l c a r b a m y l c h l o r i d eD i m e t h y l v i n y l c h l o r i d e2 , 4 - D i n i t r o f l u o r o b e n z e n e1 , 4 - D i n i t r o s o p i p e r a z i n e2 , 4 - D i n i t r o t o l u e n e1 , 4 - D i o x a n e1 , 1 - D i p h e n y l - 2 - b u t y n y l N - c y c l o h e x y l c a r b a m a t eD i p h e n y l h y d a n t o i nD i r e c t b l a c k 3 8D i r e c t b l u e 6D i r e c t b r o w n 9 5E p i c h l o r o h y d r i n3 ' , 4 ' - E p o x y - 6 ' - m e t h y l - c y c l o h e x y l m e t h y l 3 , 4 - e p o x y - 6 -m e t h y l - c y c l o h e x y l c a r b o x y l a t e1 , 2 - E p o x y b u t a n e1 - E p o x y e t h y l - 3 , 4 - e p o x y c y c l o h e x a n eE s t r a d i o l 3 - b e n z o a t eE s t r a d i o l d i p r o p i o n a t eE s t r a d i o l m u s t a r d1 7 , B - E s t r a d i o lE s t r i o lE s t r o n eE s t r o n e b e n z o a t eE t h i n y l e s t r a d i o lE t h i o n i n eE t h y l a c r y l a t eE t h y l b r o m o a c e t a t eE t h y l m e t h a n e s u l f o n a t eE t h y l p - t o l u e n e s u l f o n a t eN - E t h y l - N ' - n i t r o - N - n i t r o s o g u a n i d i n eE t h y l e n e d i b r o m i d eE t h y l e n e o x i d eE t h y l e n e s u l p h i d eE t h y l e n e t h i o u r e aE t h y n o d i o l d i a c e t a t eE v a n s b l u eF a n f tF a s t g r e e n F C FF o r m a l d e h y d e2 - F o r m y l h y d r a z i n o ) - 4 - 5 - n i t r o - 2 - f u r y l ) - t h i a z o l eF u r a l t a d o n eF u r a nF u r f u r a lF u r o s e m i d eG l y c i d a l d e h y d e C o n t i n u e d )

    E n v i r o n m e n t a l H e a l t h P e r s p e c t i v e s V o l 1 0 4 , S u p p l e m e n t 5 * O c t o b e r 1 9 9 6 0 5 3

  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    4/8

    M O R I G U C HI ET A L .

    T a b l e 1 . C o n t i n u e d .C a r c i n o g e n s C a r c i n o g e n s C a r c i n o g e n sG l y c i d o lG r i s e o f u l v i nG u i n e a g r e e n BH C B l u e 1H e p t a c h l o rH e x a c h l o r b e n z e n eH e x a c h l o r o b u t a d i e n eH e x a c h l o r o d i b e n z o - p - d i o x i n sH e x a c h l o r o e t h a n eH y d o r x y m e t h y l - 1 2 - m e t h y l b e n z [ a ] a n t h r a c e n eH y d r o q u i n o n eN - H y d r o x y - 2 - a c e t y l a m i n o f l u o r e n eN - 2 - H y d r o x y e t h y l ) h y d r a z i n e4 - H y d r o x y l a m i n o q u i n o l i n e - 1 - o x i d e6 - H y d r o x y m e t h y l b e n z o [ a l p y r e n eN - H y d r o x y p h e n a c e t i n ' - H y d r o x y s a f r o l eN - H y d r o x y u r e t h a n eI C R - 1 0 ( Q u i n a c r i n e m u s t a r d )I C R - 1 7 0I C R F - 1 5 9I n d e n o 1 , 2 , 3 - C D ) p y r e n el o d i n a t e d g l y c e r o lI s a t i d i n eN - l s o b u t y l - N ' - n i t r o - N - n i t r o s o g u a n i d i n eI s o n i c o t i n i c a c i d h y d r a z i d eI s o p h o r o n eI s o p h o s p h a m i d eI s o s a f r o l eL a s i o c a r p i n eL i g h t g r e e n S Fd - L i m o n e n eL u t e o s k y r i nM a n n o m u s t i n eM e d r o x y p r o g e s t e r o n e a c e t a t eM e g e s t r o l a c e t a t eM e l a m i n eM e l p h a l a n2 - M e r c a p t o b e n z o t h i a z o l eM e s t r a n o lM e t h a p y r i l e n e3 - M e t h o x y - 4 - a m i n o a z o b e n z e n eM e t h y l c a r b a m a t eM e t h y l i o d i d eM e t h y l m e t h a n e s u l f o n a t e2 - M e t h y l - 1 - n i t r o a n t h r a q u i n o n eN - M e t h y l - N ' - n i t r o - N - n i t r o s o g u a n i d i n eN - M e t h y l - N - n i t r o s o a n i l i n eM e t h y l a z o x y m e t h a n o lM e t h y l a z o x y m e t h a n o l a c e t a t e7 - M e t h y l b e n z [ a l a n t h r a c e n ea - M e t h y l b e n z y l a l c o h o l3 - M e t h y l c h o l a n t h r e n e4 , 4 ' - M e t h y l e n e b i s 2 - c h l o r o a n i l i n e )N - M e t h y l o l a c r y l a m i d eM e t h y l t h i o u r a c i lM e t r o n i d a z o l eM i c h l e r ' s k e t o n eM i r e xM i t o m y c i n CM o n o c r o t a l i n eM o n u r o nM u s t a r dN a l i d i x i c a c i dN a p h t h a l e n eN a t u l a n p r o c a r b a z i n e )N i r i d a z o l e

    N i t h i a z i d eN i t r o g e n m u s t a r d N - o x i d eN i t r i l o t r i a c e t i c a c i dN - 4 - 5 - N i t r o - 2 - f u r y l ) - 2 - t h i a z o l y l ) a c e t a m i d e5 - N i t r o - o - a n i s i d i n e5 - N i t r o - o - t o l u i d i n e3 - N i t r o - p - a c e t o p h e n e t i d e2 - N i t r o - p - p h e n y l e n e d i a m i n e5 - N i t r o a c e n a p h t h e n eo - N i t r o a n i s o l e5 - N i t r o b e n z i m i d a z o l e6 - N i t r o b e n z i m i d a z o l e2 - N i t r o b i p h e n y l4 - N i t r o b i p h e n y lN i t r o f e n2 - N i t r o f l u o r e n eN i t r o f u r a n t o i nN i t r o f u r a z o n e( ( N i t r o f u r f u r y l i d e n e ) a m i n o ) - 2 - i m i d a z o l i d i n o n eN i t r o g e n m u s t a r d2 - N i t r o n a p h t h a l e n e2 - N i t r o p r o p a n e8 - N i t r o q u i n o l i n e4 - N i t r o q u i n o l i n e - 1 - o x i d eN - N i t r o s o - N - m e t h y l u r e t h a n eN - N i t r o s o b u t y l u r e aN - N i t r o s o d i b u t y l a m i n eN - N i t r o s o d i e t h a n o l a m i n eN - N i t r o s o d i e t h y l a m i n eN - N i t r o s o d i m e t h y l a m i n e4 - N i t r o s o d i m e t h y l a n i l i n eN - N i t r o s o d i p e n t y l a m i n ep - N i t r o s o d i p h e n y l a m i n eN - N i t r o s o d i p r o p y l a m i n eN - N i t r o s o e t h y l u r e aN i t r o s o m e t h y l e t h y l a m i n eN - N i t r o s o m e t h y l v i n y l a m i n eN - N i t r o s o m e t h y l u r e aN - N i t r o s o m o r p h i n e2 - N i t r o s o n a p h t h y l e n eN ' - N i t r o s o n o r n i c o t i n eN - N i t r o s o p i p e r i d i n eN - N i t r o s o p y r r o l i d i n eN - N i t r o s o s a r c o s i n eN o r e t h i s t e r o n eN o r e t h i s t e r o n e a c e t a t eN o r e t h y n o d r e lO c h r a t o x i n AO i l o r a n g e S SO r a n g eO x a z e p a m4 , 4 - O x y d i a n i l i n eP a r a s c o r b i c a c i dP a t u l i nP e n i c i l l i c a c i dP e n t a c h l o r o a n i s o l eP e n t a c h l o r o e t h a n eP e n t a c h l o r o p h e n o lN - P e n t y l - N ' - n i t r o - N - n i t r o s o g u a n i d i n eP e r o x y a c e t i c a c i dP h e n a c e t i nP h e n a z o p y r i d i n eP h e n e s t e r i nP h e n i c a r b a z i d eP h e n o b a r b i t a lP h e n o x y b e n z a m i n eP h e n y l b u t a z o n e

    P h e n y t o i nP i p e r o n y l s u l f o x i d eP i v a l o l a c t o n eP o l y b r o m i n a t e d b i p h e n y lP o n c e a u 3 RP o n c e a u M XP r o g e s t e r o n eP r o n a m i d eP r o n e t a l o l1 , 3 - P r o p a n e s u l t o n eP - P r o p i o l a c t o n eN - P r o p y l c a r b a m a t eN - P r o p y l - N ' - n i t r o - N - n i t r o s o g u a n i d i n eP r o p y l e n e o x i d eP r o p y l e n e i m i n eP r o p y l t h i o u r a c i lQ u i n o l i n eR e s e r p i n eR e t r o r s i n eR h o d a m i n e 6 GR h o d a m i n e BS a c c h a r i nS a f r o l eS e m i c a r b a z i d eS h i k i m i c a c i dS t e r i g m a t o c y s t i nS t r e p t o z o t o c i nS t y r e n eS u d a nS u d a n S u l f a l l a t eS u l f a m e t h o x a z o l eT e s t o s t e r o n eT e s t o s t e r o n e p r o p i o n a t e2 , 3 , 7 , 8 - T e t r a c h l o r o d i b e n z o - p - d i o x i n1 , 1 , 1 , 2 - T e t r a c h l o r o e t h a n e1 , 1 , 2 , 2 - T e t r a c h l o r o e t h a n eT e t r a c h l o r o e t h y l e n eT e t r a c h l o r v i n p h o sT e t r a n i t r o m e t h a n eT h i o t e p aT h i o u r a c i lo - T o l u e n e s u l f o n a m i d eT o x a p h e n eT r e n i m o n t r i s a z i r i d i n y l - p - b e n z o q u i n o n eT r i n i t r o f l u o r e n - 9 - o n eT r i a m t e r e n eT r i b r o m o m e t h a n e2 , 4 , 6 - T r i c h l o r o a n i l i n e1 , 1 , 2 - T r i c h l o r o e t h a n eT r i c h l o r o e t h y l e n e2 , 4 , 6 - T r i c h l o r o p h e n o l , 2 , 3 - T r i c h l o r o p r o p a n eT r i e t h y l e n e g l y c o l d i g l y c i d y l e t h e rT r i f l u r a l i n eT r i s - a z i r i d i n y l - s - t r i a z i n e )T r i s ( 2 , 3 - d i b r o m o p r o p y l ) p h o s p h a t eT r i s 2 - c h l o r o - 1 - m e t h y l e t h y l ) e t h e r1 , 2 , 3 - T r i s ( c h l o r o m e t h o x y ) p r o p a n eT r y p a n b l u eU r a c i l m u s t a r dU r e t h a n eV i n y l c h l o r i d e4 - V i n y l c y c l o h e x e n eZ e a r a l e n o n e

    E n v i r o n m e n t a l H e a l t h P e r s p e c t i v e s V o l 1 0 4 , S u p p l e m e n t 5 O c t o b e r 1 9 9 60 5 4

  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    5/8

    PREDICTION CARCINOGENICITY USING FALS

    e v i d e n c e o f c a r c i n o g e n i c i t y w e r e n o t u s e d .I n o r g a n i c a n d m e t a l l o - o r g a n i c c h e m i c a l s ,p o l y m e r s , a n d m i x t u r e s w e r e a l s o e x c l u d e df r o m t h e t r a i n i n g s e t s .T h e c h e m i c a l c l a s s i f i c a t i o n w a s d e s i g n e dt o b e b r o a d e n o u g h t o p e r m i t a r e a s o n a b l en u m b e r o f t r a i n i n g c o m p o u n d s t o f a l l i n t oe a c h c l a s s f o r g e n e r a t i o n o f s t a t i s t i c a l l ys i g n i f i c a n t QSAR m o d e l s . W i t h a s p e c i a lr e f e r e n c e t o t h e c h e m i c a l f e a t u r e s o f t h ec o m p o u n d s t o b e p r e d i c t e d , t h e f o l l o w i n ge i g h t c h e m i c a l c l a s s e s w e r e i n v e s t i g a t e d :c l a s s 1 , h y d r o c a r b o n s ( 3 9 c o m p o u n d s ) ;c l a s s 2 , h e t e r o c y c l i c s ( 1 8 5 c o m p o u n d s ) ;c l a s s 3 , n i t r o a n d n i t r o s o c o m p o u n d s a n dN - o x i d e s ( 9 8 c o m p o u n d s ) ; c l a s s 4 , h a l i d e s( 1 5 2 c o m p o u n d s ) ; c l a s s 5 , a l c o h o l s , p h e -n o l s , a n d e t h e r s ( 1 6 0 c o m p o u n d s ) ; c l a s s 6 ,c a r b o n y l c o m p o u n d s ( 2 0 5 c o m p o u n d s ) ;c l a s s 7 , n o n a r o m a t i c a m i n e s ( 2 5 c o m -p o u n d s ) ; a n d c l a s s 8 , o x y g e n a t e d s u l f u rc o m p o u n d s ( 5 2 c o m p o u n d s ) . An i n d i v i d -u a l c o m p o u n d c a n a p p e a r i n s e v e r a l c l a s s e sa c c o r d i n g t o i t s c h e m i c a l s t r u c t u r e .2 , 3 , 5 , 6 - T e t r a c h l o r o - 4 - n i t r o a n i s o l e , f o re x a m p l e , a p p e a r s i n c l a s s e s 3 , 4 , a n d 5 .S t r u c t u n r a l D e s c r i p t o r sT h r e e k i n d s o f v a r i a b l e s - c o n t i n u o u sv a r i a b l e s , d i s c r e t e v a r i a b l e s , a n d i n d i c a t o rv a r i a b l e s -were i n v e s t i g a t e d a s c a n d i d a t ed e s c r i p t o r s . M o l e c u l a r w e i g h t , h y d r o p h o b i cc o n s t a n t ( l o g P ) , a n d i t s s q u a r e d v a l u e w e r eu s e d a s c o n t i n u o u s v a r i a b l e s . T h e l o g P( o c t a n o l / w a t e r ) v a l u e s u s e d w e r e c a l c u l a t e du s i n g t h e r e v i s e d v e r s i o n ( 1 0 ) o f o u r s i m p l em e t h o d ( 1 1 , 1 2 ) . D i s c r e t e v a r i a b l e s w e r ed e f i n e d a s t h e n u m b e r o f s p e c i f i c a t o m s ,b o n d s , f u n c t i o n a l g r o u p s , a n d s p e c i f i c r i n ga n d c h a i n s t r u c t u r e s . T h e u p p e r v a l u e s o f t h ed i s c r e t e v a r i a b l e s o t h e r t h a n t h e n u m b e r o fs p e c i f i c a t o m s a n d b o n d s w e r e e m p i r i c a l l ys e t a t 3 . 0 s o a s t o a v o i d p o s s i b l e o v e r e s t i m a -t i o n f o r p o l y f u n c t i o n a l s t r u c t u r e s . I n d i c a t o rv a r i a b l e s w e r e d e f i n e d a s 1 f o r t h e p r e s e n c ea n d 0 f o r t h e a b s e n c e o f a n y k i n d o f s t r u c -t u r a l o r p h y s i c o c h e m i c a l f e a t u r e s c o n s i d e r e dt o b e c o n t r i b u t i n g t o c a r c i n o g e n i c i t y .R e s u l t s a n d D i s c u s s i o nG e n e r a t i o n o f P r e d i c t i v e M o d e l sT h e F AL S a n a l y s e s w e r e p e r f o r m e d f o r c a r -c i n o g e n i c / n o n c a r c i n o g e n i c d i c h o t o m i z a t i o nu s i n g e i g h t s e t s o f d a t a f o r t h e v a r i o u s c h e m -i c a l c l a s s e s . A s a r e s u l t , t h e e i g h t s a t i s f a c t o r ye q u a t i o n s i n c l u d i n g f r o m 5 t o 2 5 d e s c r i p -t o r s ( M o r i g u c h i e t a l . , u n p u b l i s h e d d a t a )w e r e d e r i v e d . T h e y a r e l i s t e d i n T a b l e 2 .D e s c r i p t o r s w i t h p o s i t i v e c o e f f i c i e n t sa r e u s u a l l y c o n s i d e r e d t o c o n t r i b u t e i n a

    T a b l e 2 . F A L S Q S A R m o d e l s f o r p r e d i c t i n g c a r c i n o g e n ic i t y .D e s c r i p t o r a C l a s s C l a s s 2 C l a s s 3 C l a s s 4 C l a s s 5 C l a s s 6 C l a s s 7 C l a s s 8L o g P c a l c - 0 . 7 0 3 0 . 0 8 0 0 . 0 5 0 0 . 1 3 0 - 0 . 2 5 5( L o g P c a , c 2( m w / 1 0 0 ) 1 / 2C , s p 3C , s p 2C , s pH ( - C )H ( - N )H ( - O )H ( - S )SpC lN u m b e r o f u n s a t . b o n d sC = C i n c h a i n sQ N bP O L bC \CH CC

    CC C C

    C> N - N < o u t s i d e r i n g s> C = O k e t o )> C = O q u i n o n e s ) S a t . C ) - O H U n s a t . C ) - O H( N I - O H( S I - O H- C O O H , ( - C O ) 2 0> N - - - O- N O 2> N - C S - N C = C - C - C I , > C = C - C I- C H C I 2 , > C C I - C C I < a n d / o r- C C I = C C I - o u t s i d e r i n g sO - C H 2 - C H 2 - C IO ( C H 2 - C H 2 - C I ) 2- C X n , n . 2C O - N H 2 , C S - N H 2 A l i p h . C ) 2 N H A l i p h . C ) 3 NA r - N H 2A r - N H -A r - N C H 3 ) 2A r - N = N - A rA r - N O 2A r - N = OA r - N H - C O -A r - O HA r - C l

    0 00 0

    Q>CH,

    - 0 . 0 0 5 0 . 1 1 2- 1 . 4 3 80 . 0 9 9

    0 . 0 6 2- 0 . 5 8 9- 0 . 2 0 30 . 9 2 9

    0 . 8 8 1- 0 . 0 3 20 . 1 2 5

    - 0 . 1 4 70 . 1 2 4- 0 . 0 5 7 - 0 . 1 3 6

    - 0 . 0 4 0- 0 . 1 3 8

    - 0 . 1 4 7

    0 . 2 0 60 . 0 5 60 . 4 7 0

    2 . 1 5 2- 0 . 7 8 1

    - 0 . 1 0 6- 0 . 2 8 3 - 0 . 2 0 8

    - 0 . 0 4 8- 0 . 0 5 5

    0 . 2 2 3 0 . 1 5 5 0 . 1 4 0- 0 . 3 5 9

    0 . 4 9 10 . 0 6 11 . 2 6 72 . 0 1 7

    - 0 . 0 4 80 . 2 5 21 . 5 1 4- 0 . 1 6 7 0 . 1 2 9

    0 . 6 7 41 . 0 3 80 . 4 7 80 . 0 8 5- 0 . 4 3 1

    - 0 . 6 4 2

    1 . 1 0 2

    1 . 6 2 3

    - 0 . 6 5 60 . 2 2 5

    - 0 . 6 6 10 . 4 7 0

    1 . 2 9 00 . 2 2 2 - 0 . 0 8 30 . 2 5 80 . 1 6 9 - 0 . 1 3 7- 0 . 1 7 8

    0 . 7 6 4

    0 . 9 9 5- 0 . 2 3 70 . 4 7 4- 0 . 1 4 9- 0 . 5 0 8- 0 . 3 6 5- 0 . 3 1 0

    0 . 4 0 10 . 3 3 20 . 7 7 4

    0 . 0 4 50 . 5 0 00 . 3 0 6

    0 . 5 7 8

    0 . 6 0 7- 0 . 0 1 0- 0 . 4 7 4

    0 . 9 0 50 . 3 1 3

    0 . 3 2 8- 0 . 1 9 6 0 . 4 7 7- 0 . 0 4 90 . 0 3 6

    0 . 6 6 80 . 4 9 7 0 . 2 0 0- 0 . 7 9 4

    0 . 1 1 30 . 2 7 2 0 . 7 5 2

    - 0 . 4 0 8- 0 . 3 4 1 0 . 3 9 8- 0 . 2 8 1

    0 . 5 1 8

    - 0 . 7 0 5 - 0 . 2 1 5( C o n t i n u e d )

    E n v i r o nm e n t a l H e a l th P e r s p e c t i v e s V o l 1 0 4 , S u p p l e m e n t 5 * O c t o b e r 1 9 9 6 1 0 5 5

  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    6/8

    MORIGUCHI ET A L .

    T a b l e 2 . C o n t i n u e d .D e s c r i p t o r a C l a s s C l a s s 2 C l a s s 3 C l a s s 4 C l a s s 5 C l a s s 6 C l a s s 7 C l a s s 8 0 . 1 7 1

    - 0 . 4 0 1 - 0 . 6 1 1N - C O - N , N - C S - N i n r i n g s - 0 . 2 5 8N - C O - N o u t s i d e r i n g s - 0 . 1 8 0M - 1 1 . 2 3 2M - 2 1 . 4 3 6M - 3 1 . 4 1 1C H 2 = C - C = C 0 . 7 8 9C H 2 = C - C - C - C = C 1 . 4 3 6R N G b - 0 . 0 9 2 0 . 4 3 3a\ a

    1 . 0 4 6a a

    A ANA h N < - 0 . 3 7 5A A0s 0 . 5 9 5N NC o n s t a n t - 0 . 6 6 7 0 . 7 4 6 - 0 . 4 1 2 - 0 . 7 5 1 - 0 . 2 2 7 - 0 . 3 0 8 - 0 . 4 6 8 - 2 . 6 0 0B o u n d a r y - 0 . 2 3 1 - 0 . 4 1 6 - 0 . 6 3 3 - 0 . 5 0 0 - 0 . 3 8 8 - 0 . 3 7 6 0 . 0 4 0 - 0 . 2 6 9

    ' Q , h e t e r o a t o m s ; A , C a n d / o r h e t e r o a t o m s ; X , h a l o g e n a t o m s ; A r , a r o m a t i c r i n g s ; M - 1 , 9 - M e - a n t h r a c e n e m o i e t y ;M - 2 , f l u o r a n t h e n e m o i e t y ; M - 3 , b e n z o o r d i h y d r o b e n z o ) [ a o r b ] p h e n a n t h r e n e m o i e t y . M - 1 a n d t h e r e a f t e r a r e i n d i -c a t o r v a r i a b l e s . b S o u r c e : M o r i g u c h i 1 0 ) . a b l e 3 . R e l i a b i l i t y o f t h e Q S A R m o d e l s .

    S e t o f d a t a a2 4 / 1 51 3 1 / 5 48 0 / 1 81 1 4 / 3 81 1 1 / 4 91 4 1 / 6 41 2 / 1 33 3 / 1 9

    N o . o fd e s c r i p t o r s62 3

    1 12 02 22 557

    F a l s en e g a t i v e5 . 11 . 62 . 02 . 02 . 52 . 04 . 05 . 8

    R e c o g n i t i o nF a l s ep o s i t i v e0 . 08 . 13 . 15 . 96 . 91 0 . 70 . 03 . 8

    M M G b0 . 9 4 90 . 8 9 00 . 9 2 20 . 8 9 90 . 8 7 80 . 8 6 00 . 9 3 50 . 8 7 7

    F a l s en e g a t i v e7 . 75 . 43 . 17 . 97 . 54 . 48 . 05 . 8

    L e a v e - o n e - o u tF a l s ep o s i t i v e0 . 09 . 76 . 11 1 . 28 . 81 2 . 71 2 . 07 . 7

    MMGb0 . 9 2 30 . 8 4 50 . 8 9 90 . 8 2 20 . 8 2 70 . 8 0 20 . 7 8 30 . 8 3 1

    N u m b e r o f t r a i n i n g c o m p o u n d s : c a r c i n o g e n s / n o n c a r c i n o g e n s . h M e a n m e m b e r s h i p g r a d e .positive way t o t h e es tim ate of carcino-g e n i c i t y , w h e r e a s d e s c r i p t o r s wi t h n e g a t i v ec o e f f i c i e n t s contribute in a negative w ay.H o w e v e r , t h i s i s no t a l w a y s v a l i d b e y o n dt h e c h e m i c a l c l a s s e s . M o r e o v e r , s t r i c t l ys p e a k i n g , t h e s e c o e f f i c i e n t s cannot b e u s e dt o make g e n e r a l i n f e r e n c e s a b o u t t h ec o n t r i b u t i o n o f e a c h f r a g m e n t w i t h i n av a r i e t y o f s t r u c t u r e s . T h e y are v a l i d o n l yw h e n u s e d i n t h e context o f t h e pr es en tm u l t i d i m e n s i o n a l m o d e l w i t h i n e a c hc h e m i c a l c l a s s .

    T h e r e s u l t s o f r e c o g n i t i o n a n d l e a v e -o n e - o u t p r e d i c t i o n o f t h e e i g h t Q S A Rm o d e l s are s h o w n i n T a b l e 3 . T h e v a l u e s o ft h e mean m e m b e r s h i p g r a d e were f a i r l yg o o d , f r o m 0 . 8 6 0 t o 0 . 9 4 9 i n t h e r e c o g n i -t i o n a n d f r o m 0 . 7 8 3 t o 0 . 9 2 3 i n t h e l e a v e -on e- ou t p r e d i c t i o n . T h e f a l s e n e g a t i v e wasf r o m 1 . 6 t o 5 . 8 i n t h e r e c o g n i t i o n a n df r o m 3 . 1 t o 8 . 0 i n t h e l e a v e - o n e - o u t pre-d i c t i o n . T h e s e e q u a t i o n s were t h e n u s e df o r t h e c a r c i n o g e n i c i t y p r e d i c t i o n o f 2 5o r g a n i c c h e m i c a l s .

    P r o s p e c t v e Prictono f t h e O r g a n i c C h e m i c a l sT h e s e c o n d NIEHS P r e d i c t i v e - T o x i c o l o g yE v a l u a t i o n P r o j e c t i n v o l v e s t h e r o d e n t c a r -c i n o g e n i c i t y o f 3 0 c h e m i c a l s c o n s i s t i n g o f2 5 o r g a n i c a n d 5 i n o r g a n i c c o m p o u n d s .T h e f i v e i n o r g a n i c c o m p o u n d s w e r e o m i t t e df r o m o u r F A L S p r e d i c t i o n b e c a u s e s u f f i c i e n tc a r c i n o g e n i c i t y d a t a f o r i n o r g a n i c c h e m i -c a l s w e r e n o t a v a i l a b l e f o r g e n e r a t i n g p r e -d i c t i v e QSAR m o d e l s . T h e p r e d i c t i o n o ft h e 2 5 o r g a n i c c o m p o u n d s w a s p e r f or m edu s i n g t h e QSAR m o d e l s f o r t h e e i g h tc h e m i c a l c l a s s e s l i s t e d i n T a b l e 2 . S a l t ss u c h a s s c o p o l a m i n e h y d r o b r o m i d e t r i h y -d r a t e a n d s o d i u m x y l e n e s u l f o n a t e w e r et r e a t e d a s u n d i s s o c i a t e d f o r m s . T h e r e s u l t sa r e s h o w n i n a b l e 4 .F r o m t h e c h e m i c a l f e a t u r e s , c o m p o u n d s1 ( s c o p o l a m i n e ) a n d 2 ( c o d e i n e ) f a l l i n t ot h r e e c h e m i c a l c l a s s e s , a n d c o m p o u n d s 5( t e t r a h y d r o f u r a n ) , 1 0 ( D C Y e l l o w N o .1 1 ) , 1 3 ( 1 - c h l o r o - 2 - p r o p a n o l ) , 1 4 ( d i e t h a n o -l a m i n e ) , 1 5 ( p h e n o l p h t h a l e i n ) , 1 8 ( f u r f u r y la l c o h o l ) , 1 9 ( p r i m a c l o n e ) , 2 4 ( o x y m e t h o -l o n e ) , a n d 2 6 ( e m o d i n ) f a l l i n t o t w o c h e m -i c a l c l a s s e s . When t h e r e w e r e d i s c r e p a n c i e sb e t w e e n t h e e s t i m a t e s b y t w o o r t h r e e QSARm o d e l s , w e e v a l u a t e d t h e m a s e q u i v o c a l .A m o n g t h e 2 5 o r g a n i c c h e m i c a l s , 1 4 s h o w e dp o s i t i v e , 5 s h o w e d e q u i v o c a l , a n d 6 s h o w e dn e g a t i v e c a r c i n o g e n i c i t y . F u r t h e r d e t a i l e dp r e d i c t i o n s b y t h e c o r r e l a t i v e m e t h o d a r et h o u g h t t o b e u n r e l i a b l e , s i n c e t h e r e a r en o t s u f f i c i e n t d a t a c o n c e r n i n g m e c h a n i s m sa n d s i t e s o f t u m o r f o r m a t i o n w i t h a w i d ev a r i e t y o f c h e m i c a l s f o r t h e g e n e r a t i o n o fs t a t i s t i c a l l y s i g n i f i c a n t QSAR m o d e l s .I n t h e s e p r e d i c t i o n s , t h e m u t a g e n i c i t ya n d s u b c h r o n i c t o x i c i t y t e s t d a t a w e r e n o tc o n s i d e r e d . T h e p r e d i c t i o n b a s e d o n t h eQSAR m o d e l s c a n b e p e r f o r m e d i n a v e r ys h o r t t i m e a t a v e r y l o w c o s t , a n d i t c a n b eu t i l i z e d e v e n w h e n t h e t e s t c o m p o u n d d o e sn o t e x i s t . U n f o r t u n a t e l y , t h e f i r s t r o u n d o ft h i s e x e r c i s e s h o w e d t h a t t h e r e s u l t s b y t h ec o r r e l a t i v e m e t h o d s w e r e n o t v e r y g o o d( 2 ) . I t i s c o n s i d e r e d t h a t t h e p r e d i c t i v ep o w e r o f c o r r e l a t i v e m e t h o d s s i g n i f i c a n t l yd e p e n d s u p o n t h e q u a l i t y a n d q u a n t i t y o ft h e t r a i n i n g s e t d a t a u s e d . S u f f i c i e n t h i g h -q u a l i t y d a t a c o v e r i n g a l a r g e v a r i e t y o fc h e m i c a l s t r u c t u r e s , a s w e l l a s t h e u s e o fm e c h a n i s m - b a s e d d e s c r i p t o r s , w i l l e n h a n c et h e p r o s p e c t i v e p r e d i c t i o n a c c u r a c i e s o f t h eQSAR a p p r o a c h e s .

    E n v i r o n m e n t a l H e a l t h P e r s p e c t i v e s V o l 1 0 4 , S u p p l e m e n t 5 * O c t o b e r 1 9 9 6

    C l a s s12345678

    0 5 6

  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    7/8

    PREDICTION O F CARCINOGENICITY USING F A L S

    a b l e 4 . P r e d i c t i o n r e s u l t s o f 2 5 o r g a n i c c h e m i c a l s .C h e m i c a l M e m b e r s h i p g r a d e O v e r a l l

    N o . N a m e C l a s s Z C a r c i n o g e n N o n c a r c i n o g e n p r e d i c t i o n a S c o p o l a m i n e 2 - 0 . 1 9 0 1 . 0 0 0 0 . 0 0 95 - 0 . 1 5 7 1 . 0 0 0 0 . 0 0 8 +6 - 0 . 1 7 6 1 . 0 0 0 0 . 0 1 22 C o d e i n e 2 0 . 2 2 5 1 . 0 0 0 0 . 0 0 05 - 0 . 0 3 4 1 . 0 0 0 0 . 0 0 2 E7 - 0 . 5 0 5 0 . 0 0 1 1 . 0 0 03 1 , 2 - D i h y d r o - 2 , 2 , 4 - 2 - 0 . 2 6 8 1 . 0 0 0 0 . 0 2 6 +t r i m e t h y l q u i n o l i n e4 N i t r o m e t h a n e 3 0 . 1 7 9 1 . 0 0 0 0 . 0 0 0 +5 T e t r a h y d r o f u r a n 2 - 0 . 0 7 9 1 . 0 0 0 0 . 0 0 3 +5 - 0 . 1 5 3 1 . 0 0 0 0 . 0 0 86 t - B u t y l h y d r o q u i n o n e 5 - 0 . 4 6 1 0 . 0 9 9 0 . 9 9 57 E t h y l b e n z e n e - 0 . 6 6 7 0 . 0 0 1 1 . 0 0 08 C h l o r o p r e n e 4 - 0 . 5 9 7 0 . 0 6 3 1 . 0 0 0

    1 0 D & C Y e l l o w N o . 1 1 2 0 . 1 2 6 1 . 0 0 0 0 . 0 0 1 E6 - 0 . 6 5 3 0 . 0 0 5 1 . 0 0 01 1 I s o b u t y r a l d e h y d e 6 - 0 . 1 7 9 1 . 0 0 0 0 . 0 1 3 +1 3 1 - C h l o r o - 2 - p r o p a n o l 4 - 0 . 1 1 8 1 . 0 0 0 0 . 0 0 2 +5 - 0 . 0 0 4 1 . 0 0 0 0 . 0 0 21 4 D i e t h a n o l a m i n e 5 - 0 . 6 6 0 0 . 0 0 5 1 . 0 0 07 - 0 . 3 7 4 0 . 0 0 1 1 . 0 0 01 5 P h e n o l p h t h a l e i n 5 - 0 . 4 2 0 0 . 2 4 8 0 . 8 2 4 E6 - 0 . 0 9 4 1 . 0 0 0 0 . 0 0 51 6 P y r i d i n e 2 - 0 . 1 5 8 1 . 0 0 0 0 . 0 0 6 +1 7 X y l e n e s u l f o n i c a c i d 8 - 0 . 7 6 3 0 . 0 0 1 1 . 0 0 01 8 F u r f u r y l a l c o h o l 2 - 0 . 2 4 4 1 . 0 0 0 0 . 0 1 8 E5 - 0 . 4 8 0 0 . 0 6 8 1 . 0 0 01 9 P r i m a c l o n e 2 0 . 2 2 5 1 . 0 0 0 0 . 0 0 0 +6 0 . 1 9 7 1 . 0 0 0 0 . 0 0 02 0 E t h y l e n e g l y c o l 5 - 0 . 2 6 2 1 . 0 0 0 0 . 0 3 7 +m o n o b u t y l e t h e r2 2 I s o b u t e n e 1 - 0 . 6 6 7 0 . 0 0 1 1 . 0 0 02 3 M e t h y l e u g e n o l 5 0 . 7 5 2 1 . 0 0 0 0 . 0 0 0 +2 4 O x y m e t h o l o n e 5 - 0 . 1 8 8 1 . 0 0 0 0 . 0 1 2 E6 - 0 . 3 8 2 0 . 4 4 0 0 . 5 6 32 5 A n t h r a q u i n o n e 6 0 . 6 4 1 1 . 0 0 0 0 . 0 0 0 2 6 E m o d i n 5 - 0 . 1 0 5 1 . 0 0 0 0 . 0 0 5 +6 0 . 0 9 8 1 . 0 0 0 0 . 0 0 12 7 C i t r a l 6 0 . 1 9 6 1 . 0 0 0 0 . 0 0 0 +2 9 C i n n a m a l d e h y d e 6 - 0 . 0 5 6 1 . 0 0 0 0 . 0 0 3 +8 + , C a r c i n o g e n i c ; - , n o n c a r c i n o g e n i c ; E , e q u i v o c a l .

    REFERENCES1 . R i c h a r d AM. A p p l i c a t i o n o f SAR m e t h o d s t o n o n - c o n g e n e r i cd a t a b a s e s a s s o c i a t e d w i t h c a r c i n o g e n i c i t y a n d m u t a g e n i c i t y :i s s u e s a n d a p p r o a c h e s . M u t a t R e s 3 0 5 : 7 3 - 9 7 ( 1 9 9 4 ) .2 . H i l e m a n B . E x p e r t i n t u i t i o n t o p s i n t e s t o f c a r c i n o g e n i c i t yp r e d i c t i o n . Chem E n g N e w s 7 1 ( 2 5 ) : 3 5 - 3 7 ( 1 9 9 3 ) .3 . M o r i g u c h i I , H i r o n o S , M a t s u s h i t a Y , L i u Q , N a k a g o m e I .F u z z y a d a p t i v e l e a s t s q u a r e s a p p l i e d t o s t r u c t u r e - a c t i v i t y a n ds t r u c t u r e - t o x i c i t y c o r r e l a t i o n s . Chem P h a r m B u l l 4 0 : 9 3 0 - 9 3 4( 1 9 9 2 ) .4 . M o r i g u c h i I , H i r o n o S , L i u Q , N a k a g o m e I . F u z z y a d a p t i v el e a s t s q u a r e s a n d i t s a p p l i c a t i o n t o s t r u c t u r e - a c t i v i t y s t u d i e s .Q u a n t S t r u c t - A c t R e l a t 1 1 : 3 2 5 - 3 3 1 ( 1 9 9 2 ) .

    5 . M o r i g u c h i I , L i u Q , H i r a n o H , H i r o n o S . N o n c o n g e n e r i cs t r u c t u r e - t o x i c i t y c o r r e l a t i o n u s i n g f u z z y a d a p t i v e l e a s t - s q u a r e s .I n : C l a s s i c a l a n d T h r e e - D i m e n s i o n a l QSAR i n A g r o c h e m i s t r y ,ACS S y m p o s i u m S e r i e s 6 0 6 ( H a n s c h C , F u j i t a T , e d s ) .W a s h i n g t o n : A m e r i c a n C h e m i c a l S o c i e t y B o o k s ,1 9 9 5 ; 1 4 1 - 1 5 2 .6 . S o d e r m a n J , e d . C RC H a n d b o o k o f I d e n t i f i e d C a r c i n o g e n s a n dN o n c a r c i n o g e n s , V o l . 1 . B o c a R a t o n , F L : C R C P r e s s , 1 9 8 2 .7 . A s h b y J , T e n n a n t RW. D e f i n i t i v e r e l a t i o n s h i p s a m o n g c h e m i -c a l s t r u c t u r e , c a r c i n o g e n i c i t y a n d m u t a g e n i c i t y f o r 3 0 1 c h e m i -c a l s t e s t e d b y t h e U . S . N T P . M u t a t R e s 2 5 7 : 2 2 9 - 3 0 6 ( 1 9 9 1 ) .8 . G o l d L S , M a n l e y N B , S l o n e TH, G a r f i n k e l G B , A m e s B N ,

    E n v i r o n m e n t a l H e a l t h P e r s p e c t i v e s V o l 1 0 4 , S u p p l e m e n t 5 * O c t o b e r 1 9 9 6 1 0 5 7

  • 7/27/2019 Prediction of the Rodent Carcinogenicity of Organic Compounds From Their Chemical Structures Using the FALS M

    8/8

    M O R I G U C HI ET A L .

    R o h r b a c h L , S t e r n B R , Chow K . S i x t h p l o t o f t h e c a r c i n o g e n i cp o t e n c y d a t a b a s e : r e s u l t s o f a n i m a l b i o a s s a y s p u b l i s h e d i n t h eg e n e r a l l i t e r a t u r e 1 9 8 9 t o 1 9 9 0 a n d b y t h e N a t i o n a l T o x i c o l o g yP r o g r a m 1 9 9 0 t o 1 9 9 3 . E n v i r o n H e a l t h P e r s p e c t 1 0 3 ( S u p p l8 ) : 3 - 1 2 2 ( 1 9 9 5 ) .9 . N o v a k V . F u z z y S e t s a n d T h e i r A p p l i c a t i o n s , B r i s t o l : A d a mH i l g e r , 1 9 8 9 ; 2 2 2 - 2 3 4 .1 0 . M o r i g u c h i I . D e v e l o p m e n t o f f u z z y a d a p t i v e l e a s t - s q u a r e s a n d

    i t s u s e s i n q u a n t i t a t i v e s t r u c t u r e - a c t i v i t y r e l a t i o n s h i p s .Y a k u g a k u Z a s s h i 1 1 5 : 8 0 5 - 8 2 2 ( 1 9 9 5 ) .1 1 . M o r i g u c h i I , H i r o n o S , L i u Q , N a k a g o m e I , M a t s u s h i t a Y .S i m p l e m e t h o d o f c a l c u l a t i n g o c t a n o l / w a t e r p a r t i t i o nc o e f f i c i e n t . Chem P h a r m B u l l 4 0 : 1 2 7 - 1 3 0 ( 1 9 9 2 ) .1 2 . M o r i g u c h i I . H i r o n o S , N a k a g o m e I , H i r a n o H . C o m p a r i s ono f r e l i a b i l i t y o f l o g P v a l u e s f o r d r u g s c a l c u l a t e d b y s e v e r a lm e t h o d s . Chem P h a r m B u l l 4 2 : 9 7 6 - 9 7 8 ( 1 9 9 4 ) .

    1 0 5 8 E n v i r o n m e n t a l H e a l t h P e r s p e c t i v e s * V o l 1 0 4 , S u p p l e m e n t 5 O c t o b e r 1 9 9 6


Recommended