+ All Categories
Home > Documents > Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations ›...

Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations ›...

Date post: 25-Jun-2020
Category:
Upload: others
View: 5 times
Download: 0 times
Share this document with a friend
28
Fourier map modifica.on by Maximum Entropy Method (MEM) and its implementa.on in Phenix Pavel Afonine, Vladimir Lunin 24JAN2013
Transcript
Page 1: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Fourier  map  modifica.on  by  Maximum  Entropy  Method  (MEM)  and  its  implementa.on  in  Phenix  

Pavel  Afonine,  Vladimir  Lunin  

 

24-­‐JAN-­‐2013  

Page 2: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Objec.ves  

•  Unveil  mystery  about  Maxim  Entropy  Method  as  it’s  applied  in  Crystallography  

•  Answer  ques=ons  “what  it  is  for?”  “why?”  “what  to  expect?”  

•  Describe  MEM  algorithm  and  its  implementa=on  in  Phenix  

(phenix.maximum_entropy_map)  

•  Show  examples  

Page 3: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Crystallographic  structure  determina.on  as  an  example  of  inverse  problem  

•  Inverse  problem  is  a  task  of  conver=ng  observed  measurements  into  informa=on  about  a  physical  object.  Associated  framework  provides  methods  to  overcome  problems  due  to  ill-­‐behaved  tasks.  

•  Crystallography  context  

• We  want  to  study  electron  density  distribu=on  in  unit  cell  

•  Experimentally  we  obtain  structure  factors  

h  k  l  

Page 4: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  •  Exact  correspondence  between  ρ  and  F  is  only  when  all  terms  in  the  summa.on  are  present      

•  In  reality  only  a  subset  of  all  F  is  measured      

Infinite  number   Reflec=ons  in  sphere  R=1/dmin  dmin  -­‐  highest  resolu=on  of  dataset  

Some  reflec=ons  in  sphere  R=1/dmin  may  be  missing  (blue):  incomplete  dataset  

All  reflec=ons   Measured  reflec=ons  (red)   Measured  reflec=ons:  2D  slice  

•  Incomplete  hkl  set  means  density  is  not  accurate  anymore:  Fourier  image  of  finite  resolu.on      

Page 5: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

Toy  example:  C-­‐N  in  10*10*10Å  P1  box  

ρ  (e/Å3)  

Distance  along  C-­‐N  (Å)  

Electron  density  distribu=on  along  C-­‐N  bond  vector  

Page 6: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

Exact  density   2  Å  resolu.on  Fourier  image  

ρ  (e/Å3)   ρimage  (e/Å3)  

Distance  along  C-­‐N  (Å)   Distance  along  C-­‐N  (Å)  

Page 7: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  Exact  density   2  Å  resolu.on  Fourier  image  

ρ  (e/Å3)   ρimage  (e/Å3)  

Distance  along  C-­‐N  (Å)   Distance  along  C-­‐N  (Å)  

Posi=ve  and  nega=ve  spurious  peaks  –  Fourier  trunca=on  ripples  (ar=facts)  

Page 8: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

More  examples:  exact  density  (red)  and  1,  1.5,  2  and  2.5  Å  resolu.on  Fourier  images  

ρimage  (e/Å3)  

Distance  along  C-­‐N  (Å)  

ρimage  (e/Å3)  

Distance  along  C-­‐N  (Å)  

Page 9: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

Exact  density  

2  Å  resolu.on  Fourier  image  

ρimage  (e/Å3)  

Distance  along  C-­‐N  (Å)  

2  Å  resolu.on  set  of  F(s)  

•  Regulariza=on  involves  introducing  addi=onal  informa=on  in  order  to  solve  an  ill-­‐posed  problem  

•  It  involves  encoding  prior  knowledge  in  terms  of  constraints  on  the  solu=on  space  like  posi=vity  or  smoothness  for  example.  

•  Ill-­‐posed  problem  in  crystallography:  we  want  to  reconstruct  image  damaged  due  to  finite  amount  of  measured  data  

•  Example:  density  is  posi=ve  and  total  charge  F000  

Page 10: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

(Sayre,  1951)  

•  One  can  iterate  back  and  forth  any  number  of  =mes  –  this  will  not  change  F(s)  and  ρ(s)  

•  Values  of  F  calculated  for  Miller  indices  that  were  not  used  in  calcula=on  of  ρ(s)  will  always  be  zero.  

Page 11: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

Modify  density  in  some  way  

•  This   is   a   founda=on   for   collec=on   of   regulariza=on  methods   that   in   crystallography   called  Density  Modifica=on  

Page 12: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

•  There  are  many  ways  to  modify  density:  

1.  Atomicity  (Hoppe  &  Gassmann,  1964)  2.  Posi=vity  (Barrej  &  Zwick,  1971)  3.  Noncrystallographic  symmetry  (Bricogne,  1974)  4.  Solvent  flatness  (Bricogne,  1974)  5.  Map  connec=vity  (con=nuity)  (Bhat  &  Blow,  1982)  6.  Histogram  matching  (Lunin,  1988)  7.  MEM  (maximum  entropy  methods)  (Collins,  1982)  

•  Good  reviews:  Podjarny,  Rees  &  Urzhumtsev,  1996;  Cowtan,  2012;  Trwilliger  (for  sta=s=cal  Density  Modifica=on)  

 •  Purpose:  improve  density  by  improving  phases  and  extending  the  resolu=on    

•  Posi.vity  –  one  of  the  least  model  commiXal  constraint  (less  chances  to  introduce  model  bias)  and  quick  and  easy  to  apply.    

Page 13: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Inverse  problems  

This  is  may  s=ll  be  far  from  ideal  density  

Original  map   Modified  map  

New  set  of  reflec=ons  Improved  map  

Page 14: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Posi.vity  constraint:  example  

Example:  C-­‐N  in  10*10*10Å  P1  box  

Problem:  may  grow  spurious  peaks.  

Original  data  (1.5  Å)  is  highly  incomplete  and  has  70  degrees  phase  error  

Page 15: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Maximum  Entropy  map  modifica.on  

•  Star=ng  from  a  posi=ve  electron  density  distribu=on  (which  can  be  flat)  we  want  to  “grow”  such  a  new  density  distribu=on:  a)  that  is  as  flat  as  possible  (=  has  highest,  maximum,  entropy),  and  b)  the  structure  factors  calculated  from  this  new  distribu=on  are  close  enough  to  original  

data  within  prescribed  tolerance  

•  There  are  many  admissible  maps:  the  maps  that  are  close  to  the  original  data  within  the  tolerance  

•  During  the  process  entropy  drops,  and  NOT  increase.  This  is  counterintui=ve  as  the  method  is  called  maximum  entropy  

•  Method  is  called  maximum  entropy  because  we  choose  that  map  (among  all  admissible  ones)  that  is  the  flajest  one  (has  highest  entropy)  

•  Originates  from  informa=on  theory  (Jaynes,  1957)  •  Useful  publica=ons:  

Collins,  1982  Gull  &  Daniel,  1978  Wu,  1984  

•  No  paper  that  provide  details  enough  for  painless  implementa=on!    

Page 16: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Maximum  Entropy  map  modifica.on:  basic  defini.ons  

Page 17: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Maximum  Entropy  map  modifica.on:  basic  defini.ons  

Remark  #1:  for  obscure  to  me  reasons,  most  of  papers  uses                                                                                            and  call  it  entropy,  while  KL  is  Kullback-­‐Leibler  divergence  (or  cross  entropy)  

Remark  #2:  I  was  not  able  to  find  the  meaning  and  purpose  of  τ  in  crystallographic  context,  and  why  some=mes  KL  is  used  over  H,  and  vice  versa.    

Remark  #3:  Func=ons  such  as  –ln(x)  or  even  –u1/2  have  similar  proper=es  as  H(x).  Func=on  –u1/2    have  no  informa=on  theory  jus=fica=on!  Using  any  of  these  func=ons  make  no  different  on  final  result  (Narayan  &  Nityananda,  1986).    

Remark  #4:  Constraint  term  Q  can  be  more  complex,  such  as  weighted  sum  of  phased  and  phaseless  reflec=ons.  I  may  also  include  other  informa=on  such  as  symmetry,  solvent/macromolecule  mask  and  other  a  priori  known  informa=on.  

Remark  #5:  This  is  very  similar  to  crystallographic  model  refinement  where  the  op=mizing  target  is  Tdata  +  w*Trestraints  -­‐>  min.  

Page 18: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

•  Maximiza=on                                                                          is  achieved  by  solving  N  non-­‐linear  equa=ons  w.r.t.  ρ:      

Maximum  Entropy  map  modifica.on:  basics  

N  –  number  of  grid  points  

 –  entropy  

 –  constraint  term  

•  Evalua=ng  deriva=ves  results  in  N  equa=ons      

that  are  solved  using  itera=ve  procedure  

Page 19: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Deriva.ves  of  QX(ρ)  w.r.t.  ρ  

!!! j

Fh "Fho 2 =

!!! j

Fh#

$%%

&

'((Fh +Fh

!!! j

Fh "Fho !!! j

Fh "Fho !!! j

FhFh !Fho 2 = FhFh !Fh

oFh !FhoFh +Fh

oFho

Fh =1N

! j exp 2! ijhN

!

"#$

%&j=0

N'1

( , h = 0,...,N '1 ! j = Fh exp !2" ijhN

"

#$%

&'h=0

N!1

( , j = 0,...,N !1! = ! j{ } j=0N!1

QX = wh Fh !Fho 2

h=0

N!1

"

!!! j

Fh =1Nexp 2" i jh

N"

#$%

&'

!!! j

Fh =1Nexp "2" i jh

N#

$%&

'(

!!! j

QX !( ) = 1N

wh Fh "Fho( )exp "2" i jhN

#

$%&

'(h=0

N"1

) +1N

wh Fh "Fho( )exp "2" i jhN

#

$%&

'(h=0

N"1

)

!!! j

QX !( ) = 2N

wh Fh "Fho( )exp "2" i jhN

#

$%&

'(h=0

N"1

) ! jo = whFh

o exp !2" i jhN

"

#$%

&'h=0

N!1

( whFh exp !2! ijhN

"

#$%

&'h=0

N!1

( = T )"( ) j

!!!

QX !( ) = 2N

T *! " !o( ) Here:  T  is  interferen=on  func=on  and  ρo  =  ρobs    

Since  Fourier  coefficients  have  Hermi=an  symmetry  result  of  summa=on  are  real  numbers  that  invariant  under  complex  conjuga=on  opera=on:  

Page 20: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Calcula.on  algorithm  (inputs)  

Inputs  

•  Structure  factors  

•  Total  charge  

•  Gridding  N  (N1,  N2,  N3)  

•  Scale  Cobs  that  brings                                  onto  absolute  scale  (Cobs=1  if                                on  absolute  scale)  

!Fkobs{ }

k!K

!F0

!Fkobs{ }

k!K!Fkobs{ }

k!K

Remark  #1:  Input  structure  factors  can  be  phased  or  phaseless  Fobs,  2mFobs-­‐DFmodel  map  coefficients  and  other  intrinsically  posi=ve  maps.  

Remark  #2:  MEM  can  be  applied  to  residual  (example:  mFobs-­‐DFmodel)  maps.  For  this  two  sets  of  coefficients  are  calculated  first  mFobs  and  DFmodel  ,  then  corresponding  maps  are  subject  to  MEM  procedure.  The  difference  between  two  MEM  modified  maps  is  the  desired  residual  map.  

Remark  #3:  If  amplitudes  of  input  structure  factors  are  measured  data  (Fobs)  and  experimental  uncertain=es  (σ)  are  available,  then  residual  QX  is  simply  χ2,  and  its  sta=s=cal  proper=es  can  be  used  to  choose  appropriate  weight  λ  and  determine  convergence.  

Page 21: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Calcula.on  algorithm  (parameters)  

Parameters  

•  Weight  λ,  which  defines  how  much  we  allow  deviate  new  map  coefficients  from  

•  Memory  coefficients  β  (0.1-­‐1.0),  which  insures  convergence  by  preven=ng  oscilla=ons  

•  Number  of  itera=ons  

!Fkobs{ }

k!K

Page 22: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Calcula.on  algorithm  (op.miza.on  procedure  -­‐  I)  

Op.miza.on  procedure  

1.  Prepare  inputs  

•  Scale  input  data  

•  Compute    synthesis  

•  Define  AGD=1/N,  N  –  number  of  grid  points  (used  to  enforce  Z  (total  charge)  =  1)  

2.  Obtain  ini=al  approxima=on.  Any  of  three  works  and  does  not  change  the  outcome:  

•     

•  Flat  map:  set  all  grid  points  to  a  constant  value  

•  LDE  (replace  nega=ve  density  with  some  small  values)  

Fkobs =

Cobs

NF0!Fkobs

! jobs = wkFk

obs exp !2" i jkN

"

#$%

&'k(K)

( )

( )∑ −

−=

n

obsobsn

obsobsn

jmin

min0

ρρρρ

ρ

Page 23: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Calcula.on  algorithm  (op.miza.on  procedure  –  II)  

Op.miza.on  procedure  

3.  Itera=ons,  star=ng  from                ,  at  (n+1)  step  given                    from  previous  step:    

•  Compute  

! 0( ) ( )nρ

Fkn( ) =

1N

! jn( ) exp 2! i jk

N!

"#$

%&j=0

N'1

( ( )∑∈

⎥⎦

⎤⎢⎣

⎡−=Kk

nkkj N

jkiw πρ 2expmod F ! j = ! jmod " ! j

obs

!! j = 1+ "N! j

n( )!

"#

$

%&

AGD exp '"( j N)* +,

1+ "NAGD exp '"( j N)* +,

( )

[ ] GDj

GDnjj

AN

N

AN λ

λρ

λρ

+Δ⎟⎠

⎞⎜⎝

⎛ +=exp

1~

Z n+1( ) = !! jj=0

N!1

"

! jn+1( ) = 1!"( )! j

n +"1

Z n+1( )!! j

AGDnew = AGD

old / Z n+1( )

If  Δj  ≥  0:  

If  Δj  <  0:  

Update  every  5-­‐25  itera=ons:  

Next  itera=on  map:  

Page 24: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Calcula.on  algorithm  (control  parameters)  Control  parameters  

1.  Op=miza=on  targets  H(ρ)  and  Q(ρ):  both  should  decrease  

2.  Total  unit  cell  charge                                    :  it  should  converge  to  1  

3.   Normalized  entropy                                                                                        :  it  reaches  its  max  value  if  

4.  R-­‐factor:    

5.  Scale  factor  kc  that  minimizes  func=on                                                              :  kc  should  converge  to  1.  

Z = ! jj=0

N!1

"

Hn !( ) = ! 1lnN

! j

Zln! j

Zj=0

N!1

" ! j =1 N ! j

R !( ) = Fk !Fkobs

k"K# Fk

obs

k"K#

wk !cFk !Fkobs 2

k"K#

0  

1  

1.6  kc  

Z  

Hn  

R  

Page 25: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Implementa.on  in  Phenix  

Source  code    

cctbx/maptbx/mem.py ! ! ! ! ! ! !: 288 lines !cctbx/regression/tst_mem.py ! ! ! ! !: 116 lines!cctbx/maptbx/statistics.h! ! ! ! ! !: 75 lines!cctbx/maptbx/boost_python/statistics.cpp !: 24 lines!

Usage  (command  line):    

phenix.max_entropy_map model.pdb map.mtz  !GUI  is  available  (THANKS  NAT!)    Program  outputs  one  MTZ  file  containing  two  maps:  original  and  MEM  maps  

Original  and  MEM  maps  are  scaled  such  that  they  have  iden=cal  cumula=ve  histogram  

Page 26: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Examples  

Restora=on  of  1.5  Å  resolu=on  image  

Page 27: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

Examples  

Restora=on  of  2  Å  resolu=on  image  

Page 28: Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM ... › presentations › mem.pdf · Fourier’map’modifica.on’by’Maximum’Entropy’Method’(MEM)’

BoXlenecks  

•  Run=me:  takes  from  few  seconds  to  few  minutes  

•  Sensi=ve  to  F000  es=ma=on  (needs  to  be  accurate)  

•  Star=ng  data  is  fixed:  upda=ng  phases  should  improve  the  impact:  

•  This  is  why  effect  with  real  data  is  not  strong  

•  Generates  map  coefficients  up  to  very  high  resolu=on:  ~0.3..0.5  Å  

•  Coot  is  too  slow  


Recommended