<div dir="ltr">Hi everyone,<div><br></div><div>The latest build, 1.15-3448, has an updated version of mmtbx.prepare_pdb_deposition that will add the entity, entity_poly, entity_poly_seq, struct_ref, and struct_ref_seq loops to an existing mmCIF model when a sequence file is provided. The struct_ref and struct_ref_seq loops are still under development since they will require user input and we&#39;re checking with the PDB to see if they actually need to be defined for the file used for deposition.</div><div><br></div><div>The sequence should be the canonical sequence with the one letter code for each residue. If you have a non-standard residue, the program will align the provided sequences with the chains in the model and replace the one letter code with the three-letter residue name in parentheses.</div><div><br></div><div>Existing loops will be kept if they exist if the input model is in mmCIF format. However, only loops that are not overwritten is kept. So if the input file already has an entity_poly loop, this program will overwrite that loop.</div><div><br></div><div>This tool is still under development and will be incorporated into the GUI. If you encounter any issues, please let us know and if possible, please provide your input files.</div><div><br></div><div>Some known issues include:</div><div>- alignment will fail with alternate conformations where each conformation is a different residue</div><div>- alignment with chains with many &quot;UNK&quot; residues</div><div><br></div><div>Thanks!</div><div><br></div><div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div><div>--</div><div><span style="font-size:12.8000001907349px">Billy K. Poon</span><br></div></div><div>Research Scientist, Molecular Biophysics and Integrated Bioimaging</div><div>Lawrence Berkeley National Laboratory</div><div>1 Cyclotron Road, M/S 33R0345</div><div>Berkeley, CA 94720</div><div>Tel: (510) 486-5709</div><div>Fax: (510) 486-5909</div><div>Web: <a href="https://phenix-online.org" target="_blank">https://phenix-online.org</a></div></div></div></div></div></div></div></div></div></div></div></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, Jan 5, 2019 at 1:51 PM Billy Poon &lt;<a href="mailto:BKPoon@lbl.gov">BKPoon@lbl.gov</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex"><div><div dir="auto">Hi Bernhard,</div></div><div dir="auto"><br></div><div dir="auto">It’s something I’ll be working more the first half of this year and will be related to a general reorganization of how the validation tools, table one, and file deposition tools work. Currently, each tool sort of operates independently and so the information is not handled consistently.</div><div dir="auto"><br></div><div dir="auto">The plan is to do the final statistics calculation once with the validation tool and then export the statistics as a table one and eventually as a CIF file for deposition (the sequence would be added if a sequence file is available). The cryo-em comprehensive validation tool does this currently with exporting statistics in a table. The X-ray/neutron comprehensive validation tool will be changed to follow the same approach. </div><div dir="auto"><br></div><div dir="auto">The additional wrinkle with non-standard residues is that there are many of those residues. Nigel has a way for combing through our monomer library to build the relationships (e.g. MSE is based on M). I’m working on a tool to use those relationships so that the user just provides the canonical sequence (M) and we will fill in the appropriate non-standard residue (MSE) in the CIF file. This way, users do not have to manually build the PDB specific format of putting non-standard residues in parentheses.</div><div dir="auto"><br></div><div dir="auto">The next Phenix is planned for the end of February/early March, and that will have at least a beta version of this tool. </div><div><br><div class="gmail_quote"><div dir="ltr">On Fri, Jan 4, 2019 at 7:44 PM Bernhard Lechtenberg &lt;<a href="mailto:blechtenberg@sbpdiscovery.org" target="_blank">blechtenberg@sbpdiscovery.org</a>&gt; wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">



<div style="word-wrap:break-word;line-break:after-white-space">
Hi Billy,
<div><br>
</div>
<div>Do you have any updates on this? I just used tried to use mmtbx.prepare_pdb_deposition with the .cif file from phenix.refine and fasta sequences as input, followed by pdb_extract to deposit several structures to the PDB. The .cif files were accepted
 by PDB, but the refinement statistics were lost and something with the structure factors also seemed wrong, as the validation reports did not contain metrics for R-free and RSRZ outliers. I don’t quite understand how the second problem happens, since mmtbx.prepare_pdb_deposition
 does not see the structure factors. However, when I skipped the mmtbx.prepare_pdb_deposition and directly used the output cif from phenix.refine in pdb_extract and then uploaded this file to the PDB, both those issues were fixed.</div>
<div><br>
</div>
<div>I first used an older phenix version (1.14rc2-3139) on a Mac, then upgraded to the latest nightly-built version (dev-3374), but the issue persisted.</div>
<div><br>
</div>
<div>Additionally, for one my five structures, I had the same issue as Patrick described in October (see below), also with both versions of phenix.</div>
<div><br>
</div>
<div>Bernhard<br>
<div>
<div style="color:rgb(0,0,0);font-family:Helvetica;font-size:12px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;word-wrap:break-word">
<p class="MsoNormal" style="color:rgb(0,0,0);font-family:Helvetica;font-size:12px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;line-height:normal">
<b><span style="font-size:8pt;font-family:Arial;color:rgb(214,61,36)">Bernhard C. Lechtenberg, PhD<span class="gmail-m_5097922021593285904m_6758488611979311770Apple-converted-space"> </span><br>
</span></b><span style="font-size:8pt;font-family:Arial;color:gray">Postdoctoral Associate<br>
Riedl Lab<br>
Cancer Metabolism and Signaling Networks Program<br>
NCI-Designated Cancer Center</span></p>
<span style="color:rgb(0,0,0);font-family:Helvetica;font-size:12px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px"><span><span><span><span><span><span><span><span><br class="gmail-m_5097922021593285904m_6758488611979311770Apple-interchange-newline">
<span><img src="cid:1681fecaf2e3af35ccc1" style="width: 219px; max-width: 100%;"></span>
<p class="MsoNormal" style="color:rgb(0,0,0);font-family:Helvetica;font-size:12px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;line-height:normal">
<span style="color:gray;font-family:Arial;font-size:8pt"><br class="gmail-m_5097922021593285904m_6758488611979311770Apple-interchange-newline">
<a href="https://maps.google.com/?q=10901+N.+Torrey+Pines+Road,+La+Jolla,+CA+92037&amp;entry=gmail&amp;source=g" target="_blank">10901 N. Torrey Pines Road, La Jolla, CA 92037</a></span></p>
<p class="MsoNormal" style="color:rgb(0,0,0);font-family:Helvetica;font-size:12px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;line-height:normal">
<b><span style="font-size:8pt;font-family:Arial;color:gray">T  </span></b><span style="font-size:8pt;font-family:Arial;color:gray">858.646.3100 ext. 4216 <span class="gmail-m_5097922021593285904m_6758488611979311770Apple-tab-span" style="white-space:pre-wrap">
</span></span><b><span style="font-size:8pt;font-family:Arial;color:gray">E</span></b><span style="font-size:8pt;font-family:Arial;color:gray"> </span><span style="color:gray;font-family:Arial;font-size:8pt"><a href="mailto:blechtenberg@SBPdiscovery.org" target="_blank">blechtenberg@SBPdiscovery.org</a></span></p>
<p class="MsoNormal" style="color:rgb(0,0,0);font-family:Helvetica;font-size:12px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;line-height:normal">
<i><span style="font-size:8pt;font-family:Arial;color:gray">Science Benefiting Patients®</span></i></p>
</span></span></span></span></span></span></span></span></span></div>
</div>
<div><br>
<blockquote type="cite"></blockquote></div></div></div><div style="word-wrap:break-word;line-break:after-white-space"><div><div><blockquote type="cite">
<div>On Oct 2, 2018, at 4:01 PM, Billy Poon &lt;<a href="mailto:BKPoon@lbl.gov" target="_blank">BKPoon@lbl.gov</a>&gt; wrote:</div>
<br class="gmail-m_5097922021593285904m_6758488611979311770Apple-interchange-newline">
</blockquote></div></div></div><div style="word-wrap:break-word;line-break:after-white-space"><div><div><blockquote type="cite"><div></div></blockquote></div></div></div><div style="word-wrap:break-word;line-break:after-white-space"><div><div><blockquote type="cite"><div>
<div dir="ltr">Hi Pat,
<div><br>
</div>
<div>I&#39;m in the process of reworking that tool since it is dropping some information from phenix.refine in the process of adding the sequence. Something should be available by the end of the week in a new build.</div>
<div><br clear="all">
<div>
<div dir="ltr" class="gmail-m_5097922021593285904m_6758488611979311770gmail_signature">
<div dir="ltr">
<div>
<div dir="ltr">
<div>
<div dir="ltr">
<div>
<div dir="ltr">
<div>
<div dir="ltr">
<div dir="ltr">
<div dir="ltr">
<div>
<div>--</div>
<div><span style="font-size:12.8000001907349px">Billy K. Poon</span><br>
</div>
</div>
<div>Research Scientist, Molecular Biophysics and Integrated Bioimaging</div>
<div>Lawrence Berkeley National Laboratory</div>
<div><a href="https://maps.google.com/?q=1+Cyclotron+Road&amp;entry=gmail&amp;source=g" target="_blank">1 Cyclotron Road</a>, M/S 33R0345</div>
<div>Berkeley, CA 94720</div>
<div>Tel: (510) 486-5709</div>
<div>Fax: (510) 486-5909</div>
<div>Web: <a href="https://na01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fphenix-online.org&amp;data=02%7C01%7Cblechtenberg%40sbpdiscovery.org%7C1f02e727a9a24dbf989308d628bb1cc9%7C0b162723004547deb0699f1a7aa955a1%7C0%7C0%7C636741181463446660&amp;sdata=quN%2BNM5dHlBOs0xk0T53tu3ZN92oLc7v3h6tyZ%2BViXM%3D&amp;reserved=0" target="_blank">https://phenix-online.org</a></div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
<br>
</div>
</div>
<br>
<div class="gmail_quote">
<div dir="ltr">On Mon, Oct 1, 2018 at 8:41 AM Patrick Loll &lt;<a href="mailto:pjloll@gmail.com" target="_blank">pjloll@gmail.com</a>&gt; wrote:<br>
</div>
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;border-left-color:rgb(204,204,204);padding-left:1ex">
Hi all,<br>
<br>
Following the instructions given here:<br>
<br>
<a href="https://na01.safelinks.protection.outlook.com/?url=https%3A%2F%2Fwww.phenix-online.org%2Fdocumentation%2Foverviews%2Fxray-structure-deposition.html&amp;data=02%7C01%7Cblechtenberg%40sbpdiscovery.org%7C1f02e727a9a24dbf989308d628bb1cc9%7C0b162723004547deb0699f1a7aa955a1%7C0%7C0%7C636741181463456667&amp;sdata=Q6TEdFOFt3wCQqJ4tA1tHWypnlY8Qb9%2BgOR1a6tErO8%3D&amp;reserved=0" rel="noreferrer" target="_blank">https://www.phenix-online.org/documentation/overviews/xray-structure-deposition.html</a><br>
<br>
I’m attempting to use mmtbx.prepare_pdb_deposition to insert sequence information into the mmCIF that contains the model coordinates. Unfortunately, the program fails with an error (shown below).<br>
<br>
The sequence file is FASTA format, and contains an entry for each of the (4) chains in the AU, i.e.<br>
<br>
&gt;A<br>
MSEQNCE…<br>
&gt;B<br>
MSEQNCE…<br>
etc.<br>
<br>
Any bright ideas?<br>
<br>
<br>
============this is what happens (vide infra)====================================<br>
<br>
<br>
[PJL-iMac:blahblah/PJL_final] loll% mmtbx.prepare_pdb_deposition   filename.cif   seq_name.fasta<br>
Starting mmtbx.prepare_pdb_deposition<br>
on Mon Oct  1 11:16:23 2018 by loll<br>
===============================================================================<br>
Processing files:<br>
-------------------------------------------------------------------------------<br>
<br>
  Found model, filename.cif<br>
  Found sequence, seq_name.fasta<br>
<br>
Processing PHIL parameters:<br>
-------------------------------------------------------------------------------<br>
  No PHIL parameters found<br>
Final processed PHIL parameters:<br>
-------------------------------------------------------------------------------<br>
  data_manager {<br>
    model {<br>
      file = “filename.cif&quot;<br>
    }<br>
    default_model = “filename.cif&quot;<br>
    sequence_files = &quot;seq_name.fasta&quot;<br>
    default_sequence = &quot;seq_name.fasta&quot;<br>
  }<br>
<br>
Starting job<br>
===============================================================================<br>
Validating inputs<br>
Using model: filename.cif<br>
Using sequence: seq_name.fasta<br>
Creating mmCIF block for sequence<br>
Traceback (most recent call last):<br>
  File &quot;/Applications/phenix-1.14-3260/build/../modules/cctbx_project/mmtbx/command_line/prepare_pdb_deposition.py&quot;, line 9, in &lt;module&gt;<br>
    run_program(program_class=prepare_pdb_deposition.Program)<br>
  File &quot;/Applications/phenix-1.14-3260/modules/cctbx_project/iotbx/cli_parser.py&quot;, line 71, in run_program<br>
    task.run()<br>
  File &quot;/Applications/phenix-1.14-3260/modules/cctbx_project/mmtbx/programs/prepare_pdb_deposition.py&quot;, line 98, in run<br>
    alignment_params=self.params.mmtbx.validation.sequence.sequence_alignment)<br>
  File &quot;/Applications/phenix-1.14-3260/modules/cctbx_project/iotbx/pdb/hierarchy.py&quot;, line 1190, in as_cif_block_with_sequence<br>
    assert len(chain.residue_groups) + chain.n_missing_start + chain.n_missing_end == len(sequence)<br>
AssertionError<br>
(gouts of smoke, terrified squealing)<br>
<br>
<br>
The ‘No PHIL parameters found’ message is concerning, but the program clearly seems to be finding the input file names.<br>
<br>
Suggestions welcome.<br>
<br>
Thanks,<br>
<br>
Pat<br>
<br>
---------------------------------------------------------------------------------------<br>
Patrick J. Loll, Ph. D.  <br>
Professor of Biochemistry &amp; Molecular Biology<br>
Drexel University College of Medicine<br>
Room 10-102 New College Building<br>
<a href="https://maps.google.com/?q=245+N.+15th+St&amp;entry=gmail&amp;source=g" target="_blank">245 N. 15th St</a>., Mailstop 497<br>
Philadelphia, PA  19102-1192  USA<br>
<br>
(215) 762-7706<br>
<a href="mailto:pjloll@gmail.com" target="_blank">pjloll@gmail.com</a><br>
<a href="mailto:pjl28@drexel.edu" target="_blank">pjl28@drexel.edu</a><br>
<br>
<br>
_______________________________________________<br>
phenixbb mailing list<br>
<a href="mailto:phenixbb@phenix-online.org" target="_blank">phenixbb@phenix-online.org</a><br>
<a href="https://na01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fphenix-online.org%2Fmailman%2Flistinfo%2Fphenixbb&amp;data=02%7C01%7Cblechtenberg%40sbpdiscovery.org%7C1f02e727a9a24dbf989308d628bb1cc9%7C0b162723004547deb0699f1a7aa955a1%7C0%7C0%7C636741181463466669&amp;sdata=S5Y55I0NxgVfkdUevXh3BQFr%2Fy6YJbF6TtYg48B7muA%3D&amp;reserved=0" rel="noreferrer" target="_blank">http://phenix-online.org/mailman/listinfo/phenixbb</a><br>
Unsubscribe: <a href="mailto:phenixbb-leave@phenix-online.org" target="_blank">
phenixbb-leave@phenix-online.org</a></blockquote>
</div>
_______________________________________________<br>
phenixbb mailing list<br>
<a href="mailto:phenixbb@phenix-online.org" target="_blank">phenixbb@phenix-online.org</a><br>
</div></blockquote></div></div></div><div style="word-wrap:break-word;line-break:after-white-space"><div><div><blockquote type="cite"><div><a href="https://na01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fphenix-online.org%2Fmailman%2Flistinfo%2Fphenixbb&amp;amp;data=02%7C01%7Cblechtenberg%40sbpdiscovery.org%7C1f02e727a9a24dbf989308d628bb1cc9%7C0b162723004547deb0699f1a7aa955a1%7C0%7C0%7C636741181463496692&amp;amp;sdata=eSLHcjYDUZfKM04MLaIossUjFGIyR2F6XGP5jta%2F%2B5c%3D&amp;amp;reserved=0" target="_blank">https://na01.safelinks.protection.outlook.com/?url=http%3A%2F%2Fphenix-online.org%2Fmailman%2Flistinfo%2Fphenixbb&amp;amp;data=02%7C01%7Cblechtenberg%40sbpdiscovery.org%7C1f02e727a9a24dbf989308d628bb1cc9%7C0b162723004547deb0699f1a7aa955a1%7C0%7C0%7C636741181463496692&amp;amp;sdata=eSLHcjYDUZfKM04MLaIossUjFGIyR2F6XGP5jta%2F%2B5c%3D&amp;amp;reserved=0</a><br>
Unsubscribe: <a href="mailto:phenixbb-leave@phenix-online.org" target="_blank">phenixbb-leave@phenix-online.org</a></div>
</blockquote>
</div>
<br>
</div>
</div>

</blockquote></div></div>-- <br><div dir="ltr" class="gmail-m_5097922021593285904gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div dir="ltr"><div dir="ltr"><div><div>--</div><div><span style="font-size:12.8000001907349px">Billy K. Poon</span><br></div></div><div>Research Scientist, Molecular Biophysics and Integrated Bioimaging</div><div>Lawrence Berkeley National Laboratory</div><div>1 Cyclotron Road, M/S 33R0345</div><div>Berkeley, CA 94720</div><div>Tel: (510) 486-5709</div><div>Fax: (510) 486-5909</div><div>Web: <a href="https://phenix-online.org" target="_blank">https://phenix-online.org</a></div></div></div></div></div></div></div></div></div></div></div></div></div>
</blockquote></div>