UNP - for unknown peptides, UND- for DNA, UNR for RNA, UNL- for ligands and UNK for things that we don't know that we don't know (quoting D. Ramsfeld).<div><br></div><div>&nbsp;&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; Boaz<br><br>----- Original Message -----<br>From: Phil Evans &lt;pre@mrc-lmb.cam.ac.uk&gt;<br>Date: Thursday, July 29, 2010 2:29<br>Subject: Re: [phenixbb] Dummy atoms<br>To: PHENIX user mailing list &lt;phenixbb@phenix-online.org&gt;<br><br>&gt; <br>&gt; I was thinking of the case (which we have had) where we could <br>&gt; place the peptide plausibly (eg in a helix) but not identify the <br>&gt; side chain. Maybe there should be different UNK-likes, for <br>&gt; unknown amino-acid, unknown nucleotide, unknown thing<br>&gt; <br>&gt; Phil<br>&gt; <br>&gt; On 28 Jul 2010, at 23:34, Pavel Afonine wrote:<br>&gt; <br>&gt; &gt; I agree with Phil about UNK - it seems to be good indeed to <br>&gt; call unknown (undefined) residue as it appears on the map rather <br>&gt; than call ALA something that in fact is TYR, and then later on <br>&gt; getting confused about the mismatch between actual sequence and <br>&gt; the one derived from PDB file. This is actually what I get <br>&gt; confused all the time looking at results of model building <br>&gt; programs, because the first thing I always do is I compare the <br>&gt; real actual sequence with the one derived from PDB file - just <br>&gt; to validate the result of model building.<br>&gt; &gt; <br>&gt; &gt; However, I agree with Tom too about loosing identity in cases <br>&gt; where we really do know what to expect: polypeptide or rna/dna.<br>&gt; &gt; <br>&gt; &gt; Hm... interesting situation -:)<br>&gt; &gt; <br>&gt; &gt; I guess UNK is may be still better, ONLY IF you go one level <br>&gt; deeper and look at atom names (or make sure you do that <br>&gt; consistently). Say you name a "residue" as UNK and name <br>&gt; corresponding atoms within this residue as CA, N, C, O (kind of <br>&gt; peptide pattern) - then you have a chance to guess what it is. <br>&gt; Of course how you then know where you place those CA,N,C and O...<br>&gt; &gt; <br>&gt; &gt; Pavel.<br>&gt; &gt; <br>&gt; &gt; <br>&gt; &gt; <br>&gt; &gt; On 7/28/10 3:19 PM, Tom Terwilliger wrote:<br>&gt; &gt;&gt; One disadvantage of using UNK is that it is often a loss of <br>&gt; information. For example in the case Phil mentions...we do think <br>&gt; that we have a polypeptide.&nbsp; By labelling protein residues <br>&gt; UNK we no longer distinguish them from DNA, or depending on <br>&gt; HETATM vs ATOM identification, from ligands.<br>&gt; &gt;&gt; -Tom T<br>&gt; &gt;&gt; <br>&gt; &gt;&gt; On Jul 28, 2010, at 4:01 PM, Phil Evans wrote:<br>&gt; &gt;&gt; <br>&gt; &gt;&gt;&gt; UNK residues have another valid use where you can see <br>&gt; peptide but not assign a sequence register. A poly-Ala model in <br>&gt; that case is better labelled UNK than ALA, since it isn't ALA<br>&gt; &gt;&gt;&gt; <br>&gt; &gt;&gt;&gt; Phil <br>&gt; &gt;&gt;&gt; <br>&gt; &gt;&gt;&gt; <br>&gt; &gt;&gt;&gt; On 28 Jul 2010, at 19:12, Pavel Afonine wrote:<br>&gt; &gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; Dear Ed,<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt;&gt; I think it is very important to be able to include unknown atoms<br>&gt; &gt;&gt;&gt;&gt;&gt; in a deposited pdb file (with echoing the caveat about flooding<br>&gt; &gt;&gt;&gt;&gt;&gt; the structure with UNK's to lower the R-factor).<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; yes, as I wrote in original reply, including these atoms <br>&gt; may improve the map and in turn may reveal or improve some its <br>&gt; other important (biologically) places. The only point is: please <br>&gt; define these dummy atoms properly, providing all the <br>&gt; information, such as scattering element type that you or your <br>&gt; program used for such an approximation.<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt;&gt; For one thing, these structures are produced not just for <br>&gt; structure-factor<br>&gt; &gt;&gt;&gt;&gt;&gt; calculation and validation. Many of the end users will <br>&gt; never even<br>&gt; &gt;&gt;&gt;&gt;&gt; bother to do a structure factor calculation.<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; The ability to reproduce the R-factor is not only for <br>&gt; someones pleasure but for the validation purposes at least. If <br>&gt; I've got a PDB file for which I can't compute the R-factors <br>&gt; (and, by the way, even the map too), then I don't need the <br>&gt; deposited Fobs too, unless I'm going to re-determine the <br>&gt; structure from scratch.<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt;&gt; It important for the<br>&gt; &gt;&gt;&gt;&gt;&gt; depositor to be able to refer to an unknown but likely <br>&gt; significant&gt;&gt;&gt;&gt;&gt; ligand and for the reader to be able to go and <br>&gt; look at that position<br>&gt; &gt;&gt;&gt;&gt;&gt; (ideally surrounded by electron density).<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; Sure, it is important.<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt;&gt; For another thing, the structure factor calculation will <br>&gt; give exactly<br>&gt; &gt;&gt;&gt;&gt;&gt; the same result whether the dummy atoms are omitted or are <br>&gt; flagged&gt;&gt;&gt;&gt;&gt; with zero occupancy or atom-type X to be ignored in <br>&gt; sf calculation.<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; If you look in PDB you will find that very often the <br>&gt; occupancies are not set up to 1. Plus, as I mentioned, often the <br>&gt; B-factors for these atoms are set to some funny numbers (looks <br>&gt; like they were refined).<br>&gt; &gt;&gt;&gt;&gt; Are we sure that these programs were ignoring these dummies <br>&gt; in Fcalc calculations? If so how the B-factor were refined, or <br>&gt; they were made up?<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; Again, if it is defined properly, for example, like this:<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; ATOM&nbsp;&nbsp; 1959&nbsp; O&nbsp;&nbsp; DUM A&nbsp;&nbsp; <br>&gt; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; -8.762&nbsp;&nbsp; 8.060&nbsp; <br>&gt; 25.324&nbsp; 1.00 <br>&gt; 31.23&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; O<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; or<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; ATOM&nbsp;&nbsp; 1959&nbsp; O&nbsp;&nbsp; UNK A&nbsp;&nbsp; <br>&gt; 1&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; -8.762&nbsp;&nbsp; 8.060&nbsp; <br>&gt; 25.324&nbsp; 1.00 <br>&gt; 31.23&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; O<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; then it is absolutely OK to have such entries, because it <br>&gt; is completely defined and can be used in any calculations <br>&gt; without any unnecessary guesswork. But if you start masking <br>&gt; things with X or blanks then I (and the software I write) will <br>&gt; start asking all these nasty questions...<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; All the best!<br>&gt; &gt;&gt;&gt;&gt; Pavel.<br>&gt; &gt;&gt;&gt;&gt; <br>&gt; &gt;&gt;&gt;&gt; _______________________________________________<br>&gt; &gt;&gt;&gt;&gt; phenixbb mailing list<br>&gt; &gt;&gt;&gt;&gt; phenixbb@phenix-online.org<br>&gt; &gt;&gt;&gt;&gt; http://phenix-online.org/mailman/listinfo/phenixbb<br>&gt; &gt;&gt;&gt; <br>&gt; &gt;&gt;&gt; _______________________________________________<br>&gt; &gt;&gt;&gt; phenixbb mailing list<br>&gt; &gt;&gt;&gt; phenixbb@phenix-online.org<br>&gt; &gt;&gt;&gt; http://phenix-online.org/mailman/listinfo/phenixbb<br>&gt; &gt;&gt; <br>&gt; &gt;&gt; <br>&gt; &gt;&gt; Thomas C. Terwilliger<br>&gt; &gt;&gt; Mail Stop M888<br>&gt; &gt;&gt; Los Alamos National Laboratory<br>&gt; &gt;&gt; Los Alamos, NM 87545<br>&gt; &gt;&gt; <br>&gt; &gt;&gt; Tel:&nbsp; 505-667-<br>&gt; 0072&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; email: terwilliger@LANL.gov<br>&gt; &gt;&gt; Fax: 505-665-<br>&gt; 3024&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; SOLVE web site: http://solve.lanl.gov<br>&gt; &gt;&gt; PHENIX web site: http:www.phenix-online.org<br>&gt; &gt;&gt; ISFI Integrated Center for Structure and Function Innovation <br>&gt; web site: http://techcenter.mbi.ucla.edu<br>&gt; &gt;&gt; TB Structural Genomics Consortium web site: http://www.doe-<br>&gt; mbi.ucla.edu/TB&gt;&gt; CBSS Center for Bio-Security Science web site: <br>&gt; http://www.lanl.gov/cbss&gt;&gt; <br>&gt; &gt;&gt; <br>&gt; &gt;&gt; <br>&gt; &gt;&gt; <br>&gt; &gt;&gt; <br>&gt; &gt;&gt; _______________________________________________<br>&gt; &gt;&gt; phenixbb mailing list<br>&gt; &gt;&gt; <br>&gt; &gt;&gt; phenixbb@phenix-online.org<br>&gt; &gt;&gt; http://phenix-online.org/mailman/listinfo/phenixbb<br>&gt; &gt; <br>&gt; &gt; _______________________________________________<br>&gt; &gt; phenixbb mailing list<br>&gt; &gt; phenixbb@phenix-online.org<br>&gt; &gt; http://phenix-online.org/mailman/listinfo/phenixbb<br>&gt; <br>&gt; _______________________________________________<br>&gt; phenixbb mailing list<br>&gt; phenixbb@phenix-online.org<br>&gt; http://phenix-online.org/mailman/listinfo/phenixbb<br>&gt; </div><BR><BR>Boaz Shaanan, Ph.D.<br>Dept. of Life Sciences<br>Ben-Gurion University of the Negev<br>Beer-Sheva 84105<br>Israel<br>Phone: 972-8-647-2220 ; Fax: 646-1710<br>Skype: boaz.shaanan</BR></BR>‎