<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<style type="text/css" style="display:none;"> P {margin-top:0;margin-bottom:0;} </style>
</head>
<body dir="ltr">
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
Hello Eric,&nbsp;</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
<br>
</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
You've had some good responses as to things to do already, but I'll throw in one 'old school' method.&nbsp;</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
When I had this situation (although with somewhat higher resolution data), I went through the density with Coot and tried to put in residues where I thought I could identify them (Trp, Phe, Cys, Pro, etc). I did this iteratively (with some refinement) until
 I came up with a stretch of say 8-10 residues where I thought the sequence fit the density reasonably well. I then did a search for that sequence. In your case, if you obtained the protein from E. coli, then I would just search the E. coli set of proteins
 using something like UniProt. You obviously need to take into account that you won't be able to tell the difference between Asp/Asn and Glu/Gln, so don't look for 100% matches. This allowed me to narrow down the possible proteins to just one or two and I then
 had a full sequence to work with.&nbsp;</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
Might be worth a shot.&nbsp;</div>
<div style="font-family: Calibri, Arial, Helvetica, sans-serif; font-size: 12pt; color: rgb(0, 0, 0); background-color: rgb(255, 255, 255);" class="elementToProof">
Best of luck, tom&nbsp;</div>
<div id="appendonsend"></div>
<hr style="display:inline-block;width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> phenixbb-bounces@phenix-online.org &lt;phenixbb-bounces@phenix-online.org&gt; on behalf of Rosenberg, Eric (NIH/NCI) [F] &lt;eric.rosenberg@nih.gov&gt;<br>
<b>Sent:</b> Saturday, February 4, 2023 7:22 AM<br>
<b>To:</b> phenixbb@phenix-online.org &lt;phenixbb@phenix-online.org&gt;<br>
<b>Subject:</b> [phenixbb] Solving MR solution without sequence information</font>
<div>&nbsp;</div>
</div>
<style>
<!--
@font-face
        {font-family:"Cambria Math"}
@font-face
        {font-family:Calibri}
p.x_MsoNormal, li.x_MsoNormal, div.x_MsoNormal
        {margin:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif}
span.x_EmailStyle17
        {font-family:"Calibri",sans-serif;
        color:windowtext}
.x_MsoChpDefault
        {font-family:"Calibri",sans-serif}
@page WordSection1
        {margin:1.0in 1.0in 1.0in 1.0in}
div.x_WordSection1
        {}
-->
</style>
<div lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<table border="0" cellspacing="0" cellpadding="0" width="100%" align="left" style="border:0; display:table; width:100%; table-layout:fixed; border-collapse:seperate; float:none">
<tbody style="display:block">
<tr>
<td valign="middle" width="1px" bgcolor="#A6A6A6" cellpadding="7px 2px 7px 2px" style="padding:7px 2px 7px 2px; background-color:#A6A6A6">
</td>
<td valign="middle" width="100%" bgcolor="#EAEAEA" cellpadding="7px 5px 7px 15px" color="#212121" style="width:100%; background-color:#EAEAEA; padding:7px 5px 7px 15px; font-family:wf_segoe-ui_normal,Segoe UI,Segoe WP,Tahoma,Arial,sans-serif; font-size:12px; font-weight:normal; color:#212121; text-align:left; word-wrap:break-word">
<div>You don't often get email from eric.rosenberg@nih.gov. <a href="https://aka.ms/LearnAboutSenderIdentification">
Learn why this is important</a></div>
</td>
<td valign="middle" align="left" width="75px" bgcolor="#EAEAEA" cellpadding="7px 5px 7px 5px" color="#212121" style="width:75px; background-color:#EAEAEA; padding:7px 5px 7px 5px; font-family:wf_segoe-ui_normal,Segoe UI,Segoe WP,Tahoma,Arial,sans-serif; font-size:12px; font-weight:normal; color:#212121; text-align:left; word-wrap:break-word">
</td>
</tr>
</tbody>
</table>
<div>
<div class="x_WordSection1">
<p class="x_MsoNormal">Hi all,</p>
<p class="x_MsoNormal">&nbsp;</p>
<p class="x_MsoNormal">I�m in a bit of bind here and am seeking some advice. For context, a former graduate student in our lab set crystal trays of an MBP fusion protein, the fused part after MBP being ~400 amino acids long. This region is also predicted to
 be mostly unstructured, but has a C-terminal SH3 domain. Our graduate student then graduated and before throwing out some of her trays a year or two later, we found some hits of the MBP fusion protein that actually diffracted to 2.9 Angstrom. I spent some
 time working on it after we collected the data (June 2021), but because I didn�t know what crystallized specifically, it was impossible to phase, and replicating seemed next to impossible, too. The Matthew�s coefficient was predicting ~130 amino acids in the
 ASU, space group C222 or C2221. Since whatever crystallized was clearly a degradation product of the MBP fusion, I tried phasing with SH3 domains and a lot of other things to no avail. As a final last ditch effort I eventually submitted the .mtz file to SBGrid
 to perform a Wide Search MR job, and low and behold it actually found MR solutions that had TFZ scores ~17 in space group C2221!</p>
<p class="x_MsoNormal">&nbsp;</p>
<p class="x_MsoNormal">So here�s my current situation�I have been able to phase the data set using the MR search model, but again, I don�t know what specifically it is that I�ve crystallized. I�m currently able to get the Rfree to ~0.4, but can�t seem to improve
 it. I am really at a loss of what to do, since there are obvious backbone issues with the protein (as seen from iterative build composite omit maps), but every time I try to manually correct them it seems to make the Rfree worse. The MR solution does not align
 very well at all to the MBP fusion, only ~20 identity, and again, I don�t know to which ~130 amino acids I crystallized out of the ~400 of the MBP fusion. Is it one continuous stretch, two copies of a shorter stretch, etc.?</p>
<p class="x_MsoNormal">&nbsp;</p>
<p class="x_MsoNormal">I tried phasing with a polyalanine model of the MR search model and then tried autobuilding just a polyalanine sequence to get the backbone right, but that doesn�t seem to work. Autobuild also fails when trying to various fragments of
 the MBP fusion sequence. Other than opening coot and manually building the entire polypeptide chain, is there an easier method? I think that once the backbone is totally right the phases will improve so I can start putting in side chains, but I�m not sure.
 My latest effort is to just use Sculptor prior to Phaser in order to force the sequences to match, but again, I don�t know precisely what sequence was crystallized. I have tried both the Phenix and CCP4 software suites, for reference.</p>
<p class="x_MsoNormal">&nbsp;</p>
<p class="x_MsoNormal">Any and all help would be much appreciated (and yield an acknowledgement on a paper, if this ever works).</p>
<p class="x_MsoNormal">&nbsp;</p>
<p class="x_MsoNormal">Best,</p>
<p class="x_MsoNormal">Eric Rosenberg</p>
<p class="x_MsoNormal">&nbsp;</p>
<p class="x_MsoNormal">CRTA Postdoctoral Fellow</p>
<p class="x_MsoNormal">Randazzo Lab</p>
<p class="x_MsoNormal">Laboratory of Cellular and Molecular Biology</p>
<p class="x_MsoNormal">National Cancer Institute, US</p>
</div>
</div>
</div>
</body>
</html>