<html><body>
<p><tt>Roland Dreier <rdreier@cisco.com> wrote on 06/25/2008 02:43:19 PM:<br>
<br>
> Interesting... I wonder if it really is taking that long for everything<br>
> to finish draining, or if the system is too busy so it sees a spurious<br>
> timeout?  The intention of all of this is that it should "never happen"<br>
> unless the hardware really is stuck.<br>
</tt><br>
<tt>I guess the reason might be we have a large cluster, each node has 4 ports, too many RC QPs in this set up. We saw QPs went to dead and 5 secs drain didn't work.</tt><br>
<tt> <br>
> What exactly is causing the crash here?<br>
</tt><br>
<tt>You can ignore this for now, it's related to other patch not current code level. I will explain it in drain WR post_send failure patch.</tt><br>
<tt> </tt><br>
<tt>Please review the stale connection resource cleanup patch to see whether it makes sense.<br>
</tt><br>
<tt>thanks</tt><br>
<tt>Shirley</tt></body></html>