<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Thu, Mar 13, 2014 at 8:15 AM, Peter Kjellström <span dir="ltr"><<a href="mailto:cap@nsc.liu.se" target="_blank">cap@nsc.liu.se</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On Thursday, March 13, 2014 07:36:59 AM Hal Rosenstock wrote:<br>
> Some causes of congestion are: slow receiver,...<br>
...<br>
<div class="">> >> We recently migrated our opensm from 3.2.6 to 3.3.17. In this upgrade, we<br>
> >> moved to CentOS6.5 with the stock RDMA and infiniband-diags_1.5.12-5.,<br>
<br>
</div>Did the CentOS-6.5 upgrade include all the (compute?) nodes in the fabric or<br>
just the node running OpenSM?<br>
<br>
The reason I ask is because the 6.5 kernel has problems correctly scheduling<br>
unpinned processes on nodes with NUMA (potentially slowing down receivers on<br>
your fabric).<br></blockquote><div><br></div><div>Hi Peter,</div><div><br></div><div>The compute nodes are still at CentOS 5.10, but we're preparing a transition. The NUMA issue is intriguing. Can you point us to more information about this?</div>
<div><br></div><div>Thanks</div><div>Florent</div></div></div></div>