I haven't been able to replicate this problem, but when it occurs again I will check these out and send reply.<div><br></div><div>Thanks,</div><div>Todd<br><br><div class="gmail_quote">On Sun, Jul 26, 2009 at 7:01 AM, Moni Shoua <span dir="ltr"><<a href="mailto:monis@voltaire.com">monis@voltaire.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div class="im">Ira Weiny wrote:<br>
> Check your multicast group membership and forwarding tables on the switches.<br>
><br>
> We have had similar issues and have found that some nodes fail to join the multicast groups for various reasons.<br>
><br>
> Ira<br>
</div>I think that a good start would be to send the following<br>
1. kernel neigh table<br>
ip neigh show<br>
<br>
2. ipoib path cache<br>
cat /sys/kernel/debug/ipoib/ib0_path<br>
(you probably need to mount debugfs first with 'mount -t debugfs none /sys/kernel/debug')<br>
<br>
2. ipoib mcast joins<br>
cat /sys/kernel/debug/ipoib/ib0_mcg<br>
</blockquote></div><br></div>