<html><body>
<p><tt>Nicolas Morey Chaisemartin <nicolas.morey-chaisemartin@ext.bull.net> ะดำฺ 2009-02-12 20:20:36:<br>
<br>
> Wen Hao Wang wrote:<br>
> ><br>
> > Hi all:<br>
> ><br>
> > I changed my blade OS to RHEL5.3 yesterday and installed OFED (shipped <br>
> > in RHEL5.3 image) by "yum groupisntall". Then I load some drivers and <br>
> > wrote network interface configuration file ifcfg-ib0. ifup ib0 also <br>
> > succeeded. But IB utilites report Connetion timed out.<br>
> ><br>
> ><br>
> > [root@xblade06 network-scripts]# sminfo<br>
> > ibwarn: [32593] _do_madrpc: recv failed: Connection timed out<br>
> > ibwarn: [32593] mad_rpc: _do_madrpc failed; dport (Lid 9)<br>
> > sminfo: iberror: failed: query<br>
> ><br>
> > I had to reboot the blade and rerun "openibd start". Then sminfo <br>
> > reported correct contents. I do not suppose this reboot is required. <br>
> > Did I miss any configuration step?<br>
> ><br>
> > Moreover, "openibd start" report one warning message about hwconf. <br>
> > Anyone has comments about this?<br>
> ><br>
> > [root@xblade07 ~]# /etc/init.d/openibd start<br>
> > Loading OpenIB kernel modules:grep: /etc/sysconfig/hwconf: No such <br>
> > file or directory<br>
> > [ OK ]<br>
> ><br>
> > Thanks a lot!<br>
> ><br>
> > Wen Hao Wang<br>
> > Email: wangwhao@cn.ibm.com<br>
> ><br>
> > ------------------------------------------------------------------------<br>
> ><br>
> > _______________________________________________<br>
> > general mailing list<br>
> > general@lists.openfabrics.org<br>
> > <a href="http://lists.openfabrics.org/cgi-bin/mailman/listinfo/general">http://lists.openfabrics.org/cgi-bin/mailman/listinfo/general</a><br>
> ><br>
> > To unsubscribe, please visit <a href="http://openib">http://openib</a>.<br>
> org/mailman/listinfo/openib-general<br>
> Sounds to me as if you haven't any Subnet Manager (OpenSM or managed <br>
> switch) running.<br>
> $sminfo<br>
> sminfo: sm lid 2 sm guid 0x8f1040041254a, activity count 751941 priority <br>
> 3 state 3 SMINFO_MASTER<br>
> $ sminfo -P 2<br>
> ibwarn: [17975] mad_rpc: _do_madrpc failed; dport (Lid 3945)<br>
> sminfo: iberror: failed: query<br>
> <br>
> (we don't have any SM on the subnet connected to port 2)<br>
> <br>
> Your reboot might have started OpenSM. Thus making it works<br>
> <br>
> Nicolas<br>
> <br>
> </tt><br>
<tt><br>
OpenSM is running on another machine with Lid 9. While this machine (xblade06)</tt><br>
<tt>has Lid 8. Here is the output after reboot:</tt><br>
<br>
<tt>[root@xblade06 ~]# sminfo</tt><br>
<tt>sminfo: sm lid 9 sm guid 0x2c90300013101, activity count 618300 priority 0 state 3 SMINFO_MASTER</tt><br>
<tt>[root@xblade06 ~]# ps -ef|grep opensm</tt><br>
<tt>root      5369  5234  0 00:08 pts/0    00:00:00 grep opensm</tt><br>
[root@xblade06 ~]# ibv_devices<br>
    device                 node GUID<br>
    ------              ----------------<br>
    mlx4_0              0002c903000134b0<br>
[root@xblade06 ~]# ibnetdiscover |grep 2c903000134b0<br>
# Initiated from node 0002c903000134b0 port 0002c903000134b1<br>
[10]    "H-0002c903000134b0"[1](2c903000134b1)          # "xblade06 HCA-1" lid 8 4xSDR<br>
caguid=0x2c903000134b0<br>
Ca      2 "H-0002c903000134b0"          # "xblade06 HCA-1"<br>
<br>
Thanks!<br>
<br>
Wen Hao Wang<br>
Email: wangwhao@cn.ibm.com<br>
<br>
</body></html>