<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7651.14">
<TITLE>RE : [ofa-general] RE: [Bug 465] IPoIB CM HA fails after several hoursof failures</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->

<P><FONT SIZE=2>Michael<BR>
tracing route between HCA port and the subnet manager will give the lid of the switch connected to this HCA port :<BR>
<BR>
[root@cors127 ~]# ibstat<BR>
CA 'mthca0'<BR>
        CA type: MT23108<BR>
        Number of ports: 2<BR>
        Firmware version: 3.0.0<BR>
        Hardware version: a1<BR>
        Node GUID: 0x0008f10403962eb0<BR>
        System image GUID: 0x0008f10403962eb3<BR>
        Port 1:<BR>
                State: Active<BR>
                Physical state: LinkUp<BR>
                Rate: 10<BR>
                Base lid: 26<BR>
                LMC: 1<BR>
                SM lid: 14<BR>
                Capability mask: 0x00110a68<BR>
                Port GUID: 0x0008f10403962eb1<BR>
        Port 2:<BR>
                State: Down<BR>
                Physical state: Polling<BR>
                Rate: 2<BR>
                Base lid: 0<BR>
                LMC: 0<BR>
                SM lid: 0<BR>
                Capability mask: 0x00110a68<BR>
                Port GUID: 0x0008f10403962eb2<BR>
[root@cors127 ~]# ibtracert 26 14<BR>
>From ca {0x0008f10403962eb0} portnum 1 lid 0x1a-0x1b "cors127 HCA-1"<BR>
[1] -> switch port {0x0005ad000001a775}[2] lid 0x2-0x2 "Cisco Switch SFS7000"<BR>
[24] -> switch port {0x0005ad0000001834}[5] lid 0x10-0x10 "Topspin Switch - U3"<BR>
[3] -> switch port {0x0005ad0000001830}[1] lid 0xe-0xe "Topspin Switch - U1"<BR>
To switch {0x0005ad0000001830} portnum 0 lid 0xe-0xe "Topspin Switch - U1"<BR>
[root@cors127 ~]# ibtracert 26 14 2>&1 | awk '(NR==2) {print $7}'<BR>
0x2-0x2<BR>
<BR>
HCA port lid and its subnet manager lid are available in /sys/infiniband, so<BR>
it 's better to do :<BR>
<BR>
[root@cors127 ~]# ibtracert $(</sys/class/infiniband/mthca0/ports/1/lid) $(</sys/class/infiniband/mthca0/ports/1/sm_lid) 2>&1 | awk '(NR==2) {sub(/-.*/, "", $7); print $7}'<BR>
0x2<BR>
<BR>
PS: redirection of stderr to stdout is required as ibtracert gives all info on stderr.<BR>
<BR>
Philippe<BR>
-------- Message d'origine--------<BR>
De: general-bounces@lists.openfabrics.org de la part de Michael S. Tsirkin<BR>
Date: mer. 28/03/2007 22:12<BR>
À: Hal Rosenstock<BR>
Cc: Michael S. Tsirkin; general@lists.openfabrics.org; bugmail@lists.openfabrics.org<BR>
Objet : Re: [ofa-general] RE: [Bug 465] IPoIB CM HA fails after several hoursof failures<BR>
<BR>
> > > Not true; ibportstate can do this.<BR>
> ><BR>
> > I found that, yes.<BR>
> > However, to automate this fully I need to find the lid<BR>
> > of the switch that is connected to specific HCA ports.<BR>
><BR>
> So do you have the GUID or LID or the HCA port(s) in question ?<BR>
<BR>
Yes, that's easy to get.<BR>
<BR>
> > I expect ibnetdiscover can do this, but was unable to grok<BR>
> > the output syntax.<BR>
><BR>
> I'll explain once I have the answer to the above question.<BR>
><BR>
> > Is it documented somewhere?<BR>
><BR>
> In the man page but this may not be sufficient for your purposes.<BR>
><BR>
> > Alternatively, can linkinfo be queried with saquery?<BR>
><BR>
> Not currently.<BR>
<BR>
<BR>
<BR>
--<BR>
MST<BR>
_______________________________________________<BR>
general mailing list<BR>
general@lists.openfabrics.org<BR>
<A HREF="http://lists.openfabrics.org/cgi-bin/mailman/listinfo/general">http://lists.openfabrics.org/cgi-bin/mailman/listinfo/general</A><BR>
<BR>
To unsubscribe, please visit <A HREF="http://openib.org/mailman/listinfo/openib-general">http://openib.org/mailman/listinfo/openib-general</A><BR>
<BR>
</FONT>
</P>

</BODY>
</HTML>