<HTML dir=ltr><HEAD><TITLE>RE: [openfabrics-ewg] [openib-general] OFED 1.1 RC7</TITLE>
<META http-equiv=Content-Type content="text/html; charset=unicode">
<META content="MSHTML 6.00.2900.2963" name=GENERATOR></HEAD>
<BODY>
<DIV id=idOWAReplyText66395 dir=ltr>
<DIV dir=ltr><FONT face=Arial color=#000000 size=2>Hi Vlad:</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>Thanks for the information. It is working fine now. </FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>Regards,</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2>Karun</FONT></DIV></DIV>
<DIV dir=ltr><BR>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> Vladimir Sokolovsky [mailto:vlad@mellanox.co.il]<BR><B>Sent:</B> Tue 10/10/2006 8:01 AM<BR><B>To:</B> Sharma, Karun<BR><B>Cc:</B> EWG<BR><B>Subject:</B> RE: [openfabrics-ewg] [openib-general] OFED 1.1 RC7<BR></FONT><BR></DIV>
<DIV>
<P><FONT size=2>Hi Karun,<BR>Running 'ifconfig ib0 down' will not cause IPoIB HA service to switch to<BR>ib1 interface.<BR><BR>You can disconect the cable from ib0 interface to make the switch to ib1<BR>happen.<BR><BR>--<BR><BR>Regards,<BR>Vladimir<BR><BR><BR>On Tue, 2006-10-10 at 01:28 -0400, Sharma, Karun wrote:<BR>> Hi Vlad:<BR>> <BR>> I tried to bring up IPoIB HA on SLES 10 servers which have both HCA<BR>> ports up. I have also modified ifcfg-ib1 file to have same IP address<BR>> as on ib0 interface. So basicaly, both ifcfg-ib0 and ifcfg-ib1 are<BR>> identical.<BR>> Then I started continuous ping. Even after downing ib0 interface, ping<BR>> traffic doesn't switched to ib1 interface. Please have a look at some<BR>> of the logs below. If you need any additional information, please let<BR>> me know.<BR>> <BR>> Also let me know if i have missed something out.<BR>> <BR>> Thanks,<BR>> Karun<BR>> <BR>> #######################################################################<BR>> ss22:~ # ipoib_ha.pl -p ib0 -s ib1 --with-arping -v<BR>> Date:Tue Oct 10 10:38:43 2006<BR>> ib0:<BR>> ======================================<BR>> BOOTPROTO = static<BR>> WIRELESS = no<BR>> REMOTE_IPADDR =<BR>> status =<BR>> HA = 0<BR>> DEVICE = ib0<BR>> NETMASK = 255.255.255.0<BR>> BROADCAST = 172.20.51.255<BR>> STARTMODE = onboot<BR>> IPADDR = 172.20.51.222<BR>> NETWORK = 172.20.51.0<BR>> Date:Tue Oct 10 10:38:43 2006<BR>> Bond:<BR>> ======================================<BR>> BOOTPROTO = static<BR>> WIRELESS = no<BR>> REMOTE_IPADDR =<BR>> status =<BR>> HA = 0<BR>> DEVICE = ib0<BR>> NETMASK = 255.255.255.0<BR>> BROADCAST = 172.20.51.255<BR>> STARTMODE = onboot<BR>> IPADDR = 172.20.51.222<BR>> NETWORK = 172.20.51.0<BR>> Got CARRIER-ON event on ib0.<BR>> Got CARRIER-ON event on ib0.<BR>> ---->>> Here I down and up ib0 interface.<BR>> Got CARRIER-ON event on ib0.<BR>> Got CARRIER-ON event on ib0.<BR>> Got CARRIER-ON event on ib0.<BR>><BR>> #############################################<BR>> ss22:~ # cat /etc/sysconfig/network/ifcfg-ib0<BR>> BOOTPROTO='static'<BR>> IPADDR='172.20.51.222'<BR>> NETMASK='255.255.255.0'<BR>> NETWORK='172.20.51.0'<BR>> BROADCAST='172.20.51.255'<BR>> REMOTE_IPADDR=''<BR>> STARTMODE='onboot'<BR>> WIRELESS='no'<BR>> <BR>> ss22:~ # cat /etc/sysconfig/network/ifcfg-ib1<BR>> BOOTPROTO='static'<BR>> IPADDR='172.20.51.222'<BR>> NETMASK='255.255.255.0'<BR>> NETWORK='172.20.51.0'<BR>> BROADCAST='172.20.51.255'<BR>> REMOTE_IPADDR=''<BR>> STARTMODE='onboot'<BR>> WIRELESS='no'<BR>> ss22:~ #<BR>> #############################################<BR>> ss22:~ # ifconfig<BR>> eth0      Link encap:Ethernet  HWaddr 00:04:23:B1:43:38 <BR>>           inet addr:172.20.50.222  Bcast:172.20.50.255<BR>> Mask:255.255.255.0<BR>>           inet6 addr: fe80::204:23ff:feb1:4338/64 Scope:Link<BR>>           UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1<BR>>           RX packets:396 errors:0 dropped:0 overruns:0 frame:0<BR>>           TX packets:388 errors:0 dropped:0 overruns:0 carrier:0<BR>>           collisions:0 txqueuelen:100<BR>>           RX bytes:48056 (46.9 Kb)  TX bytes:49190 (48.0 Kb)<BR>>           Base address:0xdc00 Memory:fcfa0000-fcfc0000<BR>> ib0       Link encap:UNSPEC  HWaddr<BR>> 00-00-04-04-FE-80-00-00-00-00-00-00-00-00-00-00 <BR>>           inet addr:172.20.51.222  Bcast:172.20.51.255<BR>> Mask:255.255.255.0<BR>>           inet6 addr: fe80::206:6a00:a000:399/64 Scope:Link<BR>>           UP BROADCAST RUNNING MULTICAST  MTU:2044  Metric:1<BR>>           RX packets:48 errors:0 dropped:0 overruns:0 frame:0<BR>>           TX packets:62 errors:0 dropped:1 overruns:0 carrier:0<BR>>           collisions:0 txqueuelen:128<BR>>           RX bytes:3752 (3.6 Kb)  TX bytes:5052 (4.9 Kb)<BR>> ib1       Link encap:UNSPEC  HWaddr<BR>> 00-00-04-05-FE-80-00-00-00-00-00-00-00-00-00-00 <BR>>           inet6 addr: fe80::206:6a01:a000:399/64 Scope:Link<BR>>           UP BROADCAST RUNNING MULTICAST  MTU:2044  Metric:1<BR>>           RX packets:5 errors:0 dropped:0 overruns:0 frame:0<BR>>           TX packets:6 errors:0 dropped:0 overruns:0 carrier:0<BR>>           collisions:0 txqueuelen:128<BR>>           RX bytes:296 (296.0 b)  TX bytes:456 (456.0 b)<BR>> lo        Link encap:Local Loopback <BR>>           inet addr:127.0.0.1  Mask:255.0.0.0<BR>>           inet6 addr: ::1/128 Scope:Host<BR>>           UP LOOPBACK RUNNING  MTU:16436  Metric:1<BR>>           RX packets:10 errors:0 dropped:0 overruns:0 frame:0<BR>>           TX packets:10 errors:0 dropped:0 overruns:0 carrier:0<BR>>           collisions:0 txqueuelen:0<BR>>           RX bytes:652 (652.0 b)  TX bytes:652 (652.0 b)<BR>> ss22:~ #<BR>><BR>> ##############################################################################<BR>><BR>><BR>><BR>> ______________________________________________________________________<BR>> From: Vladimir Sokolovsky [<A href="mailto:vlad@mellanox.co.il">mailto:vlad@mellanox.co.il</A>]<BR>> Sent: Mon 10/9/2006 9:21 AM<BR>> To: Sharma, Karun<BR>> Cc: EWG<BR>> Subject: Re: [openfabrics-ewg] [openib-general] OFED 1.1 RC7<BR>><BR>><BR>> Hi Karun,<BR>> Both HCA ports should be connected to the same IB subnet.<BR>><BR>><BR>> Regards,<BR>> Vladimir<BR>><BR>> On Mon, 2006-10-09 at 07:58 -0400, Sharma, Karun wrote:<BR>> > Hi<BR>> ><BR>> > I think that I am seeing bug # 247 with RC7.<BR>> ><BR>> > I configured ipoib-ha as specified in release notes on RHEL4 up3<BR>> > servers (x86_64 machines).<BR>> > I started ping from one server. Simultaneously i executed<BR>> ipoib_ha.pl<BR>> > script (see below). Then I downed the ib0 interface and expected<BR>> that<BR>> > ping should recover after sometime. But ping never recovered. Then<BR>> > I brought up ib0 interface again. Ping got recovered and was<BR>> > successful.<BR>> ><BR>> > Please note that I have only 1 HCA port active. Do we need to have<BR>> > both the HCA ports to be up? Even with 1 HCA port, I am able to add<BR>> > and configure both ib0 and ib1 interfaces. Is it a valid<BR>> > configuration? Do we have any mapping between HCA ports and ib<BR>> > interfaces?<BR>> ><BR>> > Thanks<BR>> > Karun<BR>> ><BR>> > ############################################################<BR>> > [root@st70 ~]# ipoib_ha.pl -p ib0 -s ib1 --with-arping -v<BR>> > Date:Mon Oct  9 07:23:54 2006<BR>> > ib0:<BR>> > ======================================<BR>> > BOOTPROTO = static<BR>> > status =<BR>> > HA = 0<BR>> > DEVICE = ib0<BR>> > NETMASK = 255.255.240.0<BR>> > BROADCAST = 172.26.16.255<BR>> > IPADDR = 172.26.16.70<BR>> > NETWORK = 172.26.0.0<BR>> > ONBOOT = yes<BR>> > Date:Mon Oct  9 07:23:54 2006<BR>> > Bond:<BR>> > ======================================<BR>> > BOOTPROTO = static<BR>> > status =<BR>> > HA = 0<BR>> > DEVICE = ib0<BR>> > NETMASK = 255.255.240.0<BR>> > BROADCAST = 172.26.16.255<BR>> > IPADDR = 172.26.16.70<BR>> > NETWORK = 172.26.0.0<BR>> > ONBOOT = yes<BR>> > Got CARRIER-ON event on ib0.<BR>> > Got CARRIER-ON event on ib0.<BR>> > Got NO-CARRIER event on ib0.<BR>> > Got NO-CARRIER but ib0 is UP<BR>> > Interface ib0 is down.<BR>> > Currently Active : ib0<BR>> > Both interfaces are down<BR>> > Got CARRIER-ON event on ib0.<BR>> > migrate_conf: Migrating from ib1 to ib0<BR>> > Got CARRIER-ON event on ib0.<BR>> ><BR>> > ################################################################<BR>> ><BR>> ><BR>> ______________________________________________________________________<BR>> > From: openib-general-bounces@openib.org on behalf of Aviram Gutman<BR>> > Sent: Thu 10/5/2006 11:39 AM<BR>> > To: EWG<BR>> > Cc: Openib-General@Openib.Org<BR>> > Subject: [openib-general] OFED 1.1 RC7<BR>> ><BR>> ><BR>> > OFED-1.1-rc7 is available on<BR>> > <A href="https://openib.org/svn/gen2/branches/1.1/ofed/releases/">https://openib.org/svn/gen2/branches/1.1/ofed/releases/</A><BR>> > File: OFED-1.1-rc7.tgz<BR>> > Please report any issues in bugzilla <A href="http://openib.org/bugzilla/">http://openib.org/bugzilla/</A><BR>> ><BR>> ><BR>> > Release details:<BR>> > ================<BR>> > BUILD_ID:<BR>> > OFED-1.1-rc7<BR>> ><BR>> > openib-1.1 (REV=9725)<BR>> > # User space<BR>> > <A href="https://openib.org/svn/gen2/branches/1.1/src/userspace">https://openib.org/svn/gen2/branches/1.1/src/userspace</A><BR>> > Git: git://www.mellanox.co.il/~git/infinibandref:<BR>> refs/heads/ofed_1_1<BR>> > ref: refs/heads/ofed_1_1<BR>> > commit fde99a7a22e56d6aa90dae9db3d600755efcedb5<BR>> ><BR>> > # MPI<BR>> > mpi_osu-0.9.7-mlx2.2.0.tgz<BR>> > openmpi-1.1.1-1.src.rpm<BR>> > mpitests-2.0-0.src.rpm<BR>> ><BR>> > Bug fixes from OFED-1.1-rc6:<BR>> > ===========================<BR>> > IPoIB HA:<BR>> >     BUG 247: OFED IPoIB HA not working on RHEL4 U3<BR>> >     BUG 259: problems with OFED IPoIB HA on SLES10<BR>> ><BR>> > IPATH:<BR>> >     BUG 252: Failed to load ib_ipath module (IPATH device is not<BR>> > present)<BR>> ><BR>> > EHCA:<BR>> >     BUG 250: libehca is not selectable although ib_ehca was selected<BR>> ><BR>> > SRP HA:<BR>> >     Use port_guid instead of node_guid.<BR>> >     Allows the user to set the identifier_extension when providing<BR>> the<BR>> >     target attributes.<BR>> ><BR>> > ibutils:<BR>> >     BUG 243: ibutils/ibis build fails on SLES 10 / PPC64<BR>> ><BR>> > openib diags:<BR>> >     BUG 241: Diags build fails on SLES 10 PPC64<BR>> ><BR>> > Open MPI:<BR>> >     Fixed compilation issue on SLES10 PPC64<BR>> ><BR>> > mstflint :<BR>> >     SLES10 ppc workaround<BR>> ><BR>> >  Known issues:<BR>> > =============<BR>> ><BR>> > 1. IPoIB HA does not migrate IPoIB pkey interfaces (BUG 260)<BR>> > 2. kernel-ib conflicts with kernel-smp (Used --force flag in<BR>> kernel-ib<BR>> > RPM installation as a workaround) (BUG 255)<BR>> ><BR>> > Lets try to get a final release on Wed or Thu next week.<BR>> ><BR>> > Aviram<BR>> ><BR>> ><BR>> > _______________________________________________<BR>> > openib-general mailing list<BR>> > openib-general@openib.org<BR>> > <A href="http://openib.org/mailman/listinfo/openib-general">http://openib.org/mailman/listinfo/openib-general</A><BR>> ><BR>> > To unsubscribe, please visit<BR>> > <A href="http://openib.org/mailman/listinfo/openib-general">http://openib.org/mailman/listinfo/openib-general</A><BR>> ><BR>> ><BR>> ><BR>> ><BR>> > _______________________________________________<BR>> > openfabrics-ewg mailing list<BR>> > openfabrics-ewg@openib.org<BR>> > <A href="http://openib.org/mailman/listinfo/openfabrics-ewg">http://openib.org/mailman/listinfo/openfabrics-ewg</A><BR>><BR>><BR>><BR></FONT></P></DIV></BODY></HTML>