<HTML dir=ltr><HEAD><TITLE>Re: [openfabrics-ewg] [openib-general] OFED 1.1 RC7</TITLE>
<META http-equiv=Content-Type content="text/html; charset=unicode">
<META content="MSHTML 6.00.2900.2963" name=GENERATOR></HEAD>
<BODY>
<DIV id=idOWAReplyText43349 dir=ltr>
<DIV dir=ltr><FONT face=Arial color=#000000 size=2>Hi Vlad:</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>I tried to bring up IPoIB HA on SLES 10 servers which have both HCA ports up. I have also modified ifcfg-ib1 file to have same IP address as on ib0 interface. So basicaly, both ifcfg-ib0 and ifcfg-ib1 are identical.</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2>Then I started continuous ping. Even after downing ib0 interface, ping traffic doesn't switched to ib1 interface. Please have a look at some of the logs below. If you need any additional information, please let me know.</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>Also let me know if i have missed something out.</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>Thanks,</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2>Karun</FONT></DIV>
<DIV dir=ltr><FONT face=Arial size=2></FONT> </DIV>
<DIV dir=ltr><FONT face=Arial size=2>#######################################################################</FONT></DIV>
<DIV dir=ltr>
<DIV dir=ltr>ss22:~ # ipoib_ha.pl -p ib0 -s ib1 --with-arping -v</DIV>
<DIV dir=ltr>Date:Tue Oct 10 10:38:43 2006<BR>ib0:<BR>======================================<BR>BOOTPROTO = static<BR>WIRELESS = no<BR>REMOTE_IPADDR = <BR>status = <BR>HA = 0<BR>DEVICE = ib0<BR>NETMASK = 255.255.255.0<BR>BROADCAST = 172.20.51.255<BR>STARTMODE = onboot<BR>IPADDR = 172.20.51.222<BR>NETWORK = 172.20.51.0</DIV>
<DIV dir=ltr>Date:Tue Oct 10 10:38:43 2006<BR>Bond:<BR>======================================<BR>BOOTPROTO = static<BR>WIRELESS = no<BR>REMOTE_IPADDR = <BR>status = <BR>HA = 0<BR>DEVICE = ib0<BR>NETMASK = 255.255.255.0<BR>BROADCAST = 172.20.51.255<BR>STARTMODE = onboot<BR>IPADDR = 172.20.51.222<BR>NETWORK = 172.20.51.0<BR>Got CARRIER-ON event on ib0.<BR>Got CARRIER-ON event on ib0.</DIV>
<DIV dir=ltr><FONT color=#ff0000>---->>> Here I down and up ib0 interface.<BR></FONT>Got CARRIER-ON event on ib0.<BR>Got CARRIER-ON event on ib0.<BR>Got CARRIER-ON event on ib0.<BR></DIV>
<DIV dir=ltr>#############################################</DIV>
<DIV dir=ltr>ss22:~ # cat /etc/sysconfig/network/ifcfg-ib0<BR>BOOTPROTO='static'<BR>IPADDR='172.20.51.222'<BR>NETMASK='255.255.255.0'<BR>NETWORK='172.20.51.0'<BR>BROADCAST='172.20.51.255'<BR>REMOTE_IPADDR=''<BR>STARTMODE='onboot'</DIV>
<DIV dir=ltr>WIRELESS='no'</DIV>
<DIV dir=ltr> </DIV>
<DIV dir=ltr>ss22:~ # cat /etc/sysconfig/network/ifcfg-ib1<BR>BOOTPROTO='static'<BR>IPADDR='172.20.51.222'<BR>NETMASK='255.255.255.0'<BR>NETWORK='172.20.51.0'<BR>BROADCAST='172.20.51.255'<BR>REMOTE_IPADDR=''<BR>STARTMODE='onboot'<BR>WIRELESS='no'<BR>ss22:~ # <BR>#############################################</DIV>
<DIV dir=ltr>ss22:~ # ifconfig<BR>eth0      Link encap:Ethernet  HWaddr 00:04:23:B1:43:38  <BR>          inet addr:172.20.50.222  Bcast:172.20.50.255  Mask:255.255.255.0<BR>          inet6 addr: fe80::204:23ff:feb1:4338/64 Scope:Link<BR>          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1<BR>          RX packets:396 errors:0 dropped:0 overruns:0 frame:0<BR>          TX packets:388 errors:0 dropped:0 overruns:0 carrier:0<BR>          collisions:0 txqueuelen:100 <BR>          RX bytes:48056 (46.9 Kb)  TX bytes:49190 (48.0 Kb)<BR>          Base address:0xdc00 Memory:fcfa0000-fcfc0000 </DIV>
<DIV dir=ltr>ib0       Link encap:UNSPEC  HWaddr 00-00-04-04-FE-80-00-00-00-00-00-00-00-00-00-00  <BR>          inet addr:172.20.51.222  Bcast:172.20.51.255  Mask:255.255.255.0<BR>          inet6 addr: fe80::206:6a00:a000:399/64 Scope:Link<BR>          UP BROADCAST RUNNING MULTICAST  MTU:2044  Metric:1<BR>          RX packets:48 errors:0 dropped:0 overruns:0 frame:0<BR>          TX packets:62 errors:0 dropped:1 overruns:0 carrier:0<BR>          collisions:0 txqueuelen:128 <BR>          RX bytes:3752 (3.6 Kb)  TX bytes:5052 (4.9 Kb)</DIV>
<DIV dir=ltr>ib1       Link encap:UNSPEC  HWaddr 00-00-04-05-FE-80-00-00-00-00-00-00-00-00-00-00  <BR>          inet6 addr: fe80::206:6a01:a000:399/64 Scope:Link<BR>          UP BROADCAST RUNNING MULTICAST  MTU:2044  Metric:1<BR>          RX packets:5 errors:0 dropped:0 overruns:0 frame:0<BR>          TX packets:6 errors:0 dropped:0 overruns:0 carrier:0<BR>          collisions:0 txqueuelen:128 <BR>          RX bytes:296 (296.0 b)  TX bytes:456 (456.0 b)</DIV>
<DIV dir=ltr>lo        Link encap:Local Loopback  <BR>          inet addr:127.0.0.1  Mask:255.0.0.0<BR>          inet6 addr: ::1/128 Scope:Host<BR>          UP LOOPBACK RUNNING  MTU:16436  Metric:1<BR>          RX packets:10 errors:0 dropped:0 overruns:0 frame:0<BR>          TX packets:10 errors:0 dropped:0 overruns:0 carrier:0<BR>          collisions:0 txqueuelen:0 <BR>          RX bytes:652 (652.0 b)  TX bytes:652 (652.0 b)</DIV>
<DIV dir=ltr>ss22:~ # <BR><BR>##############################################################################<BR></DIV></DIV></DIV>
<DIV dir=ltr><BR>
<HR tabIndex=-1>
<FONT face=Tahoma size=2><B>From:</B> Vladimir Sokolovsky [mailto:vlad@mellanox.co.il]<BR><B>Sent:</B> Mon 10/9/2006 9:21 AM<BR><B>To:</B> Sharma, Karun<BR><B>Cc:</B> EWG<BR><B>Subject:</B> Re: [openfabrics-ewg] [openib-general] OFED 1.1 RC7<BR></FONT><BR></DIV>
<DIV>
<P><FONT size=2>Hi Karun,<BR>Both HCA ports should be connected to the same IB subnet.<BR><BR><BR>Regards,<BR>Vladimir<BR><BR>On Mon, 2006-10-09 at 07:58 -0400, Sharma, Karun wrote:<BR>> Hi<BR>> <BR>> I think that I am seeing bug # 247 with RC7.<BR>> <BR>> I configured ipoib-ha as specified in release notes on RHEL4 up3<BR>> servers (x86_64 machines).<BR>> I started ping from one server. Simultaneously i executed ipoib_ha.pl<BR>> script (see below). Then I downed the ib0 interface and expected that<BR>> ping should recover after sometime. But ping never recovered. Then<BR>> I brought up ib0 interface again. Ping got recovered and was<BR>> successful.<BR>> <BR>> Please note that I have only 1 HCA port active. Do we need to have<BR>> both the HCA ports to be up? Even with 1 HCA port, I am able to add<BR>> and configure both ib0 and ib1 interfaces. Is it a valid<BR>> configuration? Do we have any mapping between HCA ports and ib<BR>> interfaces?<BR>> <BR>> Thanks<BR>> Karun<BR>> <BR>> ############################################################ <BR>> [root@st70 ~]# ipoib_ha.pl -p ib0 -s ib1 --with-arping -v<BR>> Date:Mon Oct  9 07:23:54 2006<BR>> ib0:<BR>> ======================================<BR>> BOOTPROTO = static<BR>> status =<BR>> HA = 0<BR>> DEVICE = ib0<BR>> NETMASK = 255.255.240.0<BR>> BROADCAST = 172.26.16.255<BR>> IPADDR = 172.26.16.70<BR>> NETWORK = 172.26.0.0<BR>> ONBOOT = yes<BR>> Date:Mon Oct  9 07:23:54 2006<BR>> Bond:<BR>> ======================================<BR>> BOOTPROTO = static<BR>> status =<BR>> HA = 0<BR>> DEVICE = ib0<BR>> NETMASK = 255.255.240.0<BR>> BROADCAST = 172.26.16.255<BR>> IPADDR = 172.26.16.70<BR>> NETWORK = 172.26.0.0<BR>> ONBOOT = yes<BR>> Got CARRIER-ON event on ib0.<BR>> Got CARRIER-ON event on ib0.<BR>> Got NO-CARRIER event on ib0.<BR>> Got NO-CARRIER but ib0 is UP<BR>> Interface ib0 is down.<BR>> Currently Active : ib0<BR>> Both interfaces are down<BR>> Got CARRIER-ON event on ib0.<BR>> migrate_conf: Migrating from ib1 to ib0<BR>> Got CARRIER-ON event on ib0.<BR>><BR>> ################################################################<BR>><BR>> ______________________________________________________________________<BR>> From: openib-general-bounces@openib.org on behalf of Aviram Gutman<BR>> Sent: Thu 10/5/2006 11:39 AM<BR>> To: EWG<BR>> Cc: Openib-General@Openib.Org<BR>> Subject: [openib-general] OFED 1.1 RC7<BR>><BR>><BR>> OFED-1.1-rc7 is available on<BR>> <A href="https://openib.org/svn/gen2/branches/1.1/ofed/releases/">https://openib.org/svn/gen2/branches/1.1/ofed/releases/</A><BR>> File: OFED-1.1-rc7.tgz<BR>> Please report any issues in bugzilla <A href="http://openib.org/bugzilla/">http://openib.org/bugzilla/</A><BR>><BR>><BR>> Release details:<BR>> ================<BR>> BUILD_ID:<BR>> OFED-1.1-rc7<BR>><BR>> openib-1.1 (REV=9725)<BR>> # User space<BR>> <A href="https://openib.org/svn/gen2/branches/1.1/src/userspace">https://openib.org/svn/gen2/branches/1.1/src/userspace</A><BR>> Git: git://www.mellanox.co.il/~git/infinibandref: refs/heads/ofed_1_1<BR>> ref: refs/heads/ofed_1_1<BR>> commit fde99a7a22e56d6aa90dae9db3d600755efcedb5<BR>><BR>> # MPI<BR>> mpi_osu-0.9.7-mlx2.2.0.tgz<BR>> openmpi-1.1.1-1.src.rpm<BR>> mpitests-2.0-0.src.rpm<BR>><BR>> Bug fixes from OFED-1.1-rc6:<BR>> ===========================<BR>> IPoIB HA:<BR>>     BUG 247: OFED IPoIB HA not working on RHEL4 U3<BR>>     BUG 259: problems with OFED IPoIB HA on SLES10<BR>><BR>> IPATH:<BR>>     BUG 252: Failed to load ib_ipath module (IPATH device is not<BR>> present)<BR>><BR>> EHCA:<BR>>     BUG 250: libehca is not selectable although ib_ehca was selected<BR>><BR>> SRP HA:<BR>>     Use port_guid instead of node_guid.<BR>>     Allows the user to set the identifier_extension when providing the<BR>>     target attributes.<BR>><BR>> ibutils:<BR>>     BUG 243: ibutils/ibis build fails on SLES 10 / PPC64<BR>><BR>> openib diags:<BR>>     BUG 241: Diags build fails on SLES 10 PPC64<BR>><BR>> Open MPI:<BR>>     Fixed compilation issue on SLES10 PPC64<BR>><BR>> mstflint :<BR>>     SLES10 ppc workaround<BR>><BR>>  Known issues:<BR>> =============<BR>><BR>> 1. IPoIB HA does not migrate IPoIB pkey interfaces (BUG 260)<BR>> 2. kernel-ib conflicts with kernel-smp (Used --force flag in kernel-ib<BR>> RPM installation as a workaround) (BUG 255)<BR>><BR>> Lets try to get a final release on Wed or Thu next week.<BR>><BR>> Aviram<BR>><BR>><BR>> _______________________________________________<BR>> openib-general mailing list<BR>> openib-general@openib.org<BR>> <A href="http://openib.org/mailman/listinfo/openib-general">http://openib.org/mailman/listinfo/openib-general</A><BR>><BR>> To unsubscribe, please visit<BR>> <A href="http://openib.org/mailman/listinfo/openib-general">http://openib.org/mailman/listinfo/openib-general</A><BR>><BR>><BR>><BR>><BR>> _______________________________________________<BR>> openfabrics-ewg mailing list<BR>> openfabrics-ewg@openib.org<BR>> <A href="http://openib.org/mailman/listinfo/openfabrics-ewg">http://openib.org/mailman/listinfo/openfabrics-ewg</A><BR></FONT></P></DIV></BODY></HTML>