Hal,<br>
<br>
Here is the log of osmtest failure. This was seen 150 times out of 2500
iterations. The opensm SUBNET UP failure is tough to reproduce. Saw it
once in 2500 iterations. Unfortunately I did not collect the log on
that error.<br>
<br>
The patch worked as expected and did not see any issues with
ctrl-C.  When I tried apply the patch, I got a failure.  (I
used the patch command). I manually added those 2 lines.<br>
<br>
Command Line Arguments<br>
Done with args<br>
        Flow = All Validations<br>
Sep 21 17:50:56 684254 [B7F026C0] -> osm_vendor_get_all_port_attr: assign CA mthca0 port 1 guid (0x2c90200400cfd) as the def<br>
ault port.<br>
using default guid 0x2c90200400cfd<br>
Sep 21 17:50:56 686301 [B7F026C0] -> osm_vendor_get_all_port_attr: assign CA mthca0 port 1 guid (0x2c90200400cfd) as the def<br>
ault port.<br>
Sep 21 17:50:56 686347 [B7F026C0] -> osm_vendor_bind: Binding to port 0x2c90200400cfd.<br>
Sep 21 17:50:56 689963 [B7F026C0] -> osm_vendor_get_all_port_attr: assign CA mthca0 port 1 guid (0x2c90200400cfd) as the def<br>
ault port.<br>
Sep 21 17:50:56 691969 [B7F026C0] -> osm_vendor_get_all_port_attr: assign CA mthca0 port 1 guid (0x2c90200400cfd) as the def<br>
ault port.<br>
Sep 21 17:50:56 693187 [B7F026C0] -> osmtest_validate_sa_class_port_info:<br>
-----------------------------<br>
SA Class Port Info:<br>
 base_ver:1<br>
 class_ver:2<br>
 cap_mask:0x202<br>
 resp_time_val:0x64<br>
-----------------------------<br>
Sep 21 17:50:56 775383 [B7F026C0] -> osmtest_wrong_sm_key_ignored: Try PortRecord for port with LID 0x0 Num:0x1.<br>
Sep 21 17:51:00 775320 [B76FFBB0] -> umad_receiver: ERR 5409: send completed with error (method=1 attr=12 trans_id=0x34) --<br>
dropping.<br>
Sep 21 17:51:00 775389 [B76FFBB0] -> umad_receiver: ERR 5410: class 0x3 LID 0x0<br>
Sep 21 17:51:00 775418 [B76FFBB0] -> osmtest_query_res_cb: ERR 0003: Error on query (IB_TIMEOUT).<br>
Sep 21 17:51:00 775465 [B7F026C0] -> osmtest_wrong_sm_key_ignored: ERR 0011: Did not get a timeout but got (IB_SUCCESS).<br>
Sep 21 17:51:00 775581 [B7F026C0] -> osmt_register_service: Registering Service: name:osmt.srvc.1804289383.7793 id:0x6b8b26f<br>
6.<br>
Sep 21 17:51:00 777143 [B7F026C0] -> osmt_register_service: Registering Service: name:osmt.srvc.846930885.7793 id:0x327b0554<br>
Sep 21 17:51:00 777143 [B7F026C0] -> osmt_register_service: Registering Service: name:osmt.srvc.846930885.7793 id:0x327b0554<br>
.<br>
Sep 21 17:51:04 779578 [B76FFBB0] -> umad_receiver: ERR 5409: send
completed with error (method=2 attr=31 trans_id=0x36) --dropping.<br>
Sep 21 17:51:04 779604 [B76FFBB0] -> umad_receiver: ERR 5410: class 0x3 LID 0x0<br>
Sep 21 17:51:04 779631 [B76FFBB0] -> osmtest_query_res_cb: ERR 0003: Error on query (IB_TIMEOUT).<br>
Sep 21 17:51:04 779674 [B7F026C0] -> osmt_register_service: ERR 0364: ib_query failed (IB_TIMEOUT).<br>
Sep 21 17:51:04 779740 [B7F026C0] -> osmtest_run: ERR 00148: Service Flow failed (IB_TIMEOUT)<br>
OSMTEST: TEST "All Validations" FAIL<br>
<br>
<br>
-Viswa<br>
<br>
<br><br><div><span class="gmail_quote">On 22 Sep 2005 15:08:02 -0400, <b class="gmail_sendername">Hal Rosenstock</b> <<a href="mailto:halr@voltaire.com">halr@voltaire.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
On Thu, 2005-09-22 at 15:06, Viswanath Krishnamurthy wrote:<br>> I do not think this would help.  The system is never rebooted. Just<br>> opensm is started  and stopped. On the mext opensm start/stop the<br>> subnet came up. I think it is more of an opensm issue than any kernel
<br>> module issue.<br><br>Can you run opensm in -V mode and send the log. It might be related to<br>the SM Set PortInfo armed->active issue which has been documented but<br>not resolved.<br><br>-- Hal<br><br></blockquote>
</div><br>