Here is ibv_devinfo output. It is InfiniHost_III_Lx0<br>
<br>
]# ibv_devinfo<br>
hca_id: mthca0<br>
       
fw_ver:                        
1.0.1<br>
       
node_guid:                     
0002:c902:0040:0cfc<br>
       
sys_image_guid:                
0002:c902:0040:0cff<br>
       
max_mr_size:                   
0xffffffffffffffff<br>
       
page_size_cap:                 
0x0<br>
       
vendor_id:                     
0x02c9<br>
       
vendor_part_id:                
25204<br>
       
hw_ver:                        
0x0<br>
       
phys_port_cnt:                 
1<br>
                port:   1<br>
                       
state:                 
PORT_ACTIVE (4)<br>
                       
max_mtu:               
invalid MTU (0)<br>
                       
active_mtu:            
invalid MTU (0)<br>
                       
sm_lid:                
1<br>
                       
port_lid:              
1<br>
                       
port_lmc:              
0x00<br>
<br>
<br>
Yes the CQE is a bug. But in this case at any time there should be  one<br>
outstanding packet in the pipe. The client sends 1 packet, waits for response with a <br>
pause (delay), then sends the next packet. If everything works, we should be<br>
using atmost 1 cq entry. Initially I had more number of CQ entries, but the problem<br>
appeared later.<br>
<br>
Looks like the packet is getting stuck somewhere, with no notification
back of any error.  Do we need to tweak any of the QP parameters ?
(packet life time, retries etc)  ?<br>
<br>
-Viswa<br>
<br>
<br>
<br><br><div><span class="gmail_quote">On 9/9/05, <b class="gmail_sendername">Roland Dreier</b> <<a href="mailto:rolandd@cisco.com">rolandd@cisco.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
I found one bug in your cmpost.c program that could cause CQ<br>overruns.  When you create your receive and send CQs, you create them<br>with a cqe value of 5, so they can hold at most 5 entries.  However,<br>you create the send and receive work queues so they can hold up to 10
<br>entries, and in fact the code will post up to 8 entries at a time.  So<br>it's possible to overflow the CQ.<br><br>The fix is to create the CQs to have at least as many entries as the<br>work queues -- in other words, change cqe to 10.
<br><br>However, even with this fixed I do see some strange behavior that I'm<br>still debugging.  More details on Monday.<br><br>What HCA firmware version do your systems have?<br><br> - R.<br></blockquote></div><br>