netjia-cpu commented on issue #2146: URL: https://github.com/apache/brpc/issues/2146#issuecomment-1506190966
> > > > > > 我升级到了brpc1.4版本,依然没有解决这个问题,不断注入网络故障:ifconfig down/up bond的一个口,又复现了 > > > > > > > > > > > > > > > 请问你们网络故障注入的具体流程是怎样的,每次网络注入故障多久后恢复? > > > > > > > > > > > > 我们是bond4组网,ifconfig down/up bond的其中一个网口,注入故障10s内随机,一直循环10几个小时,最后恢复 > > > > > > > > > 请问在你们的环境中,大概多久能够复现呢? > > > > > > 一般来说,这样的故障跑一个晚上,第二天早上看,brpc基本会出问题。最快的时候见过,1-2个小时就出了。 复现的时候还见过除了E112以外的错误,E1008,一直返回超时,抓包看,没有包发到server端,bvar看connection是残缺的,2天都没自动恢复,所以我猜也是处于假死状态 > > 请问你们的环境中,ifconfig up bond之后立即就进行下一轮的ifconfig down bond了吗?还是等待了一段时间呢?如果等待,等了多久呢? 这样表达,应该比较准确了: while (1) { ifdown bond sleep (rand(1, 99)) ifup bond sleep(rand(1, 9)) } 这个方式只是复现的概率比较高,别的network restart,随机搞,也复现过 -- This is an automated message from the Apache Git Service. To respond to the message, please log on to GitHub and use the URL above to go to the specific comment. To unsubscribe, e-mail: dev-unsubscr...@brpc.apache.org For queries about this service, please contact Infrastructure at: us...@infra.apache.org --------------------------------------------------------------------- To unsubscribe, e-mail: dev-unsubscr...@brpc.apache.org For additional commands, e-mail: dev-h...@brpc.apache.org