1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 存储系统中权故障检测器的设计.pdf

论文研究 存储系统中权故障检测器的设计.pdf

上传者: 2020-07-30 18:25:32上传 PDF文件 559.85KB 热度 11次
容灾存储系统主要是针对数据备份而言,确保应用不因为意外事件而带来重大损失,但不能保证应用不因为故障的发生而被中断;不能快速反映系统视图的变化。而一般的故障检测器不满足灵活性需求。提出一种权故障检测器,根据权值的变化来反映网络状态的变化,能按照网络状态和应用程序的需要自动调整。实验结果也证明这种检测器能满足灵活性的需求。142010,46(25)Computer Engineering and Applications计算机工程与应用被丢弃,而新的采样值会添加到这个有限的滑动窗口中。测。首先,测量阈值Φ和滑动窗口缓冲区大小对o值的影任务需要跟踪记录两个数值,这两个数值对于估计都很响。然后,在相同错误率λ的情况下与Chen和 Bertier I的故障重要:均值,到达时间间隔的方差2。对这两个数值,通过记检测器进行比较。比较结果将显示故障检测器能多快怀疑录到达时间间隔的总和和平方和就可以得到个已崩溃的进程任务2计算on。WFDA基于H分析某个进程v的心跳到52实验步骤达时间趋势。Ⅰ可以被看作是·个离散分布。WFDA通过平实验由两部分组成。第一部分,分别改变两个参数来测滑采样值得到一个连续的分布曲线,这样在任何时刻都可以量权故障检测器的性能。测量改变阈值对错误率和检测时间计算P。检测器基于时间t,利用这个分布计算P,这里t的影响。第二部分,将权故障检测器与另外两个自适应故障是检测节点p询问本地故障检测器的时间。P可以按前面的检测器以进行比较。为使3种故障检测器能在完全相同的条章节的定义变换成p件下进行对比,使用相同的心跳信息发送周期来测量它们的实际上,存在一种可能性使在将来某个时刻内下一个心性能。跳信息会达到。因此,P在异步环境中永远不会达到1。设置一个阈值φn,通过由放障检测器返回的φ来怀疑或这个任务是为了计算权值。当故障检测器从应用程序相信一个节点P。只有当p>的时候,应用程序才会怀疑节接收到洵问后,这个任务才会被调用。计算过程如下:通过任点p。这里,國值的功能就是起超时值的作用但两者又是务1计算(,02),再通过公式(3)计算P,其中是某些应用程有区别的,主要区别是阈值可以按每个应用程序的需求来设序调用任务2计算P的时间。置,也可以按每条链路的状况来设置,而且阈值不用长时间保持固定值。dx不但需要研究阈值Φ对故障检测器的影响,还要测量滑最后根据Pa通过公式(2)变换成动窗口大小对故障检测器行为所产生的影响。算法如下所示5.3实验环境初始化设置一被检测节点与一检测节点,检测节点分别利用保持最大序列数}dAFD与NFD-两种故障检测器来检验被检测节点是否出现2.WS=常量{窗口大小是个常量故障。检测节点和被检测节点是两台CPU为 AMD Sempron3.LAn=0{前一个心跳信息的到达时间}800+,内存为1GB,操作系统为 Windows Xp的PC机。使用时间间隔}Nistnet模拟广域网环境来验证dAFD故障检测器在广域网下的性能p-5g=0实验1平均错误率任务1:实验主要测量权枚障检测器的平均错误率λ,以及当阈6. upon receive heartbeat H值¢(用来触发怀疑)增加后,错误率是怎样变化的。7. if i>s thenA=A-LA图4显示在对数范围内错误率的结果。随着阈值的增加,错误率会下降。9. LA =A0.5000.10011.sm=A30.010q7j-i Ws 1)syrp suin0.001o=、Ws-(Hs0246810121416阈值ssuN图4实验1(垂直坐标是对数)15. end if任务2实验2平均检测时间16. upon receive request from p about q at time t实验将测量权故障检测器的平均检测时间,以及当阈值Φ=o(t)变化时,权故障检测器是怎么变化的。平均检测时间是当return个节点崩溃到故障检测器发出怀疑信息所花的时间。在权故障检测器中,阈值φ可以近似等于超时值,当g值增加到阈值φ5wFDA性能测试实验及其结果分析时所花费的时间为△。,LA为前一个心跳信息到达时间,则将分析权故障检测器的实验结果,并将实验结果与Chera-lac和 Bertier?的自适应枚障检测器做比较图5显示随着怀疑阈值的增加,检测时间所发生的变化。51实验目标曲线显示当阈值超过10或11时,平均检测时间会显著增加。通过心跳序列,权故障检测器的性能按以下两步进行评实验3与Chen和 Bertier故障检测器的比较杨光,周敬利:存储系统中权故障检测器的设计2010,46(25)15好一1Bertier的故障检测算法在这个实验中性能不是很好。观2.0察实验结果,可以发现 Bertier的故障检测算法对于两种情况反应很敏感:(1)信息丢失;(2)接收心跳信息的波动太大。这是因为 bertier的故障检测算法的设计是基于局域网,所以在局域网中信息很少丢失。046810121416阈值Φ/图5实验26总结权故障检测器通过引用数学的权值概念,建立基于权值比较的目的是显示权故障检测器提供的灵活性不会产生的节点可用等级,并通过阈值反映各应用的需求,从而实现细额外的性能损失。粒度的故障检测判断,而不是单纯的二维信息。权故障检测Chen的NFDE故障检测算法的调节参数是安全时间余器不但能适应网络状态的变化和同时运行的多个应用程序的量α,这是一个简单的额外时间,是用米与预计的下一次心跳需求,还能为故障检测服务提供所需的灵活性。传统的基于到达时间相加而得到下一次心跳信息超时的预测值。 bertier随机方式的故障检测器虽也能适应刚络状态的变化,但却不的故障检测算法没有调节参数,按照 Jacobson的估计往返时能满足多个应用程序的需求。延算法的标准设置参数β=1,φ=4,按照 Bertier的做法设置通过实验对权故障检测器的特性做岀了分析;并将权故参数y=01最后,3种故章检测算法的窗口大小都设置为100障检测器与两种著名的自适应故障检测器(ChP"和 Bernier假设消息行为符合正态分布。的故障检测算法)进行比较,可以发现权故障检测器不会对性图6(a)显示了对于检测速度要求比较快的应用的实验结能产生过多的负担,同时也发现Chen和 Bertier枚障检测器的果,图6(b)显示对于精确度要求比较高而检测速度要求亻快估算性能要稍微优于权故障检测器。这说明权故障检测器仍的应用的实验结果。纵坐标表示错误率,是以对数范围表示然有待改进的地方:(1)提高计算的速度;(2)减少内存资源的。横坐标表示佔计的平均探测时间,是一个线性范围。最的使用:(3)更好地处理信息丢失的问题。佳的值在图的左下角,这里表示故障检测器在提供最小的探测时间的同时保持了最小的错误率参考文献bertier[1] Fetacr C, Raynal M, Tronel F An adaptive failure detection pro权故障检测算法0.100tocol[C] //Williams A D. Proc of the 2001 Pacific Rim IntISymp on Dependable Computing. Seoul IEEE Computer Society Press, 2001: 146-1530.010[2] Bertier M, Marin O, Sens P Implementation and performanceevaluation of an adaptable failure detector /Martin D ce0.001052.0Proc of the 15th Int'I Conf on Dependable Systems and Networks. Bethesda: IEEE CS Press. 2002. 354-363图6(a)3种故障检测器的比较图检测时间比较小)[3 Chen W, Toueg S, Aguilera M KOn the quality of service of0.1000failure detectors[]. IEEE Trans on Computers, 2002, 51(5)Chen561-580权故障检测算法0.0100[4] Hayashibara N, Cherif A, Katayama T Failure detectors forlarge-scale distributed systems[C]/Proc 2lst IEEE Symp on把00010Reliable Distributed Systems(SRDS-21), Int'I Workshop onSclf-Rcpairing and Sclf-Configurablc Distributcd Systcms0.0001(RCDS’2002), Osaka, Japan,2002:404-40930[5] Jacobson V Congestion avoidance and control[C]/Proc of ACM图6(b)3种故障检测器的比较图SIGCOMM 88 Stanford, CA, USA. 1988(检测时间比较大)[6]刘钢,周敬利,秦磊华,等.纠错码拜占庭容错 Quorum中错误检测机制[J计算机科学,2007,34(5):75-79实验结果还显示权故障检测器不会产生额外的性能损[7] Farley M.SAN存储区域网络孙功星,蒋文保,译北京:机械失。将权故障检测器与NFD-E故障检测器比较,可以看出它工业出版社,2002们的趋势基本是致的。在实验中可以发现,权故障检测器[8]τianD, Chen s Y, Li J Novel adaptive failure detector for dis-在检测时间比较小的情况下,性能要好于NFD-E故障橋测器tributed systems[J]Journal of Harbin Institute of Technology相反,在检测时间比较大的情况下,NFDE故障检测器性能要2006,38 Suppl):374-377
用户评论