中央电视台冀彤彤根据实际经验对卫星网络故障进行实例分析。卫星作为一种无线传输手段,以其覆盖面广和地域限制小等特性,在高原、沙漠和山区有着广泛的市场。为了减小成本投入,可采用卫星网络加地面专线的方式进行组网,但中间环节数量多且复杂,某些环节可能形成瓶颈或完全中断。为提高传输质量,减轻后期维护负担,应对网络整体进行评估,同时通过解决故障来提高整体认知能力和系统维护能力。 2009年3月,他们在四川某地实施一个卫星视频监控项目,现将发现问题及解决问题的过程进行总结,供业内同行参考。根据要求,曾就本项目进行过先期测试。测试效果良好,视频流畅。安装点/监控点通过双向卫星链路连接到关口站,前向链路为多载波OFDM调制,反向链路为变码率QPSK调制,中心站通过40兆地面专线和关口站双向连接,这样安装点也就和中心站直接连接起来,中心站可对所有的安装点进行安装工单创建、带宽调整、软件升级等。此次项目实施即将测试样点扩大安装,并就分布点总量和带宽分配需求做了严格计算,确保各安装点有足够的通道容量进行传输。 实施了20个安装点以后,部分安装点开始出现视频传输停顿、频繁黑屏等现象,但奇怪的是所有端站Modem的Ping测试全部正常,FTP及内部OA系统全部连接正常。开始怀疑带宽分配存在问题,每个监控点有3路视频,采用MPEG-4编码,每路回传码率为128k,摄像头控制回传数据(镜头摇曳旋转、云台操控、雨刷功能)为120k,这样每个点回传带宽需求为3×128+120=504k,设计为每个安装点端站分配的回传带宽是640k,应该是绰绰有余。为了就带宽分配真实性进行确认,我们决定用iperf软件测试点对点(中心站到分布点)带宽传输,测试结果如下:中心站到安装点:约为587k;安装点到中心点:约为590k。从测试结果可知,回传宽带分配满足要求,因此,只能从别的方面考虑原因了。 在中心点使用Ethereal进行抓包分析,发现接收到的数据块大小不均,从传输良好的监控点接收的数据块约为3k左右,且计数均匀正常,从传输不正常的监控点接收的数据块大小也为3k左右,但计数中断比较大,经过认真观察,发现这些数据块的前后传输间隔约为7~13s,而正常数据块的传输间隔只0.9s,甚至只有0.9ms,非常明显,传输间隔过大可能为问题所在。 本项目采用TCP协议进行视频传输,经由卫星链路传输时延可能长达580~620ms,但由于Modem和关口站相关解调设备都具备网络加速功能,可以减小由于慢启动而引起的传输窗口大小调整所必需的时间。根据视频传输效果和实时抓包分析来看,视频传输中断和传输间隔增大几乎为同步发生,传输窗口由小增大的调整时间应该在可接受的范围之内。而且,有几个安装点的视频传输效果一直非常好,所有安装点的Modem配置和版本都一样,因此,可以排除是网络加速引起的传输故障。 在这种情况下,开始怀疑卫星天线的安装质量。众所周知,卫星传输的链路质量易受到天线指向、功率参数、甚至天气的影响,而且从长时间的监测报告可以看出,有几个安装点视频传输非常好,但过了一段时间后趋于恶化,因此,有必要对卫星端站安装进行重新审视。 视频目测效果作为一种主观观察方法难以作为客观依据,急于找到一种较为客观的评测方法来判断并反映视频传输效果,这样才能从纷繁复杂的表面现象中摆脱开来。从Ethereal分析结果来看,显然是由于3k数据块传输太少而导致视频传输不畅,也直接向视频编码器厂商求证,该设备数据块成形约为2.6k,很显然是否能顺利传输并接收2.6k数据块则成为视频传输正常的瓶颈所在。 自然想起了一条常规测试方法,即Ping。通常只以Ping来测试网络连通与否,但以不同长度的数据包Ping方法(Ping192.168.1.1-t-lXXXX)也能测试链路传输质量。本次项目中,为了限制无用数据造成拥塞,Modem限制了最大Ping包大小为192Byte,也即只能以最大192Byte的数据包去Ping连接在Modem后的视频编码器,这意味着无法以超过192Byte的大数据包来Ping这些视频编码器,而只能测试到Modem一级,但Modem与视频编码器是通过优质网线和交换机进行连接的,传输质量是可以保证的,因此只需测试从中心站到安装点的Modem即可。正式测试之前,对部分安装点的Modem进行试探性测试,发现Ping包数据长度为20000Byte时,其中的几个Modem也能Ping通,此前曾怀疑过所有的中间环节,每个环节中的路由器、协议转换器、交换机均可能出现瓶颈,但以此例可以看出,所有的中间链路(包括地面专线、相关路由配置)是没有问题的,这就打消了我们先前的疑虑,能够更加专注于不同数据包Ping测试。 为了进一步证实,对所有已安装的卫星端站并进行Ping包测试。以上端站Modem连接的电脑均可以上网,进行FTP应用和内部OA,经过推论后认为,这些基本使用对包长要求不是很严格,但视频传输对数据块大小及传输连续性的要求都相对严格,一旦受阻,则出现画面停顿。同时也在中心站对相应端站的视频传输进行了观察,发现观察结果与传输效果估计完全一致,这就从反方向论证了观察及推论的正确,也充分证实了主客观之间存在着必然的联系,此种联系可用作故障判断,也可用于卫星端站安装质量的评判手段。 再次对视频传输和网络Ping包测试进行了细致的观察,确认无误后,对问题端站进行了整改,通过加固地基、重做射频接头、紧固LNB和功放模块,或重做上行链路测试提高Eb/No值,或部分端站更换Modem,使得从中心站对所有端站Modem的Ping包测试满足最严格的要求(即4000BytePing包连通率为90%以上),视频传输效果亦如预期一样,效果非常好。通过这种客观的检测方法通过的安装,并结合中心站对收发参数曲线进行严密监控后,也极大地保证了信号冗余量,可以充分对抗一定程度的雨衰,后期实践证明,在维护中起到了非常重要的、并行之有效的作用。 由于卫星网络往往跟地面网络结合使用,中间环节较多,出现故障的可能性较大,因此须考虑线路和网络的连通,遇有传输不畅,宜将各个环节的限制全部放开,引入网络协议分析软件进行测试,将整条链路测通后,再逐步逐环节恢复安全策略和路由限制。而采用变字节Ping包进行测试是最为简单有效的方法之一。 2010年07月12日 |
微信扫码关注公众号