数字标牌行业门户网站 服务热线:400-6789-360 [会员登录][免费注册][数字标牌通下载]投稿|设为首页|收藏|RSS
数字标牌也称数字告示或多媒体信息发布系统
数字标牌显示器
当前位置:数字标牌网 > 行业新闻 > > 如何检测和处理数字标牌视频墙系统中的组件故障
如何检测和处理数字标牌视频墙系统中的组件故障
编辑:诗玉 [ 2017-8-29 16:56:29 ] 文章来源:数字标牌网
数字标牌显示器

数字标牌故障可能发生在视频墙系统中,如果您的系统比较关键或面对公众,故障可能会导致其他问题。我们将讨论常见的故障及其原因,以及检测和容忍其中一些故障的方法,特别是以软件为中心的视频墙系统。

前提

让我们假设一个视频墙系统由显示器(例如,可以是LCD平板、LED屏或投影机),计算机或硬件组成,驱动这些显示器和基础设施,以连接所有的硬件和软件来控制一切。这些组件中的任何一个都可能发生故障,但频率并一样。由于视频墙由许多显示器组成,显示故障的概率随着显示器数量的增加而增加,这就是为什么使用适合全天候操作的高质商用显示器的重要原因。因为它们比消费类显示器更可靠,更好支持。

当电脑或媒体播放器驱动每个显示器时,故障的可能性也随着计数的增长而增加。商用计算机中通常的故障是电源和移动部件,如风扇和硬盘驱动器。无风扇电脑和固态存储有助,但往往会增加成本或降低容量或时钟速度。

驱动许多显示器的控制器计算机或服务器风扇,电源和硬盘驱动器也会发生故障。冗余电源和固态存储可以起到作用,但也会大大增加成本。CPU风扇以及显卡上的风扇通常会随着时间的推移而发生故障,并且首先导致性能下降(由于当今基于温度的节流内置于大部分组件),进而发生故障。

基础设施趋于可靠

包括网络交换机或电缆在内的基础架构一旦稳定并正常工作就趋于可靠。许多基础设施是固态或被动的,所以很少发生故障。一些基础设施组件中的风扇仍然可能发生故障,但是它们往往是冗余的,因此在单次故障后不要将系统关闭。

最后,软件问题也可能影响视频墙系统。如果控制器软件崩溃或发生故障,系统将无法运行。然而,高质视频软件通常运行数月都没有问题。更有可能与软件相关的问题是操作系统更新。某些操作系统在工作时间之外自动安装更新并重新启动。

如果视频墙必须全天候运行,那就都是工作时间!如果驱动单个显示器的计算机重新启动,它看起来很糟,但不是灾难性的。但是,如果控制器计算机或驱动多个显示器的服务器重新启动,则可能严重妨碍操作。

哪些故障是至关重要的?

现在我们知道在视频墙系统的许多不同组件中可能会发生故障,哪些是最重要的,如何检测和保护它们?

如果单个显示器出现故障或者单个显示器的计算机出现故障,如前所述,这是一个不便之处,但可能不会消除整个系统的效用和有效性。只要故障不影响多于一个的监视器,该问题就包含在内,并且可以通过修复或更换单个组件来恢复。

更换显示器,特别是在全面服务的安装上,是一个快速的任务,因为您正在更换驱动单个显示器的计算机。因此,为了防止或者从这些故障中恢复,需要付出很大的努力可能不符合成本效益。

如果连接基础架构出现故障,可能会使整个视频墙系统崩溃。另一方面,如前所述,基础设施设备往往是可靠的。使大多数基础架构冗余也是非常有挑战性的。这样的基础设施是可靠的并且复制是昂贵的,所以可能不值得花费大量精力来使其更可靠。

如果控制器计算机或多显示服务器由于软件或硬件故障而失效,则可能会影响部分或全部视频墙系统。如果一个组件是一个单点故障并且容易出现故障,这显然值得解决。因此,某种故障恢复或冗余以减少这种故障的影响是有道理的。然而,是否具有成本效益取决于方法和实施。

另一类故障涉及视频墙系统的用户和客户。

某些故障可能是由用户或访客踢到或意外拉动电源或网络插头,或将咖啡洒在计算机上,甚至在跌倒或其他事故期间损坏显示器引起的。如果这些意外的故障发生在关键的设备上,它们可能会显著影响视频墙的操作。

有时客户关心潜在的故障;虽然不太可能出现,但是还是应该应对这种情况,让客户安心。例如,有客户关心我们的许可证密钥方法的故障,所以我们必须设计我们的容错方法来解决这个问题,即使故障是不太可能的。

为了减少最关键或最有可能发生的故障(甚至是最不相关的故障)的影响,可以在系统中设计容错。故障容错需要故障检测和故障恢复,这两者本身都不足够。我们讨论的其余部分将涉及基于软件的网络视频墙系统,也称为分布式可视化系统。尽管许多原理适用于基于多显示服务器的视频墙系统,但一些故障检测和测试技术必须是不同的。

我们必须清楚:容错并不是说可以避免故障。如其名称所述,故障是可以容忍的,目标是使容错尽可能是无缝且无关痛痒的。容错的基本思想是,如果关键组件(例如控制器计算机)出于任何原因发生故障或消失,则第二个控制器将继续使用尽可能少的明显过渡效果来操作墙壁(后续将细说)。

在分布式可视化系统中,显示器由网络计算机驱动,每个计算机都可能会出现故障,而不会破坏系统的其余部分。视频墙显然有一个空白屏幕,但所有其他屏幕都将继续工作并正常运行。因此,容错的焦点必须是控制器计算机,它协调正在显示的内容,但不执行实际驱动显示器的工作。

分布式计算机系统的基本设计原则是使得许多计算机完成工作,而不是由其完成;因此,随着系统的增长,随着更多的计算机的加入,它变得越来越强大。同样,在分布式可视化系统中,显示计算机执行所有工作:更多的显示计算机衍生出更强大的系统。

我们专注于控制器计算机的故障恢复,因为如果控制器计算机发生某些事情,则可能会导致系统死机。因为控制器计算机是商品PC,它可能会遭受硬件故障(通常,风扇发生故障或驱动器死机),或者如早先所述,粗心大意的访客可能踢到电源线或敲击电脑,如果它不是在机架上,或者最有可能的是,操作系统更新可能导致系统在应用更新时重新启动几分钟。

解决方案

控制器故障的最明显的解决方案是拥有第二个控制器。如前所述,驱动显示器的计算机正在进行绘制视频墙的工作,因此,协调绘图的控制器软件只能在普通PC上运行;因此,第二控制器PC的附加硬件费用是微不足道的。

添加第二个控制器可以让第二个用户主动控制系统,一种称为在分布式计算环的“主动-主动”的方法(与主动备用方法相反)中。因此,主动-主动系统具有并行操作并且可以同时控制视频墙的冗余主动控制器。

不适合视频墙的其他容错技术包括三重模块冗余(TMR)和投影系统,如航天飞机中使用的那些。它们解决了不同于视频墙容错解决方案的问题:它们处理稍稍翻转的宇宙射线,导致计算出错,从而破坏车辆的轨迹。我们的前提是,只要硬件正在工作,它就会生成正确的结果,但停止工作时,我们需要检测并恢复。

检测故障

检测驱动视频墙的网络计算机系统中的故障是一个挑战,因为计算机网络在繁忙时不可靠。例如,当缓冲区填充时,切换丢弃数据包,因此我们可以依赖于单个丢失数据包。网络堆栈(在Windows中发送和接收网络流量并实现通信协议的软件)通常容忍网络中断;因此,它们长时间不报告连接的故障。

我们必须开发技术来快速检测出故障,但不会被错误的检测所困扰。这取决于多方面的做法,具有多种监控通道和其他低级技术,以检测另一个控制器已经消失,并在需要时接管系统。在这样做的时候,我们必须定义主要的和次要控制器,虽然区分对于用户来说不是明显的。主次的确定在系统启动时选择程序的过程,因此控制器PC要么是主控制器,要么次级的,并且两者都不比其他控制器更强大。

测试

测试容错是一个重大的挑战,因为我们想确保我们测试的是可能影响客户端和他们关心的故障,而不仅仅是使故障容错机制看起来很好的任意故障。一些测试条件容易实现和复制:例如,拉取USB许可证密钥可以一遍又一遍地执行相同的结果。

退出控制器软件或重新启动计算机类似可靠,易于检测和恢复。这些产生了很好的明确的故障模式,因为所有的网络连接都被关闭,因此故障诊断是快速和容易的,确定实际发生的更具挑战性,但至少控制器知道另一个不再是连接的。

从电脑上拉电源插头或使其屏幕蓝屏(我们编写一个测试程序来强制)是更具挑战性的测试。这些操作有些危险,因为它们可能会损坏PC操作系统或驱动器内容,因此执行它们通常可能会导致耗时的驱动成像。它们还导致难以检测的故障:计算机停止通信,但连接保持开放好几秒钟。这种故障对许多基于定时器的故障检测算法是很好的测试。

网络故障测试

我们执行的另一种故障测试是网络故障。网络交换机是非常可靠的,所以我们不需要测试这种故障,但网络线缆拉设和间歇连接可能发生,所以我们测试这些。网络拉线很像拉电源线,因为计算机停止通信,但网络连接不会停机一段时间。

间歇性网络连接或电缆拉动,然后快速插入它们是更加险峻的问题,很难诊断。一个非常短的电缆拔插/重新插入是大多数网络可以忍受的东西,没有中断,所以我们需要确保我们的方法可以容忍它,几乎不会发生中断。

拔插和重新插入之间的间隔更长(半秒到几秒)是检测和恢复最棘手的故障之一,因为网络显然被中断,但并不是所有连接都被破坏。在这种情况下,我们选择故障切换到没有网络中断的其他控制器。

这需要大量协调,因为具有网络故障的控制器需要检测到它被中断,当它被重新连接时,它不会尝试断言其旧状态,而是与其他控制器协商。没有故障的控制器必须确定它不再连接到另一个控制器,但它仍然连接到系统的其余部分。如果它已经是主控制器,那么它将成为主要的控制器,并接管系统的管理。

行为

那么按照所描述的容错系统,如果控制器发生故障,客户可以期待什么样的行为呢?如果故障的控制器是次级,那么不会有任何效果,除了故障的控制器不能再控制视频墙。如果是主要的,因为旧的次级控制器成为主要的并且接管系统,则将会有一个短暂的转换期。

显示器上,包括大部分流媒体源内容在内的大部分内容将保持可见,并且不间断地继续更新。例外是来自LAN外部的面向连接的内容,即通过安全TCP连接进入系统的源。它们可能直接连接到故障的控制器,需要几秒钟的时间才能切换到新的主控制器,所以他们将在4-5秒内恢复更新。

这意味着NOC或其他控制室中的关键视频墙将保持运行状态,即使其中一个系统控制器发生故障,也只会受到轻微的中断。在典型的数字标牌场景中,一个系统控制器的故障不会影响显示的内容,所以没有中断。

What Do We Not Tolerate?我们不能容忍什么?

什么样的故障不能容忍?前面提到的网络交换机故障是最大的例子,但交换机非常可靠,我们的工程师已经尝试了将故障切换到第二个交换机的方法,尽管它们需要特定的硬件和配置。我们显然无法再做更多关于显示器的故障测试了。

我们也不会对单个计算机驱动显示的故障做任何事情,因为与显示器故障一样,这并不影响整个系统的功能,它只影响一个显示器。由于显示电脑通常是商用电脑,因此可以快速,容易地进行维修或更换。让新显示电脑上线只需几分钟。

我们调查和设计了我们的容错方法,以从最常见的故障中恢复,这些故障可能使虚拟机系统脱机,包括常见的硬件故障,错误和事故。在关键时刻可以保持视频墙的正常运行,但不要求复制所有的设备,也不需要巨大的额外成本。通过快速的故障检测和快速恢复增加容错功能,可让视频墙永和更加安心。

 

 


更多相关:

数字标牌显示器
编辑推荐
图片新闻
  • 科鑫光电户外民用led全息屏首发面市!预定进行中......
  • 利亚德ESV系列 | 共阴节能,全新定义显示屏!
  • 2019视听行业万里行——走进武汉企业
  • AV生态 智慧生活—2019万里行武汉站
  • 【新品速递】触沃人脸识别设备全新上市
新闻搜索

  • 2009年资讯
  • 2010年资讯
  • 2011年资讯
  • 2012年资讯
  • 2013年资讯
  • 2014年资讯
  • 2015年资讯
  • 2016年资讯
  • 2017年资讯
  • 2018年资讯
数字标牌显示器
推荐品牌
    热点关注
    数字标牌显示器
    数字标牌显示器
    数字标牌显示器
    数字标牌显示器
    户外广告机 | 落地式广告机 | 高清广告机 | 分屏广告机 | 蓝牙广告机 | 网络广告机 | 数字标牌播放器 | 广告机方案 | 多媒体信息发布系统 | 触控一体机 | 高清机顶盒
    镜面广告机 | 多媒体广告机 | 触摸广告机 | 液晶广告机 | 车载广告机 | 互动式广告载体 | 楼宇广告机 | 流媒体实时发布系统 | 广告机外壳 | 户外大屏幕 | 广告机报价
    数字标牌软件 | 电子看板  | 商业显示  | 嵌入式主板 | 触控一体机 | 数字标牌显示器 | 嵌入式流媒体服务器 | 立式广告机 | 3D广告机 |
    设为首页网站建设欢迎投稿数字标牌杂志资讯中心本站动态关于数字标牌网网站RSS网站地图友情链接
    热点:数字标牌数字告示多媒体信息发布系统广告机户外广告机液晶广告机网络广告机互动广告机触摸屏数字标牌网
    本站实名:数字标牌网 国际域名:www.DS-360.com 版权所有© 2009-2019 深圳市中投传媒有限公司  
    粤ICP备05041759号 在线客服: 点击这里给我发消息 点击这里给我发消息 视听学院-商家论坛群: 视听学院-商家论坛
    电话:0755-26526633(十二线) 传真:0755-86024577 邮箱:ds-360@3v.cn
    打开微信扫一扫,成为数字标牌网微信好友
    分享