气象自动站监控软件“死机”原因剖析及应对策略 罗玲周红宁夏回族自治区气象信息中心 摘要气象自动站监控系统具有很强的实时性特点,因此监控软件必须时刻处于畅通无阻的状态
4006-054-001 立即咨询发布时间:2022-10-05 21:44 热度:
气象自动站监控软件“死机”原因剖析及应对策略
罗玲周红宁夏回族自治区气象信息中心
摘要气象自动站监控系统具有很强的实时性特点,因此监控软件必须时刻处于畅通无阻的状态。然而在日常工作中,许多人都曾被这样一个问题所困扰:自动站监控软件在某个正点时刻“死机”,“死机”的结果是VP报不能及时上传、天气电报延迟,甚至正点数据采集受到影响。本文在分析与实践的基础上对这一问题进行了深入探讨,最终揭示了这一问题产生的原因,并且给出了切实可行的解决办法。
关键词:监控软件死机分析对策
自动站监控系统的实时性特点决定了监控软件必须时刻处于畅通无阻的状态。然而在日常工作中,我们每个人却都遇到过这样一个问题:自动站监控软件在某个正点时刻“死机“,由于”死机“直接导致本次的VP报不能及时上传、本次的天气电报延迟,甚至正点数据采集受到影响等一系列问题的发生。每当计算机出现“死机”时,尤其是在天气报发报时次出现这种情况,作为值班员都免不了手忙脚乱,搞不好就会出错。那么,这种情况到底是如何发生的?如何来避免这一情况的发生?我针对这一问题经过长时间的观察与分析,在排除了计算机硬件故障、操作系统故障、计算机病毒、软件自身的Bug等因素后,最终发现,问题的症结主要集中在如下几个方面:
一:瑞星在线升级的设置问题。2007年的1月份,我站隔三差五出现监控软件正点死机问题,有时重启系统过后五、六个小时就又发生死机现象,发生频率之高是前所未有的。经过认真分析,采取了一系列办法。最终发现,导致这一现象发生的直接原因是瑞星在线升级的设置问题,因为那时我站刚刚安装了瑞星软件企业版,而瑞星软件是常驻内存的,而且在线升级是在后台以静默方式进行的,升级时人们往往感觉不到,而瑞星的病毒代码库是非常庞大的,如果升级时刻恰好和我们的正点时刻重合,会给原本并不富裕的内存造成短时间的紧缺,形成“拥塞”现象,进而引起监控软件死机。后来的实验结果正好验证了这一推论,当我把瑞星在线升级的设置时间由每时正点改为正点后二十分钟、间隔时间由每时改为每天一次后,频繁死机的问题便迎刃而解了。
二:正点时刻驻留内存的软件太多。做为业务用计算机,软件驻留内存的途径可能是下面几种情况:
1、系统维护软件:许多系统维护工具如WINDOWS优化大师、WINDOWS清理助手、360安全卫士等对维护系统安全、保障系统正常运行具有很好的作用,但是这些软件都有个特点:使用完毕后,既使关闭了主菜单,它们也会驻留于内存中,有的甚至通过开机自动加载启动。
2、常用的应用软件用完后没有及时关闭,如WORD、EXCEL、等。
3、打开的内联网页面。
4、打开的系统窗口。
5、业务软件自带的正点报时程序。
当内存中驻留的软件过多,又恰逢正点时刻时,就会出现和我们的业务软件“争夺”内存的情况,加剧内存紧张的矛盾。
三:启动地面测报软件的时间如何掌握非常重要。自动站监控软件、地面测报软件、通信接口软件是整个业务软件的三大块。其中尤以监控软件和地面测报软件庞大,这里所说的庞大是指其中的数据库庞大,因为正点时刻,做为监控软件来讲要打开分钟数据库文件,接收来自采集器的所有分钟数据;做为地面测报软件来讲,要打开台站参数库文件、编报参数库文件、历史数据库文件、全月十五个要素文件,尤其临近月未时,这些数据库之中存放的数据是甚为庞大的。假如在某个正点时刻,地面测报软件启动时间过早,也即:没等监控软件全部运行完毕就启动地面测报软件,势必造成内存严重不足的情况。实践证明,只要掌握好地面测报软件的启动时间,大多数的死机问题都是可以避免的。
四:监控软件观测次数太多。这是因为监控软件在频繁的打