國內加油站點從建立初期發(fā)展到目前的好幾萬家,無論從規(guī)模、設備還是服務上看,都發(fā)生了很大的變化。這些變化對管理模式和管理手段不斷提出新的要求。而某大型石油公司的加油站維護部門作為加油站的管理主體,一直努力因勢利導、審時度勢、與時俱進,充分挖掘、分析各方需求,逐步建立起一套加油站綜合管理系統(tǒng),并不斷根據實際情況進行優(yōu)化和完善。
加油站監(jiān)控作為加油站綜合管理的重要組成部分,其監(jiān)控的全面性、準確性和告警及時性不僅對加油站業(yè)務會產生直接影響,對該集團形象也會產生重大的影響。所以加油站部門從這一管理實踐需求出發(fā),通過試用、比較國內外多款網管產品,發(fā)現美信CreCloud云網管在監(jiān)控規(guī)模、產品相應速度和產品穩(wěn)定性及性能等方面非常符合加油站監(jiān)控需求。
加油站維護部門通過美信CreCloud云網管產品,引入云計算技術,實現了對加油站的大規(guī)模分布式監(jiān)控、秒級輪詢、告警精確管理,并且為未來的發(fā)展預留了空間。
大規(guī)模分布式監(jiān)控
加油站的一個顯著特點就是量大、分布廣,所以我們在產品選擇的考慮上,首先就是要求產品能夠實現大規(guī)模分布式監(jiān)控。我們試用了幾款產品,只有MXsoft的CreCloud云網管完全符合我們的預期。在測試環(huán)境下,CreCloud云網管順利地監(jiān)測了8千個點,而其他產品監(jiān)測到3千個點服務器性能就達到極限。
這時候已經臨近2010年春節(jié),加油站維護部門果斷做出決策,將通過測試的CreCloud 云網管部署到真實環(huán)境中,以幫助值班人員完成春節(jié)期間的監(jiān)控管理。春節(jié)期間,加油站系統(tǒng)發(fā)生了2次重大故障,值班人員在CreCloud云網管的協(xié)助下,第一次做到有手段地主動發(fā)現、了解故障的分布范圍、持續(xù)時間,并及時解決了故障,保障了春節(jié)期間供油的正常運行。
能夠主動發(fā)現并解決問題,大家都很興奮。但我們仍面臨著更大的難題:8千個點可以完全監(jiān)測了,但如果上升到2萬個點、6萬個點、10萬個點呢?單臺服務器的性能不可能無限的提升,如何能夠應付這不斷增加的加油站呢?我們是否可以找出一種方案,其監(jiān)控能力能夠根據被監(jiān)控對象規(guī)模的大小而進行調節(jié)?我們就這些想法與MXsoft進行了一次討論,沒想到居然與他們設計CreCloud云網管的思路不謀而合。CreCloud云網管的設計原理可以簡單概括為:通過虛擬技術,將多臺普通監(jiān)控服務器虛擬為一臺計算能力強、運行穩(wěn)定的大型監(jiān)控服務器,幫助用戶在低成本的情況下,實現對大規(guī)模被監(jiān)控對象的監(jiān)控;同時可根據被監(jiān)控對象的變化,動態(tài)的增減監(jiān)控服務器(動態(tài)擴、減容)。我們需要一款擴展性好的產品,MXsoft產品需要真實用戶環(huán)境的驗證,這種情況下,雙發(fā)一拍即合,達成戰(zhàn)略合作伙伴關系。
秒級輪詢
網絡時代,信息化成為每家企業(yè)、單位提供服務、獲取信息的必要手段,不可避免,這些企業(yè)、單位必須同時面臨伴隨信息化而來的時效性要求和不間斷運行要求,也不例外。如果客戶在加油站用卡消費,加油站系統(tǒng)經常不能使用或者出現錯誤,定會帶來客戶的抱怨和投訴,影響客戶對的信任。要避免這種情況發(fā)生,我們就必須做到不出故障或者在客戶之前先發(fā)現并解決故障,那么監(jiān)控和反饋時效就變得異常重要。
試用CreCloud云網管時,我們分別測試了3個方案:單臺服務器10分鐘輪詢、5分鐘輪詢和2分鐘輪詢。
這個性能表現比國內其他廠商的同類產品高出3-4倍,創(chuàng)造了國內該領域的最優(yōu)異記錄。升級到CreCloud云網管后,輪詢的速度進一步提升,達到秒級,對于關鍵的設備和應用最快5秒輪詢一次。即監(jiān)測系統(tǒng)只需要5秒就可以把被監(jiān)測對象都采集數據分析一遍,如果發(fā)現異常或故障,立即通過顏色、聲音、郵件和手機短信將告警發(fā)送到值班人員,有效地保障了業(yè)務系統(tǒng)的穩(wěn)定運行。
告警精確管理
加油站維護部門對監(jiān)控告警的需求非常明確,要求:
1. 告警按照百分比設置。某地的某1-2個加油站出現故障,由當地的IT運維管理人員負責管理和解決。但如果某個地方的20%以上的加油站出現故障,就非常嚴重,很可能是鏈路出現問題,這才是加油站維護部門關心的重點,所以我們需要監(jiān)控系統(tǒng)按照故障發(fā)生的百分比來告警;
2. 告警能夠精確指出故障分布。如果知道某地有20%加油站發(fā)生故障,但不知道是哪20%,不知道具體分布,那么這種告警是徒勞和無效的,不能幫助我們主動發(fā)現和解決問題,所以精確指出故障分布至關重要。
我們將需求梳理后交給MXsoft,指派專人配合MXsoft開發(fā),最終在CreCloud云網管上實現了我們所有的需求。
通過美信CreCloud云網管,我們大幅提升了加油站監(jiān)控能力,同時大大地延伸了監(jiān)控系統(tǒng)擴展性,為未來的發(fā)展預留了空間。另外, CreCloud云網管提供的各種借口,幫助我們將監(jiān)控系統(tǒng)與ITIL管理系統(tǒng)和員工身份認證系統(tǒng)等無縫連接起來,真正實現了加油站維護部門辦公的信息化和自動化,極大地提升了我們的工作效率。
相關推薦:推薦:2010年計算機軟件水平考試必備完美攻略北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內蒙古 |