時間:2020年05月23日 分類:電子論文 次數:
摘要:隨著醫院信息技術的不斷提高和完善,醫院信息系統已經成為業務支撐的關鍵,醫院各式業務系統、業務流對計算機網絡的依賴也越來越大。在當前社會和媒體對民生服務的高度關注下,醫院信息系統的故障中斷無疑就是一場災難,除了對經濟效益造成影響外,還會帶來各種負面的社會影響。因此,近年醫院對業務連續性管理的要求越來越高,隨之而來對計算機網絡的最大允許中斷時間MTD越來越小,網絡運維的壓力和要求也大幅增加。本文以提高醫院網絡運維管理效率為出發點,通過對日常網絡運維工作的分析總結,歸納影響網絡運維工作效率的因素,并對部分管理誤區進行探析,最后探討相應的改善措施,為運維工作相關讀者提供借鑒參考。
關鍵詞:網絡運維;提高效率;恢復時間
醫院計算機網絡作為承載業務和信息系統的基礎設施,是保障業務連續性必不可少的一環。醫院網絡的運維管理工作應站在保障業務連續性的角度出發,緊貼安全標準和規范著力控制三個問題:減少故障出現率、縮短故障恢復時間以及消除安全隱患。然而在實際工作中常面臨故障恢復時間長、故障多等問題的困擾。面對網絡故障,從接獲報障到業務恢復,整個處理過程的時間遠大于期望值,故障恢復速度很難以讓人接受。如何提高網絡運維工作效率是醫院信息中心當下需要解決的問題之一。
信息安全論文投稿刊物:《信息網絡安全》論文發表官方網站 是公安部主管,公安部第三研究所主辦的綜合性專業月刊,是公安部公共信息網絡安全監察局及其下屬各網絡安全監察部門對外宣傳的窗口。
1網絡運維效率制約因素
對網絡故障的恢復能力和恢復時間可有效地反映一個運維團隊的工作效率,任何對這兩個方面造成負面影響的都是制約運維工作的因素。
1.1運維工作缺乏指引
網絡運維工作流程指引往往容易被忽略。對故障響應處理,從接報到定位,再到資源調配和故障消除,全憑響應的運維工程師依照經驗進行處理。工程師對運維工作的主觀影響被放大。在缺乏指引的情況下,團隊協作和前期準備更無從談起。如果團隊處于新舊交替狀態,那么帶來的問題則更為突出。
1.2綜合布線系統缺乏管理
其一,走線混亂,線路交錯,標示丟失。每當出現設備故障,除了更換設備之余,臨時性的理線、理標工作占用了大量時間。其二,設備間環境不理想、地點設置不合理。如積塵、無通風或溫度調節設施、置于公共區域、與其他儲物間共用、場地不能滿足運維的基本要求。
1.3缺乏文檔管理
缺乏運維工作所必需的線路圖紙、標示和設備配置檔案等文件的管理。面對線路調整,無檔可依;面對線路故障,無圖可循,若然遇到相關工作只能重新尋線。當設備配置發生變更時,配置變更也無從說起。
2網絡運維管理誤區
2.1網絡運維的標準
標準是為了在一定范圍內獲得最佳秩序,獲得認可的規范性文件[1]。網絡運維工作是一項參照標準進行開展的動態活動,實施標準的一個過程,具有持續性。運維工作除了要符合標準外,更重要的是能把標準持續有效地保持下去。為應付檢查而抱著某標準開展運維工作是不可取的。
2.2可觀性與可維護性
可觀性,可從一個角度很好地反映運維管理工作的細致度,但不能盲目追求。網絡運維工作不應脫離了可維護性原則[2]。例如,為完成線路整理工作,在機柜外加裝屏蔽間隔。這樣做極具觀賞性,但卻忽視了運維的可維護性,增加了日后維護的難度。可觀性只是可維護性的附屬產物,當具備高可維護性的情況下,可觀性隨之實現。
2.3關于運維外包與管理工作
運維工作外包比較常見,但是并不能代替醫院在這方面的管理工作。運維的責任主體就是醫院信息中心,對于管理工作并不存在外包之說。運維公司作為經營個體,受自身利益鏈約束,有著自己的運營目標,在運維工作上追求的是利益均衡狀態,它更著重于眼前的工作任務,而對于管理思路、前瞻性建設等方面是貧乏的。
3改善措施
3.1構建運維管理體系
運維工作需要有規范的作業指引和流程作為支撐,使運維工作得以量化和標準化,降低不確定因素對運維工作的影響,并根據實際情況細化每個步驟。其中制定信息反饋機制、故障響應流尤為重要。制定信息的反饋機制,規范上下級信息傳遞,使運維信息能得到有效傳達[3]。制定清晰的流程指引,對故障響應流規范化,減少故障恢復時間,降低運維人員因不規范操作帶來的風險。
文檔化是運維管理體系的一個重要組成部分,是對運維工作經驗、知識的沉淀。制度、流程、規范、操作指南、日志、記錄、檢查表等都是文檔化的輸出物[4]。因此我們需要有文檔配置管理方案,明確配置管理工作的要求,如存于何處、更新那些檔案和編目標示規則等等。這些文檔能降低日后的維護工作難度,直接影響故障恢復時間。
3.2培養運維團隊協作能力
網絡運維是一個團隊性的工作,團隊中每個角色要落實好具體分工且明確職責。在故障處理時尤其能體現團隊協作的重要性。有合理的分工,整體工作聯動配合,故障恢復時間自然可以縮短。
3.3工作應該做在前期的準備上
(1)理線、理標是一項不可忽視的工作,應圍繞著可維護性和安全性進行開展,確保各子系統的線路整齊、可管理,標示完整、正確。網絡故障恢復的速度很大程度取決于這項工作的完成質量。(2)巡檢工作應圍繞著消除安全隱患開展,要制定好巡檢工作的計劃和明確目標,并付諸落實。檢查設備運行狀態、打掃環境衛生、理線、理標、檔案的更新記錄管理都應該囊括在內。(3)做好常備物資的管理工作,制定好常備物資的清單與數量,做到能及時配備與補充,減少因調配資源而花費額外的時間。
3.4解決環境問題
設備間環境是物理與網絡通信安全的一環,是保護業務穩定、可靠,確保醫院信息系統不會因自然環境、人為等因素導致業務中斷的關鍵。對于設備間選址應首先將安全性放在首位,應根據相關的安全要求對場地的各方面進行詳細考慮[5]。部署在高風險場所的設備間很難得到有效安全保障的。其次,空間換取時間的定律在網絡運維工作上也適用。假如設備間不具備調整線路的空間,那么故障恢復時間則很難得到改善。
3.5做好應急演練
應急演練不是跑龍套,也不是做給別人看的工作。應急演練是一種有效檢驗運維團隊協作能力、故障處理能力的手段。通過定期舉行應急演練,識別風險點、查找管理漏洞、檢驗工作效率,制定相應整改計劃,落實改進。
4總結
安全性、穩定性、可維護性、實用性是網絡運維工作的基本原則,網絡運維工作應遵循著這些原則進行開展。通過構建管理體系,規范業務流,培養團隊協作能力,細化前期工作,并配合運維工作的風控分析,使整個網絡運維工作有質的提升,從而降低故障恢復所需的時間。然而控制故障恢復時間始終帶有被動色彩,要使醫院網絡穩定可靠,更重要的是降低故障出現率。任何設備都有生命周期,超期服役的網絡設備故障率必然大增。因此對設備的生命周期進行評估分析,結合運維成本等因素的考慮,制定一個可落地的迭代機制,將計劃外的維護工作改為計劃內進行,避免災難事件的發生。
參考文獻:
[1]GB/T20000.1-2014.標準化工作指南第1部分:標準化和相關活動的通用詞匯[S].
[2]曾松鳴.綜合布線系統的可觀性與可維性[J].智能建筑與城市信息,2006(5):76-78.
[3]萬洪強.信息網絡運維管理效率提高方法探討[J].網絡安全技術與應用,2017(10):6-7.
[4]賴毅鋒.關于醫院信息安全管理工作的探討[J].網絡安全技術與應用,2019(10):124-125.
[5]歐陽東,許靜.數據中心機房設計的總體要求[J].智能建筑電氣技術,2007,1(1):13-15.