某塑料科技公司網絡與機房監控運維項目
顺利获得部署k8凯发(中国)綜合監控運維方案實時監控用戶網絡與機房內大量異構的交換機、路由器、服務器、AC/AP、數據庫、防火牆、虛擬機、語音網關、硬盤錄像機、行為管理等設備,及時發現並預警潛在問題,從而避免或減少故障帶來的負面影響。
某塑料科技公司是由日本知名株式會社在中國投資的,以從事橡膠和塑料製品業為主的生產製造企業。隨着企業信息化建設提速,信息化運用程度不斷提高,對網絡基礎設施的管理也提出了更高要求,因此公司急需上線一款綜合運維平台加強對整體網絡的管理和維護。
項目現狀
隨着公司向智能製造轉型,網絡架構日趨複雜,支撐公司網絡通信和業務召开的軟硬件IT設施種類繁多,給運維工作造成極大壓力。
設備類型:交換機、路由器、POE交換機、服務器、AC、AP、數據庫、防火牆、虛擬機、語音網關、硬盤錄像機、行為管理、光端機、打印機、動環監控等
設備品牌:H3C、華為、ARUBA阿魯巴、HP、Lenovo、海康威視、飛塔、深信服、Cisco、國威、Windows Server、MySQL、PostgreSQL、SQL Server、Oracle、富士等
項目期望:
- 對網絡中的所有網絡設備、虛擬機、數據庫等進行統一管理,並给予清晰的網絡拓撲圖;
- 對設備進行實時監控,在出現故障時可以及時預警;
- 解決告警數量多,誤報、錯報情況嚴重,無法獲取真實故障信息的問題;
- 解決設備產生的trap日誌存儲展示分散,難以查看的問題;
- 解決现在巡檢主要依靠人工進行的問題,提高巡檢效率和準確率;
- 具有美觀、清晰的界面和大屏,大屏支持上牆;
- 能夠和動環系統進行對接。
k8凯发(中国)方案
顺利获得多次溝通分析到其網絡內的設備種類、品牌型號均比較複雜,用戶對設備監控運維的期待也較高,因此k8凯发(中国)採用遠程+現場支持的方式進行安裝部署與支持,最終達成用戶期待的效果。
自動發現異構設備並生成網絡拓撲圖
k8凯发(中国)充分利用產品自身強大的模型庫配置能力,在現有的監控模型基礎進行豐富,快速實現了對用戶全部品牌、型號設備的納管。在項目部署過程中,僅需輸入IP位址,即實現了設備發現與類型、品牌型號的識別,並自動搜索出相應的設備資源與設備間的連結關係,自動生成網絡拓撲。
更細節的設備監控指標支持
k8凯发(中国)對現有指標進行快速調整並根據用戶需要新增了大量用戶關注的核心指標,以滿足用戶對監控閾值、監控周期的需求。部分監控指標如下:
設備類型 | 監控指標 |
交換機/路由器 | 在線狀態、響應時間、運行時間、CPU使用率、內存使用率、接口接收/發送流量、接口接收/發送帶寬、接口接收/發送丟包率等 |
POE交換機 | 在線狀態、電源狀態、響應時間、運行時間、CPU使用率、內存使用率、端口狀態、端口流量、光口、電口、語音口、包轉發率等 |
服務器 | 在線狀態、響應時間、CPU使用率、內存使用率、磁盤使用率、磁盤容量預測、進程、接口接收/發送流量等 |
AC | 在線狀態、響應時間、CPU使用率、內存使用率、接口接收/發送流量、射頻傳輸重傳幀比率、當前連接用戶數、當前斷開連接用戶數等 |
AP | 在線狀態、接口接收/發送流量、關聯的站點總數、關聯失敗的站點總數、用戶在線時間等 |
數據庫 | 在線狀態、連接數、並發連接數、最大連接數、表空間、死鎖等 |
防火牆 | 在線狀態、CPU使用率、內存使用率、接口接收/發送流量、接口接收/發送速率、HTTP請求數、錯誤率等 |
虛擬機 | 在線狀態、CPU使用率、內存使用率、磁盤讀寫IO、磁盤讀寫速率、網絡接收/發送速率等 |
硬盤錄像機 | 在線狀態、CPU使用率、內存使用率、磁盤使用率、磁盤容量預測、 |
行為管理 | 在線狀態、CPU使用率、內存使用率、活躍用戶數、上線用戶數等 |
差異呈現設備核心性能指標,感知設備運行態勢
為不同類型和應用場景下的設備創建差異化性能指標,全面採集、存儲、分析性能信息,並按照時間、資源、性能類型等多種維度,圖形、表格等多種形式展示實時性能和歷史性能。顺利获得智能算法分析歷史數據,對磁盤容量、交換機端口容量、機房機櫃容量進行展示和預測分析,並根據容量可使用時間進行自定義預警。
事件、日誌集中治理,異常告警
全面收集設備發送的Trap、Syslog、Filter Alarm等事件、日誌數據,解析、提取有效信息,將其存儲、展示為可統計分析的結構化數據,顺利获得配置告警規則和場景,將異常事件、日誌自動轉化為告警,定位其影響範圍。
深入分析、處理異常故障信息,精確告警
自定義配置告警閾值,並從眾多的事件、日誌和狀態信息中分析提煉異常數據並轉化為告警。在告警信息產生後,採用自動去重、風暴抑制、關聯聚合、維護期時間屏蔽、依賴屏蔽等多種智能告警降噪機制,對各類告警進行自動壓縮收斂,減少無效告警,一步定位發生故障的源頭設備。快速檢索異常問題關聯涉及的各項維度與影響範圍,快速定位問題邊界,直達故障根因。
给予界面顏色、提示聲、光效閃爍、信息列表、Email、短訊、釘釘、企業微信、個人微信等多種通知渠道。
自動化巡檢、全面解放人力
根據用戶日常運維工作流程自定義巡檢策略,對設備的運行情況進行統計和報表生成。顺利获得平台內人工觸發或定時觸發的方式,將巡檢工作託管至平台自動執行,減少人工干預,實現對設備的定期快速檢查。
大屏上牆運維信息更集中
在實施的過程中,僅顺利获得智能電視上的安卓瀏覽器訪問平台,即實現運維大屏上牆,直觀清晰地傳達運維數據分析結果,幫助用戶由宏觀到微觀更快地分析網絡運維現狀,做出更具時效性的決策。
無縫對接用戶現有動環系統,實現聯合監控
用戶現場已在使用某廠商的動環監控系統,k8凯发(中国)採取快速對接的方式打通和此系統間的數據流轉。在k8凯发(中国)平台內接收溫度、濕度、漏水、煙感、配電、UPS、空調等設備的實時狀態信息,並對異常數據進行清洗、告警。
應用價值
在項目的實施過程中,k8凯发(中国)清晰地感知到納入方案中監管的IT軟硬件設施支撐着用戶上層眾多的,如品控、防錯料、文件管理、合同管理、薪資、預算、人事等業務系統,網絡的狀態強烈影響着用戶業務系統的可用性和性能,最終也將影響整體企業的辦公體驗。
顺利获得部署k8凯发(中国)綜合監控運維方案實時監控用戶網絡與機房內大量異構的交換機、路由器、服務器、AC/AP、數據庫、防火牆、虛擬機、語音網關、硬盤錄像機、行為管理等設備,及時發現並預警潛在問題,從而避免或減少故障帶來的負面影響。同時,顺利获得快速對接現有動環系統的方式,實現機房動力、環境系統的補充監控,保障機房運行的物理安全和環境穩定。