利用云智慧監(jiān)控寶讓IT部門成為企業(yè)價值中心

如今的中國企業(yè)正處在傳統(tǒng)生產(chǎn)、經(jīng)營模式向互聯(lián)網(wǎng)+轉(zhuǎn)型的風口浪尖,企業(yè)業(yè)務對IT和互聯(lián)網(wǎng)的依賴越來越重,IT部門在企業(yè)的價值也是水漲船高。而IT部門要為企業(yè)創(chuàng)造更大的價值,同樣需要改變過去被動響應的工作模式,主動走在業(yè)務的前面,來引導業(yè)務需求,驅(qū)動業(yè)務改變。

云智慧監(jiān)控寶是一款面向運維的全棧實時監(jiān)控工具,在運維圈素有IT監(jiān)控神器的美譽,那么監(jiān)控寶是如何幫助一家電商企業(yè)實現(xiàn)業(yè)務數(shù)據(jù)監(jiān)控,并讓IT部門走在業(yè)務部門之前,成為企業(yè)價值中心的呢?請看下面來自監(jiān)控寶忠實用戶的分享。

為什么要做業(yè)務數(shù)據(jù)監(jiān)控

四川文軒在線是一家做多渠道出版物(圖書、音像)銷售的電子商務公司,公司有自建的官網(wǎng)、移動官網(wǎng)、移動APP,也依托天貓、京東、當當、亞馬遜、微信等平臺開設自營旗艦店,另外還跟各大圖書電商及各地新華書店開展各種供貨、代發(fā)等業(yè)務。

由于公司業(yè)務線繁多,過去往往是業(yè)務部門通過月底報表發(fā)現(xiàn)業(yè)務出現(xiàn)明顯滑坡后,才知道相關平臺的IT系統(tǒng)出現(xiàn)故障,這時可能已經(jīng)對企業(yè)經(jīng)營造成不小的影響。為了保障業(yè)務系統(tǒng)的高效運行,公司要求對所有業(yè)務平臺納入監(jiān)控,需要監(jiān)控的業(yè)務指標非常多,靠人工去盯并不現(xiàn)實。因此,技術(shù)部門在監(jiān)控好IT系統(tǒng)各環(huán)節(jié)運行情況的同時,還需要提供自動化工具給業(yè)務部門實現(xiàn)業(yè)務指標都系統(tǒng)自動監(jiān)控。

現(xiàn)在網(wǎng)上有各種開源的、收費的、本地部署的、云上的監(jiān)控工具,大多都是針對純技術(shù)部門提供系統(tǒng)功能、性能及運行環(huán)境的監(jiān)控,基本沒有看到針對業(yè)務數(shù)據(jù)的監(jiān)控工具,估計大家都認為業(yè)務數(shù)據(jù)的監(jiān)控應該由報表來提供吧,據(jù)我了解的一些報表,要么沒有,要么做的太粗糙不適合大規(guī)模使用。

業(yè)務數(shù)據(jù)監(jiān)控相比系統(tǒng)監(jiān)控的特點在于業(yè)務數(shù)據(jù)監(jiān)控各公司、各崗位差異性很大,定制化要求很高,并且隨著公司業(yè)務地發(fā)展可能隨時需要調(diào)整。通過精挑細選,四川文軒在線于2013年開始使用云智慧監(jiān)控寶,在監(jiān)控寶獨家功能--自定義監(jiān)控的基礎上,靈活構(gòu)建起適應公司業(yè)務發(fā)展需要的監(jiān)控體系。

公司中哪些角色需要監(jiān)控業(yè)務數(shù)據(jù)?

首先公司的總經(jīng)理、部門經(jīng)理、業(yè)務主管肯定不會隨時去關注具體的業(yè)務指標,他們也沒時間去關注那么多,他們更適合使用報表查詢分析結(jié)果來支撐他們制定業(yè)務策略。

而一線的業(yè)務運營人員呢?他們就需要時刻關注各項業(yè)務指標了,上級已經(jīng)制定好各種業(yè)務操作辦法,他們根據(jù)各項指標照著做。下面這張圖簡單說了下我們網(wǎng)店運營人員需要經(jīng)常監(jiān)控的幾個指標:

(圖一)

圖上只簡單列了幾個常用的指標,網(wǎng)店運營人員當然還需要關注網(wǎng)店流量、用戶特征、商品轉(zhuǎn)換率、支付率、上架品種數(shù)等等指標,如果我們系統(tǒng)能夠獲取相關數(shù)據(jù)也是可以做成自動監(jiān)控的。

圖中列了3個指標,這些數(shù)據(jù)在報表中都能查到,但靠人查報表來監(jiān)控實在太落后了,下班、請假、放假了怎么辦?就應該當指標出現(xiàn)異常時監(jiān)控系統(tǒng)及時給與相關人員報警通知才對。具體怎樣來設計這些指標的告警呢?下面我們大致介紹下銷售相關的三個指標監(jiān)控:

1、銷售額:

每個公司肯定都有報表可以查到每日、每周、每月等等時間維度的銷售額的,對于網(wǎng)店運營人員可能需要關注的更細,往往需要關注每小時的銷售情況。當某個時點銷售額急劇下降,可能意味著系統(tǒng)或者業(yè)務規(guī)則出現(xiàn)問題了,需要馬上召集相關環(huán)節(jié)一起排查,盡快恢復,否則銷售就丟失了。下面是我們關于某網(wǎng)店銷售額的監(jiān)控截圖(出于公司信息保密原則,屏蔽了一些信息,請見諒):

(圖二)

圖二中有三條線:

當前小時的銷售額 : 例如當前是9:08,則獲取8:08~9:08的銷售額

前一個時點銷售額 : 例如當前是9:08,則獲取7:08~8:08的銷售額

昨天同時段銷售額 :例如當前是9:08,則獲取前一天8:08~9:08的銷售額

我們可以看到,每天時間段不同,銷售額會有很大差異,貌似很難針對當前小時銷售額來設置一個閥值,所以我們用跟前一小時環(huán)比及跟昨天同時段同比來設置告警閥值,如下圖:

(圖三)

圖三中分別是同比和環(huán)比差額。最終監(jiān)控告警策略為:環(huán)比差額、同比差額低于一定閥值則報警,那么凌晨2點左右可能會有告警通知,但那時候業(yè)務也完全不用去管了,正常銷售高峰期應該差額都不大的。

通過監(jiān)控寶的自定義監(jiān)控能夠輕松實現(xiàn)銷售額監(jiān)控告警,當然監(jiān)控寶暫時不支持自定義報警時段設置,否則還可以針對不同時間段,針對銷售額絕對值設置不同告警閥值。例如凌晨不告警,白天分成幾個時段分別設置幾個最低銷售額閥值。

2、銷售平均折扣、銷售平均客單價

這兩個指標都對營銷費用有很大影響,業(yè)務需要時刻關注,當折扣或客單價大幅降低時,需要馬上知曉,曾經(jīng)不止一家電商都由于系統(tǒng)、人為、第三方平臺等原因?qū)е碌膬r格錯誤,最后要么認虧要么得罪消費者。這兩個指標監(jiān)控很簡單,低于某個特定閥值就報警,在此不上圖了。但如果訂單量非常大時,就算出現(xiàn)有異常折扣訂單,可能對整體銷售折扣影響不大,這就需要另外設置一個指標:低于3折訂單數(shù)監(jiān)控。

其次技術(shù)人員是否需要監(jiān)控業(yè)務數(shù)據(jù)?答案當然是需要的。下面舉個我們網(wǎng)店系統(tǒng)運維人員需要監(jiān)控的兩個指標:

(圖四)

網(wǎng)店轉(zhuǎn)單時效 :網(wǎng)店訂單支付時間與訂單轉(zhuǎn)入作業(yè)系統(tǒng)時間之間時效是否達到要求。我們要求訂單支付后半小時內(nèi)必須進入作業(yè)系統(tǒng)占用庫存并安排發(fā)貨,我們無論怎么設計這個系統(tǒng),怎樣監(jiān)控系統(tǒng)的可用性和性能,最終我們?nèi)匀恍枰赖降资欠裼新┚W(wǎng)之魚超出時效的,那一定是我們系統(tǒng)設計之初沒有預見的。

網(wǎng)店轉(zhuǎn)單性能 :轉(zhuǎn)單程序沒分鐘轉(zhuǎn)單數(shù)量。

這些指標的監(jiān)控方式都比較簡單,關鍵在于怎么從后端業(yè)務系統(tǒng)獲取數(shù)據(jù)。

無論是一線業(yè)務運營人員還是系統(tǒng)運維人員根據(jù)各自的職責、業(yè)務特性都可以設計出很多監(jiān)控指標,方式都是雷同的,在此不再贅述了?,F(xiàn)在問題來了,這么多數(shù)據(jù)怎么提供給監(jiān)控寶?

監(jiān)控寶自定義監(jiān)控設計地非常靈活,有興趣去試用下或者看看幫助文檔都能輕松掌握,關鍵是我們后端系統(tǒng)如何提供數(shù)據(jù)給監(jiān)控寶呢?下面大致講下我們監(jiān)控系統(tǒng)的設計。

(圖五)

第一版的系統(tǒng)設計非常簡單,監(jiān)控寶的數(shù)據(jù)都通過monitor提供,monitor系統(tǒng)只需要一張表記錄各監(jiān)控指標查詢語句,所有的業(yè)務數(shù)據(jù)都直接通過sql查詢業(yè)務數(shù)據(jù)庫。這個結(jié)構(gòu)隨著業(yè)務量增加,會導致業(yè)務數(shù)據(jù)庫壓力越來越大,有些復雜業(yè)務監(jiān)控sql語句執(zhí)行性能已經(jīng)不能被接收了,從而演變成下面這種結(jié)構(gòu):

(圖六)

在監(jiān)控數(shù)據(jù)庫中根據(jù)業(yè)務監(jiān)控指標對銷售、商品、庫存等指標進行建模,這些數(shù)據(jù)由業(yè)務系統(tǒng)流轉(zhuǎn)過程中抽離出影響指標數(shù)據(jù)提交給業(yè)務數(shù)據(jù)收集器匯總保存,例如:從網(wǎng)店轉(zhuǎn)單時,將訂單的金額、折扣、網(wǎng)店支付時間等數(shù)據(jù)通過AMQ異步提交給收集器,收集器累計一個時間單元后計算出該時間單元內(nèi)的總銷售額、品均折扣、平均客單價等信息記錄在監(jiān)控庫中,為了方便收集器快速配置,需要預先設置幾種計算模型:直接保存、匯總、求平均、取最小值、最大值等等。

監(jiān)控寶作為云智慧面向業(yè)務的全棧性能管理解決方案中的一環(huán),與面向業(yè)務的端到端應用性能管理平臺透視寶,和基于真實業(yè)務場景的大規(guī)模應用性能測試平臺壓測寶一起,共同以全面提升企業(yè)業(yè)務流程為目標,解決用戶體驗前置和云計算的快速發(fā)展帶來的系統(tǒng)架構(gòu)變化的挑戰(zhàn),幫助企業(yè)致勝互聯(lián)網(wǎng)+.

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2016-03-11
利用云智慧監(jiān)控寶讓IT部門成為企業(yè)價值中心
如今的中國企業(yè)正處在傳統(tǒng)生產(chǎn)、經(jīng)營模式向互聯(lián)網(wǎng)+轉(zhuǎn)型的風口浪尖,企業(yè)業(yè)務對IT和互聯(lián)網(wǎng)的依賴越來越重,IT部門在企業(yè)的價值也是水漲船高。而IT部門要為企業(yè)創(chuàng)造更大的價值,同樣需要改變過去被動響應的工作模式,主動走在業(yè)務的前面,來引導業(yè)務需求,驅(qū)動業(yè)務改變。云智慧監(jiān)控寶是

長按掃碼 閱讀全文