GBase新聞
GBASE金融應用指南8 | 運維監控
為幫助金融機構做好分布式分析型數據庫產品的選型,推廣在金融行業部署應用分布式分析型數據庫的成功經驗,GBASE南大通用在北京金融科技產業聯盟的指導下編寫《南大通用GBase 8a金融應用指南》。《指南》深入介紹了分布式分析型數據庫從選型規劃、開發設計規范、數據安全高可用,直至運維優化的部署全過程,并介紹了GBase 8a MPP Cluster在國家政策性銀行和國有大行的代表性部署案例。
GBASE南大通用將陸續推出系列文章,分享解讀《指南》內容,希望能夠對廣大金融用戶的數據庫選型提供借鑒幫助,助力科技金融的高效實施和高質量發展。本篇是系列文章的第8期,介紹數據庫系統的運維監控。
金融行業的系統中集群規模大,數據安全要求高,業務連續性強。GBase 8a MPP Cluster提供了完善的運維監控和保障制度,為用戶的業務和數據安全提供保障。
1、集群監控
GBase 8a集群良好運轉是用戶業務和數據安全的保障,GBase 8a集群有以下幾種監控運維方式:
GBase 8a MPP數據庫運維管理系統:GDOM
(適用于單個集群或多個集群統一的圖形化管理、運維、監控場景)
GDOM是綜合全面的一款監控運維工具,Web可視化界面,可監控集群硬件資源使用信息、集群服務信息、審計信息,將這些信息自動分析產生圖表供用戶查看,并根據用戶設定的報警策略及時報警通知用戶。同時Web界面提供安裝部署、集群擴容、節點替換、版本升級、服務啟停等功能。
GDOM系統需使用獨立的服務器部署并配置獨立的資源庫。GDOM可以管理多套GBase 8a集群,并提供接口給第三方獲取監控信息,便于用戶自己的監控平臺獲取集群監控信息。
命令行監控運維工具:gcadmin工具
(小巧靈活的工具,運維功能完善)
gcadmin是GBase 8a集群自帶的命令行管理和查看集群信息的工具,無需單獨安裝。gcadmin提供查看GBase 8a相關服務狀態、集群節點數據分布規則、執行失敗的sql、集群鎖信息等GBase 8a集群內部信息,不支持硬件資源使用信息查看。gcadmin只提供查看所在集群的信息,其他集群的信息無法查看。gcadmin使用命令和語法可以通過幫助信息查看。
集群系統表
GBase 8a的系統表中也有集群各節點服務狀態、集群各節點數據分布情況、硬件資源使用情況、集群當前sql執行狀態、集群歷史sql執行情況、集群數據加載狀態等。GBase 8a系統表眾多且信息詳細,需使用sql語句查詢,更適合開發人員使用,且GBase 8a系統表頻繁查詢會增加集群負擔,對集群性能有一定影響。
除了以上的監控工具外,GBase 8a還提供日常巡檢報告模板和常用巡檢腳本,供項目運維使用。
2、擴容縮容
GBase 8a集群在以下場景時,需要考慮對集群進行擴容縮容操作:
GBase 8a產品在規劃使用時間內如果有超預估的業務或者數據量出現,導致集群的性能下降或者磁盤空間不足;
GBase 8a產品在到達規劃使用時間后,需要繼續使用并且保持性能,需要做新的規劃,并且按照新規劃對集群進行擴容;
GBase 8a集群使用中遇到業務調整,某些業務縮減使對應VC節點規模需要縮減,某些業務增擴使對應VC節點規模需要增擴;
增加節點服務器的擴容功能支持在線動態擴展集群節點,一次可擴展任意個數節點,且擴展過程中支持暫停、恢復和取消。
集群的擴容原理和流程描述如下圖所示。
擴容流程圖
3、節點替換
GBase 8a集群的節點替換功能使用場景
GBase 8a集群在使用過程中如果有節點服務器發生環境故障(一般是硬件故障)使得該服務器短時間內無法使用,需要使用好的服務器來替換集群中該問題服務器。
節點替換為在線替換,支持中斷和恢復操作,對業務無影響。
GBase 8a MPP Cluster節點替換流程如下圖所示。
節點替換流程圖
4、版本升級
GBase 8a產品在不斷的完善已有功能和增加新的功能滿足市場和用戶的需求,在這個過程中GBase 8a的產品在不斷的更新換代,版本更新。GBase 8a產品提供的升級功能主要用于用戶從正在使用的集群版本更新到GBase 8a集群的更新更高的版本。
升級原理和流程如下圖所示。