CGFT考試科技模塊中是要考《大數(shù)據(jù)技術(shù)原理及應(yīng)用》和《Python語言基礎(chǔ)》,今天我們說說《大數(shù)據(jù)技術(shù)原理及應(yīng)用》。
大數(shù)據(jù)是金融科技之源與基介紹數(shù)據(jù)庫和Hadoop大數(shù)據(jù)生態(tài)基本理論,包括設(shè)計(jì)、存儲(chǔ)、查詢、管理、挖掘、應(yīng)用等,初步介紹知識(shí)圖譜基本概念和應(yīng)用,掌握SQL語言和正則表達(dá)式技能,熟悉常用金融數(shù)據(jù)庫,熟悉金融大數(shù)據(jù)場景應(yīng)用。
主服務(wù)器Master主要負(fù)責(zé)表和Region的管理工作。
·管理用戶對(duì)表的增加、刪除、修改、查詢等操作。
·實(shí)現(xiàn)不同Region服務(wù)器之間的負(fù)載均衡。
·在Region分裂或合并后,負(fù)責(zé)重新調(diào)整Region的分布。
對(duì)發(fā)生故障失效的Region服務(wù)器上的Region進(jìn)行遷移。
客戶端訪問HBase上數(shù)據(jù)的過程并不需要Master的參與,客戶端可以訪問Zookeeper獲取
-ROOT-表的地址,并*終到達(dá)相應(yīng)的Region服務(wù)器進(jìn)行數(shù)據(jù)讀寫,Master僅僅維護(hù)著表和Region的元數(shù)據(jù)信息,因此,負(fù)載很低
任何時(shí)刻,一個(gè)Region只能分配給一個(gè)Region服務(wù)器。Master維護(hù)了當(dāng)前可用的Region服務(wù)器列表,以及當(dāng)前哪些Region分配給了哪些Region服務(wù)器,哪些Region還未被分配。當(dāng)存在未被分配的Region,并且有一個(gè)Region服務(wù)器上有可用空間時(shí),Master就給這個(gè)Region服務(wù)器發(fā)送一個(gè)請(qǐng)求,把該Region分配給它。Region服務(wù)器接受請(qǐng)求并完成數(shù)據(jù)加載后,就開始負(fù)責(zé)管理該Region對(duì)象,并對(duì)外提供服務(wù)。