追趕Big Table!專家解讀HBase未來(lái)走向 |
發(fā)布時(shí)間: 2012/7/28 9:21:19 |
HBase是 Hadoop數(shù)據(jù)庫(kù),它是一個(gè)分布式的、可擴(kuò)展的大數(shù)據(jù)存儲(chǔ),然而相對(duì)于分布式存儲(chǔ)的鼻祖Google的Big Table來(lái)說(shuō),HBase還是要落后了好幾年,那么,未來(lái)HBase究竟走向何方?本次大會(huì),IT168記者采訪到了來(lái)自eBay的HBase專家,也是中國(guó)第一個(gè)HBase Committer于志宏。他在采訪中介紹了HBase在eBay的應(yīng)用,以及成為一個(gè)HBase Committer所需要具備的條件,同時(shí)他還對(duì)HBase未來(lái)的發(fā)展做出了獨(dú)特的見(jiàn)解。 主持人:能簡(jiǎn)單介紹一下明天演講的主要內(nèi)容嗎? 嘉賓:明天我主要演講的主要是關(guān)于HBase,HBase作為非關(guān)系型的數(shù)據(jù)存儲(chǔ)的應(yīng)用還是比較廣泛的,HBase0.92剛推出,我作為HBase Committer,明天會(huì)講一些0.92里面新的功能,0.94以及未來(lái)的也會(huì)講一些。 主持人:你在Ebay從事HBase方面的開(kāi)發(fā)工作,相信很多的網(wǎng)友也很關(guān)心這一塊,你現(xiàn)在的Ebay HBase的團(tuán)隊(duì)做哪些方面的工作,然后就是這個(gè)工作對(duì)于未來(lái)在于對(duì)于Ebay來(lái)說(shuō)有什么樣的應(yīng)用,未來(lái)發(fā)展的前景怎么樣,能簡(jiǎn)單介紹一嗎? 嘉賓:Ebay的Search Team,Ebay運(yùn)行的話,有不同的A bid,一個(gè)物品放上去之后,有很多人去競(jìng)價(jià),怎么找到別人的競(jìng)價(jià),然后找到以后你才能有下一個(gè),所以他們Search team用HBase作為后端,所有我的同事也會(huì)講一下Search Team怎么使用HBase。我過(guò)去一年多專注于HBase方面,在HBase核心這一部分做的工作會(huì)多一些,那么HBase0.92它有一個(gè)新的功能,叫Co Processer,所以對(duì)于剛才我提到的Search team,怎么縮短查詢時(shí)間會(huì)很有幫助。 主持人:這個(gè)對(duì)于以后在Ebay里面哪些方面的應(yīng)用會(huì)有幫助? 嘉賓:講具體一點(diǎn)的話是這樣,現(xiàn)在他們Search team實(shí)現(xiàn)是基于HBase 0.90,沒(méi)有Co processer,所以查詢需要從Acquire到Serve需要兩趟,如果Co processer,第一趟查到一些結(jié)果以后,再用中間結(jié)果直接在服務(wù)器端再進(jìn)行一次查詢,再把結(jié)果反饋到客戶端,這樣的話,就減少客戶端和服務(wù)器端的往來(lái),減少一次。 主持人:我了解到你除了做HBase Ebay的開(kāi)發(fā)方面,也是HBase社區(qū)的貢獻(xiàn)者,我想問(wèn)一下,您在HBase社區(qū)里面,你主要貢獻(xiàn)哪些方面的內(nèi)容? 嘉賓:對(duì),在明天我講的里面會(huì)涉及到一些,在成為Committer以前,我寫(xiě)的代碼比較多,邵錚提到HBase優(yōu)勢(shì)的時(shí)候講到動(dòng)態(tài)的對(duì)于Load,就是能夠動(dòng)態(tài)的調(diào)控,這方面Load balance我會(huì)做一些,明天會(huì)講一下。成為Committer以后,中國(guó)人我是第一個(gè),所以我有相當(dāng)一部分責(zé)任就是怎么樣把中國(guó)云計(jì)算,比如說(shuō)HBase這方面的Contribution越來(lái)越多,怎么把中國(guó)的Contribution,比如說(shuō)關(guān)于Table,怎么把中國(guó)來(lái)的Contribution為放在Apache上面,我很多時(shí)間放在這個(gè)上面,就是怎么溝通,像Doug Cutting來(lái)的時(shí)候,他講很重要一點(diǎn),他強(qiáng)調(diào)阿帕奇作為怎么樣建起來(lái)這個(gè)社區(qū),這個(gè)社區(qū)的話就是說(shuō)不管是美國(guó)的公司也好,中國(guó)的公司也好,就是說(shuō)開(kāi)源式的軟件都能放進(jìn)去,然后才能共享,所以我在這方面,就是我覺(jué)得會(huì)起到一些比較,當(dāng)然我希望下一步明年中國(guó)大陸出一個(gè)HBase Committer,這樣的話就是說(shuō)如何加快中國(guó)云計(jì)算對(duì)于阿帕奇社區(qū)的貢獻(xiàn)。 主持人:剛才您講,您特別希望中國(guó)大陸能夠出現(xiàn)更多HBase的Committer,對(duì)于這些想成為Committer開(kāi)發(fā)人員來(lái)說(shuō),你有沒(méi)有一些好的建議或者想說(shuō)的? 嘉賓:明天開(kāi)會(huì)的時(shí)候我還會(huì)講一下,我注意到剛才上午開(kāi)會(huì)的時(shí)候,有一位先生他問(wèn)用英文怎么表述自己,因?yàn)槲易钤绯鰢?guó)的時(shí)候,我上過(guò)新東方的課,培訓(xùn)一下。HBase也好,Hadoop也好,中國(guó)的這些Contribution放在Apache的話,有很多因素,首先是編程質(zhì)量,編程程序中有很多注釋,注釋一般用很多英語(yǔ)的,怎么樣用英語(yǔ)很清晰的表示一個(gè)概念,那么Contribution,Table比較大一些,也有比較小的,小的也有很好的注釋,我個(gè)人花一些時(shí)間,除了看程序以外,還要把注釋英文譯法給改的好一點(diǎn)。 那么就是說(shuō)從這一點(diǎn)上來(lái)講,溝通,除了程序,程序什么人都可以看,但是如果你要讓別人看得更明白的話,就是說(shuō)這些注釋什么的,還是要下一些工夫。 主持人:就是說(shuō)英語(yǔ)水平很重要。 嘉賓:英語(yǔ)水平,對(duì),因?yàn)橐话銇?lái)講,從中國(guó)這邊和美國(guó)這邊,異地異步的,不是同時(shí),比如中國(guó)白天寫(xiě)的,可能到那邊要過(guò)比如說(shuō)幾個(gè)小時(shí),那邊才有反應(yīng),所以你用英語(yǔ)寫(xiě)下來(lái)的話,這些交流就是怎么解釋,這個(gè)代碼怎么運(yùn)行的,關(guān)鍵問(wèn)題在什么地方,等等,這都是需要通過(guò)英語(yǔ)來(lái)進(jìn)行交流的。那么我是在這方面的話,因?yàn)槲覍?duì)中國(guó)出來(lái)的這些帖子或者發(fā)言反應(yīng)會(huì)比較快一點(diǎn),因?yàn)槲以缟虾茉缍紩?huì)檢查Email,但是就是說(shuō)別的人,就是讓別的那個(gè)Hadoop Committer也看懂的話,希望這方面能夠有所改進(jìn)。 主持人:那么這個(gè)就是說(shuō)對(duì)于國(guó)外的開(kāi)發(fā)者來(lái)說(shuō),是不是算是一個(gè)優(yōu)勢(shì)呢? 嘉賓:對(duì),所以我剛才跟劉佳講,我在美國(guó),因?yàn)槲医趦?nèi)還沒(méi)有回國(guó)的打算,所以我在美國(guó)的話,能和別的這些,當(dāng)然大多數(shù)白人了,因?yàn)槲沂堑谝粋(gè)非白人的Committer,現(xiàn)在有一個(gè)中國(guó)人,三個(gè)印度人,其中一個(gè)印度人在華為印度,我覺(jué)得就是說(shuō)交流這一點(diǎn),因?yàn)槲夷軌蚝退麄兠鎸?duì)面交流,比如說(shuō)我回來(lái)前一天,還在和他們面對(duì)面談,所以我成為Committer以后,我做的事情多一點(diǎn)的話,我也會(huì)把我的想法告訴他們。 主持人:行,那最后還有一個(gè)問(wèn)題,就是說(shuō)你能不能談一談HBase這個(gè)前景,讓大家都來(lái)看一看,讓更多人都來(lái)關(guān)注這一塊? 嘉賓:因?yàn)樯衔鏕oogle有一個(gè)人他講,我覺(jué)得Google還是領(lǐng)先于開(kāi)源的有幾年的,比如像HBase,因?yàn)?.92沒(méi)有Co processer,0.92也是兩天前才有第一個(gè)版本出來(lái),HBase和Big Table還是有很大差距,當(dāng)然,HBase加上Hive相當(dāng)程度上也是達(dá)到Google正在做的這些。HBase再往下,我覺(jué)得還是有很多可以做的,比如說(shuō)像這個(gè)Google工程師提到多行的Transaction,Transaction用HBase的程序員才會(huì)比較好的,程序才會(huì)表述的比較清楚,但是現(xiàn)在HBase只是在一行,一行上,實(shí)際上一行還有文章,因?yàn)橛蠱odicle,也是最近才解決的。所以,因?yàn)锽ig table在那里,所以領(lǐng)先很多,HBase還有相當(dāng)?shù)陌l(fā)展。 本文出自:億恩科技【www.cmtents.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |