大數(shù)據(jù):云計算的延伸 |
發(fā)布時間: 2012/9/7 15:46:08 |
根據(jù)Cisco預(yù)測,2010-2015年,全球移動數(shù)據(jù)流量將激增26倍,將達到6.3EB/月;寬帶IP數(shù)據(jù)流量將達到80.5EB/月。 數(shù)據(jù)的快速增長帶來了數(shù)據(jù)存儲、處理、分析的巨大壓力,大數(shù)據(jù)技術(shù)的引入,不但滿足了系統(tǒng)功能和性能的要求,帶來良好的可擴展性,降低了IT部署的成本,此外它還拓展了數(shù)據(jù)智能分析的應(yīng)用領(lǐng)域。大數(shù)據(jù)技術(shù)成為當前面臨快速變化、數(shù)據(jù)爆炸時代的企業(yè)提升競爭力的有力工具。 大數(shù)據(jù):云計算的延伸 什么是大數(shù)據(jù)?根據(jù)維基百科的定義,大數(shù)據(jù)指難以用常用的軟件工具在可容忍時間內(nèi)抓取、管理以及處理的數(shù)據(jù)集。大數(shù)據(jù)的顯著特征包括:Volume 數(shù)據(jù)體量巨大;Variety 數(shù)據(jù)類型繁多,包括結(jié)構(gòu)化數(shù)據(jù)以及非結(jié)構(gòu)化數(shù)據(jù)如網(wǎng)頁、日志、視頻、圖片等等;Velocity要求的處理速度快。 大數(shù)據(jù)技術(shù)與云計算的發(fā)展密切相關(guān),大數(shù)據(jù)技術(shù)是云計算技術(shù)的延伸。大數(shù)據(jù)技術(shù)涵蓋了從數(shù)據(jù)的海量存儲、處理到應(yīng)用多方面的技術(shù),包括海量分布式文件系統(tǒng)、并行計算框架、NoSQL數(shù)據(jù)庫、實時流數(shù)據(jù)處理以及智能分析技術(shù)如模式識別、自然語言理解、應(yīng)用知識庫等等。 對電信運營商而言,在當前智能手機、智能設(shè)備快速增長、移動互聯(lián)網(wǎng)流量迅猛增加的情況下,大數(shù)據(jù)技術(shù)可以為運營商帶來新的機會。大數(shù)據(jù)在運營商中的應(yīng)用可以涵蓋多個方面,包括企業(yè)管理分析如戰(zhàn)略分析、競爭分析,運營分析如用戶分析、業(yè)務(wù)分析、流量經(jīng)營分析,網(wǎng)絡(luò)管理維護優(yōu)化如網(wǎng)絡(luò)信令監(jiān)測、網(wǎng)絡(luò)運行質(zhì)量分析,營銷分析如精準營銷、個性化推薦等。下面列舉一些典型的應(yīng)用場景。 典型應(yīng)用1:網(wǎng)絡(luò)管理維護優(yōu)化 隨著運營商網(wǎng)絡(luò)數(shù)據(jù)業(yè)務(wù)流量快速增長,數(shù)據(jù)業(yè)務(wù)在運營商收入占比重不斷增加,流量與收入之間的不平衡也越發(fā)突出,智能管道、精細化運營成為運營商突破困境的共識。網(wǎng)絡(luò)管理維護和優(yōu)化成為精細化運營中的一個重要基礎(chǔ)。 傳統(tǒng)的信令監(jiān)測尤其是數(shù)據(jù)信令監(jiān)測已經(jīng)面臨瓶頸,以某運營商省公司為例,原始數(shù)據(jù)信令達到1TB/天,以文件形式保存。而處理之后生成的xDR(x Detail Record)數(shù)據(jù)量達到550GB/天,以數(shù)據(jù)庫形式保存。通常這些數(shù)據(jù)需要保存數(shù)天或數(shù)月,傳統(tǒng)文件系統(tǒng)以及傳統(tǒng)關(guān)系數(shù)據(jù)庫處理這么大的數(shù)據(jù)量顯得捉襟見肘。面對信令流量快速增長、擴展困難、成本高的情況,采用海量分布式文件系統(tǒng),數(shù)據(jù)存儲量不受限制,可以按需擴展,同時NoSQL數(shù)據(jù)庫可以有效處理達PB級的數(shù)據(jù),實時流處理及分析平臺保證實時處理海量數(shù)據(jù)。 智能分析技術(shù)在大數(shù)據(jù)的支撐下將在網(wǎng)絡(luò)管理維護優(yōu)化中發(fā)揮積極作用,網(wǎng)絡(luò)維護的實時性將得到提升,事前預(yù)防成為可能。比如通過歷史流量數(shù)據(jù)以及專家知識庫結(jié)合,生成預(yù)警模型,可以有效識別異常流量,防止網(wǎng)絡(luò)擁塞或者病毒傳播等異常。 典型應(yīng)用2:用戶行為分析 用戶行為分析在流量經(jīng)營中起重要的作用。用戶行為結(jié)合用戶profile、產(chǎn)品、服務(wù)、計費、財務(wù)等信息進行綜合分析,得出細粒度、精確的結(jié)果,實現(xiàn)用戶個性化的策略控制。今后還可以對管道內(nèi)容進行分析,比如圖片、電影、網(wǎng)頁等,深入理解用戶的行為特征。目前流量經(jīng)營分析中的瓶頸主要是數(shù)據(jù)的采集和處理。比如某運營商省公司建立了營銷門戶系統(tǒng),該系統(tǒng)為適應(yīng)省公司精確化管理、針對性營銷要求,實現(xiàn)對營銷活動的日報統(tǒng)計等支撐,打造適用于全省各級營銷管理人員、一線經(jīng)理及支撐人員的營銷支撐門戶,提供與營銷活動相關(guān)的日報、月報統(tǒng)計,包括量收、欠費、用戶發(fā)展、預(yù)警信息、機構(gòu)樹匯總等內(nèi)容。目前每月新增數(shù)據(jù)量達到4T,傳統(tǒng)方式分析結(jié)果需要26個小時,數(shù)據(jù)處理效率低,系統(tǒng)擴展困難。采用Data Cloud、并行分布式處理等大數(shù)據(jù)技術(shù)后,報表分析只需要2個小時,滿足了報表對時限的要求,系統(tǒng)擴展性好,可用性高。 典型應(yīng)用3:個性化推薦 目前在各類增值業(yè)務(wù)中,根據(jù)用戶喜好推薦各類業(yè)務(wù)或應(yīng)用成為運營商服務(wù)用戶的一個有效方式,比如應(yīng)用商店軟件推薦、IPTV視頻節(jié)目推薦。這一類應(yīng)用需要處理的數(shù)據(jù)量大,實時性要求高,涉及到大量的非結(jié)構(gòu)化數(shù)據(jù)以及智能分析,大數(shù)據(jù)技術(shù)成為系統(tǒng)實現(xiàn)中關(guān)鍵的技術(shù)。以IPTV節(jié)目推薦為例,不僅需要分析用戶已有日志及評論、打分等數(shù)據(jù),還需要從互聯(lián)網(wǎng)通過網(wǎng)絡(luò)爬蟲分析獲得相關(guān)視頻和評論進行綜合分析?梢圆捎玫南嚓P(guān)技術(shù)包括并行計算框架、分布式文件系統(tǒng)以及文本分類/聚類/關(guān)聯(lián)算法、文本摘要抽取、情感分析和文本語義分析、文本挖掘等智能分析算法。 典型應(yīng)用4: 基于平臺的數(shù)據(jù)云服務(wù)(DaaS) 當前移動互聯(lián)網(wǎng)領(lǐng)域,最大的流量是視頻數(shù)據(jù)。隨著社會化網(wǎng)絡(luò)、移動支付以及物聯(lián)網(wǎng)的發(fā)展,實體經(jīng)濟和虛擬世界有更多的交集,數(shù)據(jù)的價值將不斷提升。運營商通過分析流量的內(nèi)容,比如網(wǎng)頁的語義、圖片、視頻內(nèi)容以及用戶的觀點、位置、時間關(guān)聯(lián)等,將獲得更多有價值的信息。比如某用戶在淘寶上的購物,穿插了在其它網(wǎng)站上瀏覽(比如手機評測網(wǎng)站)、與朋友的聊天或者在微博上發(fā)表的言論,用戶行為綜合分析之后能較準確地反應(yīng)個體用戶的興趣愛好、價值取向、活動范圍以及社會關(guān)系等等。同時也可以對用戶群進行分析,挖掘出用戶群特征或者趨勢分析。電信運營商基于這一切做的分析結(jié)果,可以作為數(shù)據(jù)服務(wù)提供給企業(yè)、SP/CP、研究機構(gòu)等,也可以針對用戶提供廣告推送。當然,針對這一塊的應(yīng)用,用戶隱私保護、法律許可等都是需要考慮的,相關(guān)的體系還有待完善。 大數(shù)據(jù)風(fēng)起云涌,相關(guān)技術(shù)及應(yīng)用尚處于起步階段。電信運營商有必要在移動互聯(lián)網(wǎng)快速發(fā)展中抓住機會,大數(shù)據(jù)應(yīng)用將大有作為。 本文出自:億恩科技【www.cmtents.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |