進(jìn)入2012年以來(lái),大數(shù)據(jù)(Big株Data)一詞被越來(lái)越多的人提及和使用,人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的大數(shù)據(jù),大家從互聯(lián)網(wǎng)進(jìn)入大數(shù)據(jù)時(shí)代,都是透明的存在.各種各樣的數(shù)據(jù)迅速膨脹變大,它決策著企業(yè)的未來(lái)發(fā)展,盡管如今企業(yè)可能并不是意識(shí)到數(shù)據(jù)爆炸性增長(zhǎng)帶來(lái)難題的隱患,但隨之時(shí)間的推移,人們將會(huì)愈來(lái)愈意識(shí)到數(shù)據(jù)對(duì)企業(yè)的重要性.關(guān)于大數(shù)據(jù)的四個(gè)特三個(gè)特點(diǎn).
.大數(shù)據(jù)的四個(gè)特點(diǎn)
.1、大容量
.例如,IDC最近的報(bào)告預(yù)測(cè)到2020年,世界數(shù)據(jù)量將擴(kuò)大50倍.目前,大數(shù)據(jù)的規(guī)模仍然是不斷變化的指標(biāo),單一數(shù)據(jù)集的規(guī)模范圍從數(shù)十TB到數(shù)PB不同.簡(jiǎn)單來(lái)說(shuō),存儲(chǔ)1PB數(shù)據(jù)需要2萬(wàn)臺(tái)配備50GB硬盤的PC.此外,各種意想不到的來(lái)源可以產(chǎn)生數(shù)據(jù).
.2、多樣性
.
數(shù)據(jù)多樣性的增加主要是由于網(wǎng)絡(luò)日志、社交媒體、網(wǎng)絡(luò)檢索、手機(jī)通話記錄、傳感器網(wǎng)絡(luò)等數(shù)據(jù)類型.
.3、高速
.高速描述的是數(shù)據(jù)創(chuàng)建和移動(dòng)的速度.在高速網(wǎng)絡(luò)時(shí)代,通過(guò)實(shí)現(xiàn)軟件性能優(yōu)化的高速計(jì)算機(jī)處理器和服務(wù)器,創(chuàng)建實(shí)時(shí)數(shù)據(jù)流已成為流行趨勢(shì).企業(yè)不僅要知道如何快速創(chuàng)建數(shù)據(jù),還要知道如何快速處理、分析和返回用戶,以滿足他們的實(shí)時(shí)需求.
.4、易變性
.
大數(shù)據(jù)具有多層結(jié)構(gòu),意味著大數(shù)據(jù)呈現(xiàn)多變形式和類型.與傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)相比,大數(shù)據(jù)具有不規(guī)則和模糊的特性,很難使用傳統(tǒng)的應(yīng)用程序進(jìn)行分析.傳統(tǒng)的業(yè)務(wù)數(shù)據(jù)隨著時(shí)間的推移而具有標(biāo)準(zhǔn)的格式,可以被標(biāo)準(zhǔn)的業(yè)務(wù)智能軟件識(shí)別.目前,企業(yè)面臨的挑戰(zhàn)是處理和從各種形式呈現(xiàn)的復(fù)雜數(shù)據(jù)中挖掘價(jià)值.
.大數(shù)據(jù)的三個(gè)特征
.首要特點(diǎn)是數(shù)據(jù)類型多.包括網(wǎng)絡(luò)日志、音頻、視頻、圖像、地理位置信息等多種數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高的要求.
.第二個(gè)特點(diǎn)是數(shù)據(jù)價(jià)值密度相對(duì)較低.隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無(wú)處不在,信息龐大,但價(jià)值密度低,如何通過(guò)強(qiáng)大的機(jī)械算法更快地完成數(shù)據(jù)的價(jià)值純化是大數(shù)據(jù)時(shí)代必須解決的難題.
.第三個(gè)特點(diǎn)是處理速度快,時(shí)效性要求高.這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征.
..