dashuju
大數(shù)據(jù)
大數(shù)據(jù)是由數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類(lèi)型眾多的數(shù)據(jù)構(gòu)成的巨量數(shù)據(jù)集合。大數(shù)據(jù)的采集、清洗、存儲(chǔ)、查找、傳輸、分享、分析及可視化等操作都超越了現(xiàn)有關(guān)系數(shù)據(jù)庫(kù)與數(shù)據(jù)處理軟件的承載能力。Google等一流企業(yè)為存儲(chǔ)和計(jì)算所需海量互聯(lián)網(wǎng)資源而開(kāi)發(fā)了分布文件系統(tǒng)GFS、數(shù)據(jù)庫(kù)BigTable和算法MapReduce,并公開(kāi)成果。作為Google類(lèi)似技術(shù)替代者的開(kāi)源軟件Hadoop,以及建立其上的軟件逐漸成為大數(shù)據(jù)云存儲(chǔ)與處理技術(shù)的主流。