? 我相信你對大數(shù)據(jù)這個詞很熟悉。你每天觸摸手機時都會碰到它,但我們感覺不到。但什么是大數(shù)據(jù)?這是干什么用的?目前有哪些申請?
? 大數(shù)據(jù)的概念?
?? 滲透到每個行業(yè)和商業(yè)領(lǐng)域的數(shù)據(jù)。通過對這些海量數(shù)據(jù)的挖掘和應(yīng)用,產(chǎn)生了新一輪生產(chǎn)率增長和消費者過剩的浪潮。這是麥肯錫提出的第一個大數(shù)據(jù)定義。
?? 麥肯錫全球研究所(McKinseyInstituteofGlobalStudies)后來給出的定義是,它的數(shù)據(jù)集足夠大,足以獲取、存儲、管理和分析超出傳統(tǒng)數(shù)據(jù)庫軟件工具能力的數(shù)據(jù)。它具有數(shù)據(jù)量大、數(shù)據(jù)流快、數(shù)據(jù)類型多樣、值密度低等特點。
?? 研究機構(gòu)Gartner給出的定義是:“大數(shù)據(jù)”要求新的處理模式具有更強的決策能力、洞察力發(fā)現(xiàn)能力和過程優(yōu)化能力,以適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。
?? 百度百科給出的定義是:指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉,管理和處理的數(shù)據(jù)集合,所涉及的數(shù)據(jù)資料量規(guī)模巨大到無法通過人腦甚至主流軟件工具,在合理時間內(nèi)達到摘取 ,管理,處理,并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊,
?? 可以簡單理解為:“大數(shù)據(jù)”是一個體量特別大,數(shù)據(jù)類別特別大的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫工具對其內(nèi)容進行抓取,管理和處理,簡單的說就是超級存儲,海量數(shù)據(jù)上傳到云平臺,大數(shù)據(jù)就會對數(shù)據(jù)進行深入分析和挖掘。
?? 大數(shù)據(jù)基本要具備以下三點:
? 1. 有海量數(shù)據(jù)
? 2. 有對海量數(shù)據(jù)進行挖掘的需求
? 3.有挖掘海量數(shù)據(jù)的技術(shù)和工具(如Hadoop、spark)
? 大數(shù)據(jù)是一個抽象的概念,度當(dāng)前無論是企業(yè)還是政府,高校等單位面臨的數(shù)據(jù)無法存儲,無法計算的狀態(tài),大數(shù)據(jù),在于海量,單擊無法快速處理,需要通過垂直擴展,水平擴展 即大數(shù)據(jù)的大內(nèi)存高效能和大磁盤大集群等進行處理。
? 大數(shù)據(jù)可以做什么?
? 大數(shù)據(jù)里面的內(nèi)容,分為3種類型:
? 1.結(jié)構(gòu)化數(shù)據(jù):固定格式和有限長度的數(shù)據(jù)。
? 2。非結(jié)構(gòu)化數(shù)據(jù):現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)越來越多,即長度不定、格式不固定的數(shù)據(jù),如:視頻、語音、網(wǎng)頁等。
? 3.半結(jié)構(gòu)化數(shù)據(jù):XML或HTML格式的數(shù)據(jù)。
? 獲取大數(shù)據(jù)后,利用這些數(shù)據(jù)進行數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)可視化。
? 大數(shù)據(jù)的核心作用是對數(shù)據(jù)進行估值。簡而言之,大數(shù)據(jù)使數(shù)據(jù)產(chǎn)生各種“價值”。評估數(shù)據(jù)的過程是大數(shù)據(jù)所做的主要工作。
? 簡單地說。大數(shù)據(jù)能做的就是。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握海量數(shù)據(jù)信息,而在于對這些有意義的數(shù)據(jù)進行專門處理。
? 大數(shù)據(jù)的主要應(yīng)用場景?
? 大數(shù)據(jù)的應(yīng)用對象可以簡單地為人類提供輔助服務(wù),也可以為Agent提供決策服務(wù)。大數(shù)據(jù)包括內(nèi)部應(yīng)用系統(tǒng)的數(shù)據(jù)分析,包括與行業(yè)和行業(yè)的深度集成。具體場景包括:互聯(lián)網(wǎng)行業(yè)、政府行業(yè)、金融行業(yè)、傳統(tǒng)企業(yè)房地產(chǎn)、醫(yī)療、能源、制造業(yè)、典型行業(yè)等。在Internet+上廣泛應(yīng)用大數(shù)據(jù),可應(yīng)用于電信、金融、教育等各行各業(yè)。醫(yī)療、軍事、電子商務(wù)等。
? 舉例一些主要應(yīng)用的行業(yè):
? 制造:大數(shù)據(jù)可以幫助制造商降低成本和浪費,并在更短的時間內(nèi)生產(chǎn)出高質(zhì)量的產(chǎn)品。
? 金融:大數(shù)據(jù)在高頻交易、社會情緒分析和信用風(fēng)險分析三大金融創(chuàng)新領(lǐng)域發(fā)揮著重要作用。
? 零售殘余影子行業(yè):利用大數(shù)據(jù)實現(xiàn)O2O模式,徹底改變傳統(tǒng)餐飲經(jīng)營模式,通過客戶偏好,可以改進營銷方案,轉(zhuǎn)變服務(wù)方式。
? 醫(yī)療行業(yè):改善治療或患者提供更好的醫(yī)療援助:提高行政管理、成本管理、人力資源人事管理和交付管理的效率。
? 能源產(chǎn)業(yè):大數(shù)據(jù)可以加速能源產(chǎn)業(yè)的發(fā)展和商業(yè)模式的創(chuàng)新。
? 貿(mào)易行業(yè):利用大數(shù)據(jù)跟蹤學(xué)生變化,設(shè)計教育形式等。