蔣洪波:大數(shù)據(jù)時(shí)代挑戰(zhàn)與機(jī)遇并行

來(lái)源:湖北經(jīng)濟(jì)學(xué)院發(fā)布者:系統(tǒng)管理員發(fā)布時(shí)間:2014-09-01瀏覽次數(shù):1004

  本網(wǎng)訊(記者許楊楊)全球信息化飛速發(fā)展的背景下,大數(shù)據(jù)時(shí)代悄然來(lái)臨。6月5日,華中科技大學(xué)蔣洪波教授就大數(shù)據(jù)時(shí)代背景下的挑戰(zhàn)與機(jī)遇,與我校師生深入交流。
  
  蔣洪波以全球第一大搜索引擎谷歌為例,揭示神秘的大數(shù)據(jù)。谷歌共有36個(gè)數(shù)據(jù)中心,美國(guó)有19個(gè)、歐洲12個(gè)、俄羅斯1個(gè)、南美1個(gè)和亞洲3個(gè)。正是因?yàn)檫@些遍布全球的數(shù)據(jù)中心,谷歌才能為用戶提供最為全面的資料。2009年,甲型H1N1流感病毒爆發(fā)之前,谷歌通過(guò)觀察人們?cè)诰W(wǎng)上的搜索記錄,把其中5000萬(wàn)條美國(guó)人最頻繁檢索的詞匯和美國(guó)疾控中心在2003年至2008年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,并通過(guò)分析人們的搜索記錄,來(lái)判斷這些人是否患上流感。其間,谷歌共處理了4.5億個(gè)不同的數(shù)字模型,最后的預(yù)測(cè)與官方數(shù)據(jù)的相關(guān)性高達(dá)97%,不僅能判斷出流感是從哪里傳播的,而且判斷得非常及時(shí)。而疾控中心需要在流感爆發(fā)一兩周之后才能做到較為準(zhǔn)確的預(yù)測(cè)。“這就是大數(shù)據(jù)的特點(diǎn),人們?cè)诖笠?guī)模數(shù)據(jù)的基礎(chǔ)上可以做到那些在小規(guī)模數(shù)據(jù)的基礎(chǔ)上根本無(wú)法完成的事情。”蔣洪波說(shuō),大數(shù)據(jù)的核心是預(yù)測(cè),它把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來(lái)預(yù)測(cè)事情發(fā)生的可能性。
  
  基于大數(shù)據(jù)特點(diǎn),時(shí)代面臨巨大挑戰(zhàn),如何應(yīng)對(duì)挑戰(zhàn)?蔣洪波從統(tǒng)計(jì)學(xué)角度提出了大數(shù)據(jù)的三個(gè)思維變革。樣本 =0總體———利用所有數(shù)據(jù),而不是一小部分?jǐn)?shù)據(jù),大數(shù)據(jù)時(shí)代允許處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣;20+020=03.9———允許不精確,接受混亂性,擁有海量及時(shí)數(shù)據(jù)時(shí),絕對(duì)的精準(zhǔn)已經(jīng)不再是主要目標(biāo);“是什么”,而不是“為什么”———關(guān)注相關(guān)關(guān)系而非因果關(guān)系,有更多的數(shù)據(jù)以及更好的工具后,要找到相關(guān)關(guān)系就變得很快,同時(shí)這也成為找到因果關(guān)系的基礎(chǔ)。
  
  挑戰(zhàn)與機(jī)遇并存。蔣洪波說(shuō):“大數(shù)據(jù)有著取之不盡用之不竭的價(jià)值,如數(shù)據(jù)的折舊值和可再利用。”谷歌在這方面做得最好,它拒絕將互聯(lián)網(wǎng)協(xié)議地址從舊的搜索查詢中完全刪除,因?yàn)樗M玫矫磕甑耐葦?shù)據(jù),如假日購(gòu)物搜索等。充分利用大數(shù)據(jù)價(jià)值的同時(shí)從自己最適合最擅長(zhǎng)的角度出發(fā),才能為大數(shù)據(jù)時(shí)代的發(fā)展貢獻(xiàn)自己的力量,蔣洪波說(shuō)。

版權(quán)所有:湖北經(jīng)濟(jì)學(xué)院 鄂ICP備05003310-1號(hào)
鄂公網(wǎng)安備42011502000701號(hào)

地址:武漢市江夏區(qū)藏龍島開(kāi)發(fā)區(qū)楊橋湖大道8號(hào)

郵編:430205

返回原圖
/