2016-05-31 12:39:56讀.冊.人
小滿閱讀:巨量資料(Big Data)
小滿讀:巨量資料(Big Data)
預測未來、創造商機的資料智慧
巨量資料(Big Data)和我們的生活究竟有什麼關係?
不妨先試著回想以下的網路使用經驗:在搜尋網站對話框鍵入關鍵字的首字後,就出現「您是不是要查……」的下拉選單,而且第一個候選詞彙就是你想查詢的關鍵字;在網路書店買書時,出現「買這本書的人也買了這些書……」的清單,推薦的書正好也是你的喜好類型;社群網站上出現「你可能認識的朋友……」的交友建議,讓你找到了失聯已久的同學。
你以為,這些網站精準預測你我的需求,只是「偶然的幸運」(serendipity),其實這背後就是巨量資料(Big Data)與商業智慧(BI,Business Intelligence)交互作用的結果。
巨量資料:從交易資料到互動資料
《大數據的獲利模式》指出,巨量資料狹義的定義是:「在3V(大量、龐雜、快速,簡稱「3V特性」)的層面上難以管理的資料,以及為了儲存、處理與分析這些資料的技術。」廣義的定義則是在狹義的定義之外,加上「為了分析這些資料,並且能夠從中萃取有用資訊或洞見的人才與組織」。
巨量資料的「3V特性」說明如下:
1.大量(volume)
當一架安裝4具引擎的巨無霸客機飛越大西洋時,產生的資料高達640TB(terabyte,GB的1000倍)。全球每天有2萬5000架次的班機飛航,可以想見產生的資料量有多麼龐大。
不過,當今的巨量資料更多是來自於生活周遭,像是部落格(Blog)、社群網站上傳,或是透過智慧型手機、監視器與感測器產生的影音檔、圖片檔、文字檔。由於這些資料難以儲存在企業視為主流的「關聯資料庫」(relational database)中,因此被統稱為「非結構化資料」。
儘管如此,企業如果能夠運用語意分析技術,掌握資料中所顯示的「情緒」(例如正面或負面評論),就可以洞察消費者對於自家產品的評價與網路口碑,獲取具有管理與行銷價值的資訊,進而發掘、預測需求。
2.龐雜(variety)
除了分析存在於企業內部或外部的銷售與顧客資料(即「結構化資料」)之外,企業如今更要設法從「非結構化資料」搶先獲得寶貴的顧客需求情報,進而與銷售連結。
比方說,精品製造商萬寶龍(Montblanc)透過門市監視器的影像,取得了顧客消費行為與動線的龐雜資料,在抽絲剝繭後,將最暢銷的商品陳列在最能吸引顧客目光的位置。
又如手機通訊業者T-mobile,在門市裝設具有影片分析功能的監視器,藉此統計上門顧客的人數與動線,以及花費多少時間站在陳列櫃之前,甚至連顧客花了多少時間物色哪一款手機、在手上把玩多少時間都納入分析,進而掌握上門顧客的消費行為。
3.快速(velocity)
更新頻率快與資料產生速度快,也是巨量資料的特色之一。便利商店的銷售時點情報系統(POS,Point of Sale),分分秒秒都在產生大量的顧客消費資料;網拍公司eBay每分鐘賣出5個女用包、每兩分鐘成交一只鑽戒,一天處理的資料量(含交易、查詢等)也高達50TB,相當於3000個16GB隨身碟。
社群網站的盛行,帶動了以「非結構化資料」為主的巨量資料分析,促使企業不再能只滿足於「產品賣掉了」「顧客突然解約」等屬於點狀的「交易資料」(transaction data),而必須轉而探究「為什麼這項產品賣掉了?」「顧客為什麼突然解約?」等屬於線狀的「互動資料」(interaction data)。
而想要從「分析現狀」到「精準預測未來」,就必須將分析方法從「點」(交易資料)深化到「線」(互動資料)。
比方說,亞馬遜網站(amazon.com)透過網頁的點擊串流資料,追蹤使用者從進入到離開該網站的動線與行為,就是顧客與企業網站之間的互動資料。如果從中發現多數使用者點入某個頁面就跳開,代表該頁面需要改善「優使性」(usability,讓使用者在瀏覽網頁的過程中沒有壓力或挫折感,能以最少的力氣發揮最大的效能。)
商業智慧:從分析現狀到預測未來
由上可知,巨量資料的儲存、處理和分析,主要目的之一就是從中萃取出「商業智慧」:有組織、有系統地分析、彙整儲存於企業內外部的資料,從中汲取關鍵的概念、機制與活動,創造出有助於商業上各種決策的知識與洞見。
商業智慧一詞最早在1989年提出,時任研究機構顧能(Gartner)的分析師豪爾德‧最斯納(Howard Dresner)主張,銷售與顧客的分析工作應該要由資料的終端使用者(end user)、也就是經理人或工作者親自經手,而非委由資訊部門代為處理,才能達到迅速決策與提高生產力的目標。
時至今日,商業智慧已歷經了不同的轉變,從1980年代以出具分析報告為主,目的在於了解「過去發生什麼事」;到1990年代,透過多維分析(例如Excel、線上分析處理[OLAP,On Line Transaction Processing〕、資料查詢[query〕),嘗試了解「這件事為什麼發生」;進入21世紀的第一個十年,則以監控(儀表板[dashboard〕、計分卡[scorecard〕)分析「目前正在發生什麼事」;到了2010年代,透過預測分析、最佳化(資料探勘、文字探勘等)的技術,預測「未來將發生什麼事」。
在巨量資料與商業智慧的協助之下,企業與經理人的決勝點將不再取決於分析過去和現在,而在於預測未來,發掘出可能連消費者自己也不自知的需求。
當資料成為商場上的重要資源,而企業要透過公開、分享或買賣方式取得資料又非難事。
策略架構:買還是賣?公開還是保護?
野村總合研究所高級研究員城田真琴建議,企業在思考如何運用巨量資料時,可針對資料進行分類,以資料源自內部或外部、資料性質屬於核心或背景為兩條軸線,形成巨量資料時代的企業IT策略架構:
1.來自內部的核心資料:保護或賣出
企業內部獨有、對於其他企業來說也有價值的資料,像是POS系統資料、會員消費紀錄等,有助於和競爭對手形成差異化(differentiation)。
這類資料由於已存在於公司內部、容易取得,又是競爭對手很想拿到、市場價值極高的策略型資料,企業通常會將之歸類為「必須慎重保護」,絕不對外提供。不過,近來開始有些企業願意換個角度思考,「如果能為公司帶來極佳的利潤,不妨與其他企業策略聯盟共享或交換資料。」
2.來自內部的背景資料:公開或保護
企業獨有,但無法直接創造差異化以吸引顧客的資料,包括:總營收、銷售利潤等財務資料,或員工的履歷、往來e-mail等。這類資料的處理方式非常極端,不是公開就是保護(甚至要到嚴格保護的程度),像公開發行公司的財務資料依法就必須公開,但是員工的個人資料與e-mail就絕對不可外洩。
3.來自外部的核心資料:買入
其他企業獨有,但是自家企業迫切需要的資料,由於沒有對外公開,所以市場價值很高。對於企業來說,這是屬於即使要付出高昂代價也要入手的資料,像是其他企業的顧客資訊就是一例。
4.來自外部的背景資料:使用或買入
相較於核心資料,來自外部的背景資料(通常是政府公開的統計資料或地圖資料)多半可以免費使用或是以相對便宜的價格買入,所以市場價值並不高。不過,由於事涉該國政府是否願意公開統資料,因此相對來說較難取得。
城田建議,企業可以從「為了達到何種目的必須要有什麼資料;光靠內部現有資料是否夠用;如果不夠用,應該從外部取得何種資料」開始思考,建構巨量資料的應用策略,協助企業嗅出趨勢、創造「偶然的幸運」,精準預測顧客的需求。
看得到的是資料,看得懂的是資訊,用得出來的是情報。找出資料的價值,萃取可用的資訊,才能將巨量資料化為商業智慧,進而嗅出趨勢、預測未來、創造商機。
本文內容摘自以下網頁:
http://www.managertoday.com.tw/glossary/view/131
預測未來、創造商機的資料智慧
巨量資料(Big Data)和我們的生活究竟有什麼關係?
不妨先試著回想以下的網路使用經驗:在搜尋網站對話框鍵入關鍵字的首字後,就出現「您是不是要查……」的下拉選單,而且第一個候選詞彙就是你想查詢的關鍵字;在網路書店買書時,出現「買這本書的人也買了這些書……」的清單,推薦的書正好也是你的喜好類型;社群網站上出現「你可能認識的朋友……」的交友建議,讓你找到了失聯已久的同學。
你以為,這些網站精準預測你我的需求,只是「偶然的幸運」(serendipity),其實這背後就是巨量資料(Big Data)與商業智慧(BI,Business Intelligence)交互作用的結果。
巨量資料:從交易資料到互動資料
《大數據的獲利模式》指出,巨量資料狹義的定義是:「在3V(大量、龐雜、快速,簡稱「3V特性」)的層面上難以管理的資料,以及為了儲存、處理與分析這些資料的技術。」廣義的定義則是在狹義的定義之外,加上「為了分析這些資料,並且能夠從中萃取有用資訊或洞見的人才與組織」。
巨量資料的「3V特性」說明如下:
1.大量(volume)
當一架安裝4具引擎的巨無霸客機飛越大西洋時,產生的資料高達640TB(terabyte,GB的1000倍)。全球每天有2萬5000架次的班機飛航,可以想見產生的資料量有多麼龐大。
不過,當今的巨量資料更多是來自於生活周遭,像是部落格(Blog)、社群網站上傳,或是透過智慧型手機、監視器與感測器產生的影音檔、圖片檔、文字檔。由於這些資料難以儲存在企業視為主流的「關聯資料庫」(relational database)中,因此被統稱為「非結構化資料」。
儘管如此,企業如果能夠運用語意分析技術,掌握資料中所顯示的「情緒」(例如正面或負面評論),就可以洞察消費者對於自家產品的評價與網路口碑,獲取具有管理與行銷價值的資訊,進而發掘、預測需求。
2.龐雜(variety)
除了分析存在於企業內部或外部的銷售與顧客資料(即「結構化資料」)之外,企業如今更要設法從「非結構化資料」搶先獲得寶貴的顧客需求情報,進而與銷售連結。
比方說,精品製造商萬寶龍(Montblanc)透過門市監視器的影像,取得了顧客消費行為與動線的龐雜資料,在抽絲剝繭後,將最暢銷的商品陳列在最能吸引顧客目光的位置。
又如手機通訊業者T-mobile,在門市裝設具有影片分析功能的監視器,藉此統計上門顧客的人數與動線,以及花費多少時間站在陳列櫃之前,甚至連顧客花了多少時間物色哪一款手機、在手上把玩多少時間都納入分析,進而掌握上門顧客的消費行為。
3.快速(velocity)
更新頻率快與資料產生速度快,也是巨量資料的特色之一。便利商店的銷售時點情報系統(POS,Point of Sale),分分秒秒都在產生大量的顧客消費資料;網拍公司eBay每分鐘賣出5個女用包、每兩分鐘成交一只鑽戒,一天處理的資料量(含交易、查詢等)也高達50TB,相當於3000個16GB隨身碟。
社群網站的盛行,帶動了以「非結構化資料」為主的巨量資料分析,促使企業不再能只滿足於「產品賣掉了」「顧客突然解約」等屬於點狀的「交易資料」(transaction data),而必須轉而探究「為什麼這項產品賣掉了?」「顧客為什麼突然解約?」等屬於線狀的「互動資料」(interaction data)。
而想要從「分析現狀」到「精準預測未來」,就必須將分析方法從「點」(交易資料)深化到「線」(互動資料)。
比方說,亞馬遜網站(amazon.com)透過網頁的點擊串流資料,追蹤使用者從進入到離開該網站的動線與行為,就是顧客與企業網站之間的互動資料。如果從中發現多數使用者點入某個頁面就跳開,代表該頁面需要改善「優使性」(usability,讓使用者在瀏覽網頁的過程中沒有壓力或挫折感,能以最少的力氣發揮最大的效能。)
商業智慧:從分析現狀到預測未來
由上可知,巨量資料的儲存、處理和分析,主要目的之一就是從中萃取出「商業智慧」:有組織、有系統地分析、彙整儲存於企業內外部的資料,從中汲取關鍵的概念、機制與活動,創造出有助於商業上各種決策的知識與洞見。
商業智慧一詞最早在1989年提出,時任研究機構顧能(Gartner)的分析師豪爾德‧最斯納(Howard Dresner)主張,銷售與顧客的分析工作應該要由資料的終端使用者(end user)、也就是經理人或工作者親自經手,而非委由資訊部門代為處理,才能達到迅速決策與提高生產力的目標。
時至今日,商業智慧已歷經了不同的轉變,從1980年代以出具分析報告為主,目的在於了解「過去發生什麼事」;到1990年代,透過多維分析(例如Excel、線上分析處理[OLAP,On Line Transaction Processing〕、資料查詢[query〕),嘗試了解「這件事為什麼發生」;進入21世紀的第一個十年,則以監控(儀表板[dashboard〕、計分卡[scorecard〕)分析「目前正在發生什麼事」;到了2010年代,透過預測分析、最佳化(資料探勘、文字探勘等)的技術,預測「未來將發生什麼事」。
在巨量資料與商業智慧的協助之下,企業與經理人的決勝點將不再取決於分析過去和現在,而在於預測未來,發掘出可能連消費者自己也不自知的需求。
當資料成為商場上的重要資源,而企業要透過公開、分享或買賣方式取得資料又非難事。
策略架構:買還是賣?公開還是保護?
野村總合研究所高級研究員城田真琴建議,企業在思考如何運用巨量資料時,可針對資料進行分類,以資料源自內部或外部、資料性質屬於核心或背景為兩條軸線,形成巨量資料時代的企業IT策略架構:
1.來自內部的核心資料:保護或賣出
企業內部獨有、對於其他企業來說也有價值的資料,像是POS系統資料、會員消費紀錄等,有助於和競爭對手形成差異化(differentiation)。
這類資料由於已存在於公司內部、容易取得,又是競爭對手很想拿到、市場價值極高的策略型資料,企業通常會將之歸類為「必須慎重保護」,絕不對外提供。不過,近來開始有些企業願意換個角度思考,「如果能為公司帶來極佳的利潤,不妨與其他企業策略聯盟共享或交換資料。」
2.來自內部的背景資料:公開或保護
企業獨有,但無法直接創造差異化以吸引顧客的資料,包括:總營收、銷售利潤等財務資料,或員工的履歷、往來e-mail等。這類資料的處理方式非常極端,不是公開就是保護(甚至要到嚴格保護的程度),像公開發行公司的財務資料依法就必須公開,但是員工的個人資料與e-mail就絕對不可外洩。
3.來自外部的核心資料:買入
其他企業獨有,但是自家企業迫切需要的資料,由於沒有對外公開,所以市場價值很高。對於企業來說,這是屬於即使要付出高昂代價也要入手的資料,像是其他企業的顧客資訊就是一例。
4.來自外部的背景資料:使用或買入
相較於核心資料,來自外部的背景資料(通常是政府公開的統計資料或地圖資料)多半可以免費使用或是以相對便宜的價格買入,所以市場價值並不高。不過,由於事涉該國政府是否願意公開統資料,因此相對來說較難取得。
城田建議,企業可以從「為了達到何種目的必須要有什麼資料;光靠內部現有資料是否夠用;如果不夠用,應該從外部取得何種資料」開始思考,建構巨量資料的應用策略,協助企業嗅出趨勢、創造「偶然的幸運」,精準預測顧客的需求。
看得到的是資料,看得懂的是資訊,用得出來的是情報。找出資料的價值,萃取可用的資訊,才能將巨量資料化為商業智慧,進而嗅出趨勢、預測未來、創造商機。
本文內容摘自以下網頁:
http://www.managertoday.com.tw/glossary/view/131
上一篇:小滿閱讀:把競爭力變動詞…
下一篇:芒種閱讀:「卸責、負責、當責」