2014-08-13

Big Data

Big Data 的觀念突然間在台灣紅了起來。這個早十幾年前就已經在國外變成重要的學科,今天台灣卻還沒有一個系所針對這個學科做起重要的基礎工作。教育是否是為了產業而存在,如果是,當然"現在"找不到Big Data的人才。從現在開始台灣要加強這方面的教育,來得及嗎?十年前就要了解到的學科,卻不付出資源去培養,只看到十年前半導體的產業,培養出一堆的硬體人員。這樣的教育,都是在教舊思維的東西,無法開創新局,也難怪集體的思維如此落後。

我們來看看Big Data所能帶來的重要哲學意義。人們收集很多的資料真正的動機就是要預測未來。如果你沒有想要預測未來,卻努力的收集了很多資料,那只能說你有個人的興趣在裡頭。但不管如何,一旦興趣被滿足了,所理解的東西還是會用在未來。這就是收集資料的意義。為什麼我們那麼在意未來,因為對於未來,人們一直是害怕和恐懼的,因為未來就是未知,人們害怕和恐懼的是未知。就像未來學家Jacque Fresco說的,當伽利略從山上撿到一塊貝殼,拿到教會跟教會的人說,這山原本沉在海裡。教會的人說,那是惡魔故意放在山上的,為的就是迷惑人們。教會為什麼這樣說,因為他沒有辨法解釋為什麼貝殼在山上。同樣的,把人丟進去火山獻祭,把人丟到海裡獻祭,把人丟到山裡獻祭,都是因為無知。現在!沒有人這樣做了,因為我們知道火山為什麼爆發,海嘯為什麼發生,山崩為什麼存在,把人丟進去獻祭沒法阻止這些現象發生。其實這也算是有進步啦!儘管花了幾百年。啊!對,把人丟進去火山的做事說了一半。獻祭過一個人後,火山又爆發了。這些人很害怕的跑去問猶長。猶長說,因為你只獻祭一個不夠,要再把你們的叔叔伯伯爺爺奶奶都丟進去。對了,我看過一個女孩,從小就便秘到現在,她說,醫生說多吃纖維素的東西。我說,如果吃了還是便秘怎麼辨?她說,那就是吃不夠多!

各位,即使到今天資訊這樣發達,我們的思維還是沒有多大的改變,只是情境不同!

要能建出預測未來的模型之前就要先分析資料,分析資料就是真正的學問所在了。例如說,冰淇淋賣很好的時候,森林火災也特別多。例如說,每一個生病的人身上都有病菌。例如說,印度牛賣的很好的時候,美國股市就會漲。例如說,章魚哥跟足球賽的關係。這些資料我們收集了之後是否會把相關性誤當為因果性?冰淇淋賣很好跟火災,就只是因為天氣太熱。生病的人身上都有病菌是因為這些人的身體都進入了病菌容易生長的酸鹼值。牛賣的好跟股市的關係只是一個巧合,現實生活上我們可以找到許多股市上漲,同時也賣得好的東西。章魚哥跟足球賽的關係更是人們腦中的多巴胺分泌太多了。

最近,聽說有一些科技工廠也想要搞 Big Data 這個技術,試著收集所有工廠內生產的參數,包含壓力、溫度、材料、時間、電壓,甚至是進貨廠商、價錢、到最後的生產結果。等到收集夠多之後,分析一個模型出來,讓所有參數與生產的結果巨細靡遺的關係都呈現出來。就可以讓模型有自我修正的功能。結果,工廠就變成活的了,有了生命了。有一天我們在工廠外看進去,所有的機器都一往如常的運作,知道每一道工序的結果,反過來調整機器自己本身,產能不會下降,也不會出錯,最重要的是沒有人的存在,但生產還是相當順利。所以高失業率就會發生!這代表全面自動化的到來。

現實生活上(以下括號內為秘密,所以字體要縮小,請見諒),政府的全面 e 化(收集我們的稅務,收入,財產...),大賣場的會員卡 (收集我們購物的習慣),每年各公司的身體檢查 (收集我們的健康狀況,是否有被額外的收集而未告知我們?例如DNA。像某些醫院鼓勵人們捐某些特定的身體組織,現在他有全球最大的資料庫了,是不是該共享?),手機上網(收集我們身在何處,上網習慣,購物習慣。),手機通話(收集我們朋友關係, 通話時間。),電腦上網 (收集我們上網的習慣,購物的習慣,使用體驗。),我們時時刻刻都被收集資料,而重點是掌握我們這些資料的人,他們會如何使用我們的資料?這是一把雙面刃。

我們再回到big data 的討論,如果工廠收集的東西不只是壓力溫度相關材料,野心大一點,加上收集天上星星的位置、星象、太陽的位置、月亮的位置和二十四節氣,會不會發現每次木星比較接近地球時,製程容易出錯?會不會發現產量跟月亮的周期有關?會不會每天半夜的時候,有一些工法就會不準確。

如果真的是這樣,是不是可以收集人生病的狀態、症狀、使用藥物、天上星星的位置、星象、太陽的位置、月亮的位置、每一年的節氣、每一年的月分、每一個人的生日、年紀和出生節氣。最後分析出一個相關性進而推論因果性。這個目前沒人做,因為這要理論基礎!

基本上,人生病跟天象有關,中壢的老彭已經把他幾十年看過的病歷做出表格來,原來人生病跟病菌沒有關係,跟天象有關係!這就是五運六氣,當老彭驚喜之時,覺得自己看到了自然宇宙的真理,黃帝內經兩千年前就記錄了相同的表格!我相信,如果分析人生病的症狀和藥物的關係,分析的結果就是仲景的傷寒雜病論。與今日之差別就是仲景用人腦分析資料,得到傷寒論,而現今可以用電腦分析來得到相同結果。

如果我們真得到這個階段還沒滅亡。那麼,就會發現原來人類是不可獨立於宇宙之外的。人類社會也就會進入一個新的境…

二三子:夫子我有問題…為什麼會滅亡,可以這樣分析所有資料不是很好嗎?
夫子:唉,我本來只想讓你們了解世界美妙的一面啊!

回到工廠活起來這件事,如果鴻海的百萬大軍有90%的人沒有工作,那怎麼辨?如果社會上所有的工廠都活起來,失業率高到爆怎麼辨?這時就革命了。

如果有人從醫院得到了每個人身體的資料,發現擁有某些身體組識特徵的人,就會從事某種職業(這就是中醫的命相),然後把人類分類了,貼上標簽了,半夜有人來敲你家的門。說,此次你的健康檢查我們發現你的肝比別人大,我們發現這種特徵是貧窮特徵,要抓去勞改,怎麼辨?這時就要革命了。

如果警察抓了你說手機業者發現你通話的時間地點怪異,他們覺得你預謀犯罪,怎麼辨?這時就要革命了。

如果大賣場告訴你的老婆,因為你這個月來的購物狀況,他們預估你就要出軌找小三了,怎麼辨?這時就要革命了。

如果facebook分析了你的留言,通知所有人你是戀童癖,怎麼辨?這時就要革命了。

當所有革命在未來一個接一個發生的話,人類可能就會毀滅自己了。

二三子:夫子,雙面刃啊!為什麼不是…

工廠活起來,從此人們不用工作,可以花更多時間創造美好。從此過著幸福快樂的日子。

醫院得到了每個人身體的資料,發現擁有某些身體組識特徵的人,就會從事某種職業(這就是中醫的命相),然後把人類分類了,貼上標簽了,半夜有人來敲你家的門。說,此次你的健康檢查我們發現你的肝比別人大,你很適合做探險宇宙的工作,我們很需要你的幫助。從此過著幸福快樂的日子。

警察因為手機業者發現你通話的時間地點怪異,他們覺得你需要幫助,快速找到了你,幫你脫離險境。從此過著幸福快樂的日子。

大賣場告訴你的老婆,因為你這個月來的購物狀況,他們預估你還會需要一台公路自行車,推薦你老婆貼心的買給你。從此過著幸福快樂的日子。

facebook分析了你的留言,通知跟你一樣是羅莉控的人跟你成為朋友。

夫子的天眼看到了發光的未來…
夫子:很好,我們應該為這樣的未來而努力!


ads2

如何順其當然聽自然

想當然,自然聽自然。
聽自然,當然想當然。