從最早公元前2000年文字誕生起人類就開始采集數(shù)據(jù),到1998年正式提出大數(shù)據(jù)這一概念,實際上數(shù)據(jù)的發(fā)展已經(jīng)橫跨了上下4000多年的時間。在這一漫長的歷史演變中,人類共經(jīng)歷了四次工業(yè)革命,從最早以蒸汽技術(shù)為代表的工業(yè)1.0,到如今以智能和互聯(lián)網(wǎng)為代表的工業(yè)4.0,制造業(yè)也迎來了其全面蛻變的時刻——智能工廠時代的強(qiáng)勢來襲。
畢業(yè)于美國卡內(nèi)基梅隆大學(xué)、專注于制造業(yè)大數(shù)據(jù)研究的昆山杜克大學(xué)教授李昕認(rèn)為,在人工智能和大數(shù)據(jù)愈發(fā)滲透的今天,如何更好地收集數(shù)據(jù)、分析數(shù)據(jù)、利用數(shù)據(jù)才是企業(yè)根本。尤其是制造業(yè),作為立國之本,量級更是驚人,如何用數(shù)據(jù)助力智能制造,點“數(shù)”成金?
在李昕看來,數(shù)據(jù)分析在制造業(yè)應(yīng)用有兩大技術(shù)難點:第一個是數(shù)據(jù)變異性,第二個是工藝的變化。對于未來大數(shù)據(jù)的發(fā)展,李昕也表示,最大痛點在于“懂?dāng)?shù)據(jù)又懂行業(yè)”的雙料人才的匱乏。在這點上,不管是學(xué)校,還是企業(yè),都任重道遠(yuǎn)。
以下是李昕教授在2017IT 價值峰會暨中國企業(yè)級技術(shù)峰會上的演講,經(jīng)ITValue編輯整理:
我本人主要從事制造業(yè)大數(shù)據(jù)的研究,是臺灣富士康集團(tuán)總裁郭臺銘先生的大數(shù)據(jù)顧問,同時也是香港兩家公司的董事。
互聯(lián)網(wǎng)時代,數(shù)據(jù)暴增。目前每兩天創(chuàng)造的信息幾乎相當(dāng)于人類有史以來到2003年所創(chuàng)造的信息總和。這是什么概念?在美國,每分鐘就會產(chǎn)生2.04億封郵件,F(xiàn)acebook上會有180萬次的點贊、20萬張照片的上傳。而且這個量級還會隨著時間不斷上升,大概每1.2年就會翻一番。
如此龐大的數(shù)據(jù)量怎么才能很好利用?我們先來看一下大數(shù)據(jù)應(yīng)用的現(xiàn)狀。過去5-10年,大數(shù)據(jù)的發(fā)展主要集中在三個方向:圖像、視頻、語音。國內(nèi)外很多IT公司在這三個方向上都取得了非常成功的發(fā)展。今年3月,李克強(qiáng)總理在政府工作報告上強(qiáng)調(diào),要把人工智能、大數(shù)據(jù)推廣到各行各業(yè)中,包括商業(yè)、醫(yī)療、制造、教育、城市等。這意味著,未來大數(shù)據(jù)將會滲透到我們生活的每個環(huán)節(jié)中,發(fā)揮越來越重要的作用。
要利用數(shù)據(jù)就要先分析數(shù)據(jù)。大數(shù)據(jù)分析需要兩類人:數(shù)據(jù)分析專家和行業(yè)專家,二者缺一不可。谷歌過去十年一直在推自動駕駛技術(shù),但是兩年前意識到,自動駕駛并不是一個IT公司的數(shù)據(jù)專家就能單獨完成的事,還必須和各個整車廠包括本田、福特等的行業(yè)專家合作,共同研發(fā)產(chǎn)品。
智能工廠時代全面來臨
就制造業(yè)來說,數(shù)據(jù)量的龐大難以想象。中國具有強(qiáng)盛的制造業(yè),如果利用大數(shù)據(jù)把制造業(yè)的效率提高10%,那么創(chuàng)造的利潤非同小可。在美國,奧巴馬時期就提出了智能制造的戰(zhàn)略,歐洲老牌制造強(qiáng)國德國一直在提倡工業(yè)4.0,新加坡也有明確的規(guī)定國家GDP必須有15%-20%的貢獻(xiàn)是來自于制造業(yè)。
沒有制造業(yè),一個國家就喪失了生存之本。
回顧起來,制造業(yè)的發(fā)展大概經(jīng)歷了四次工業(yè)革命。
第一次工業(yè)革命發(fā)生于18世紀(jì)60年代,主要以蒸汽技術(shù)為代表的工業(yè)1.0時代;
第二次工業(yè)革命是在19世紀(jì)50年代,以電力為主要能源的工業(yè)2.0時代;
第三次是20世紀(jì)50年代,以計算機(jī)技術(shù)為代表,把計算機(jī)技術(shù)應(yīng)用到工業(yè)控制中的工業(yè)3.0時代;
最后一次就是當(dāng)今以智能和互聯(lián)網(wǎng)為代表的第四次工業(yè)革命即工業(yè)4.0時代。
這次工業(yè)革命對制造業(yè)來說非比尋常,它意味著智能工廠時代的全面來臨。什么是智能工廠?在每個工廠的每個車間的每個機(jī)臺上都安裝有很多傳感器,不斷地采集數(shù)據(jù),并對數(shù)據(jù)進(jìn)行分析,從而優(yōu)化生產(chǎn)線,降低成本。這個數(shù)據(jù)量有多大?制造業(yè)有一項技術(shù)叫自動光學(xué)檢測(AOI),每個零部件生產(chǎn)出來后都會被拍照檢驗質(zhì)量的好壞。倘若按每分鐘收集一張1M像素的圖片來估算,一臺機(jī)器一天產(chǎn)生的數(shù)據(jù)就是1.5G。每個工廠有N多個機(jī)臺,N多個傳感器,總的數(shù)據(jù)量可想而知。
大數(shù)據(jù)提升制造流程的4大應(yīng)用
這么多數(shù)據(jù)能拿來做什么?第一個應(yīng)用就是調(diào)度優(yōu)化。
在智能車間里,機(jī)臺與機(jī)臺之間的產(chǎn)品傳遞主要靠機(jī)械手臂來完成,而車間與車間之間的產(chǎn)品傳遞則是通過傳動帶來完成。所謂調(diào)度優(yōu)化就是通過數(shù)據(jù)分析,了解每個產(chǎn)品在每個機(jī)臺上需要處理的時間,然后決定出把某個產(chǎn)品送到哪個機(jī)臺去處理的最優(yōu)解決方案。這個事情看起來容易,操作起來卻很難,正如車輛在路上突然拋錨造成交通擁堵一樣,如果一個機(jī)臺出了問題,就會擾亂整個調(diào)度的優(yōu)化方案,更糟的是如果發(fā)現(xiàn)某個產(chǎn)品不合格,就需要被重新發(fā)配到某個機(jī)臺重新處理,那么就會導(dǎo)致整個調(diào)度非常復(fù)雜,處理不好就會造成“擁堵”,甚至停工。
大數(shù)據(jù)的另外一個重要應(yīng)用就是設(shè)備監(jiān)控。產(chǎn)品制造分許多步驟,如果第一道工序出了故障沒有立刻發(fā)現(xiàn),等生產(chǎn)出來之后經(jīng)檢測時才發(fā)現(xiàn),那就意味著這段時間里生產(chǎn)的全部產(chǎn)品都要報廢。這是個很嚴(yán)重的問題。設(shè)備監(jiān)控就是在每個機(jī)臺上都安置多個傳感器來監(jiān)測設(shè)備是否有故障。美國有個大型制造企業(yè),曾經(jīng)成品率總是提不上去,經(jīng)多方查找后才發(fā)現(xiàn),原來是一個機(jī)臺在清理時出了問題,早班清潔工是從上往下清理,晚班清潔工是從下往上清理,就是這樣一個個小小的瑕疵就會對整個生產(chǎn)線造成幾百萬甚至幾千萬美金的損失。
第三個應(yīng)用就是虛擬測試。在制造業(yè)中,測試占整個制造成本的25%-50%,怎么用大數(shù)據(jù)降低測試成本?最根本的一點就是利用數(shù)據(jù)的相關(guān)性,也就是用數(shù)據(jù)去分析不同的數(shù)據(jù)量之間是否相關(guān),如果存在相關(guān)就可以用一個數(shù)據(jù)量去估計另一個數(shù)據(jù)量。
這里有兩個例子,一個是空間的相關(guān)性。在集成電路制造中,一塊硅片包含很多芯片,傳統(tǒng)的方法是每個芯片都要去測試,如果我們把整塊硅片看作是一幅圖像,那么不同的像素對應(yīng)不同的芯片,像素點之間是有相關(guān)性的,我們可以通過測試少數(shù)幾個像素點的值,利用統(tǒng)計方法來估值另外的像素點,從而大大減少測試量。
另一個例子是給金屬塊鉆孔。鉆孔是否平整?是不是圓形?在制造業(yè)上是一個非常昂貴的測試過程。我們通過在鉆孔機(jī)上安裝各種非常廉價的傳感器,包括震動傳感器、聲音傳感器、壓力傳感器等,用這些傳感器的測試值去創(chuàng)建一個模型,然后預(yù)估鉆孔的平整度和質(zhì)量狀況,從而節(jié)省很大一筆成本。
第四個應(yīng)用是故障追蹤。監(jiān)控生產(chǎn)線中產(chǎn)品的制造過程,發(fā)現(xiàn)故障的根源。故障可能是某一個機(jī)臺,可能是某一種原材料,也可能是某一位操作員。
大數(shù)據(jù)分析在制造業(yè)應(yīng)用有兩大技術(shù)難點:第一個就是數(shù)據(jù)變異性,不同機(jī)臺,在不同時間、不同環(huán)境下的數(shù)據(jù)具有不同的統(tǒng)計特性,也就是說,在這個機(jī)臺上采集的數(shù)據(jù)不可能直接拿來去用于另一個機(jī)臺的建模。當(dāng)你把采集到的數(shù)據(jù)分配到每個機(jī)臺、每個時間點、每個不同的環(huán)境條件下去做分析的時候,你會發(fā)現(xiàn)數(shù)據(jù)量其實并不大,甚至很小。另外一個難點是工藝的變化。制造工藝隨時間在不斷演變,同樣一個產(chǎn)品,今年制造出來的測試結(jié)果和明年制造出來的測試結(jié)果完全不同,因為產(chǎn)線在不斷變化,這是大數(shù)據(jù)分析的一個軟肋。我們分析的數(shù)據(jù)都是歷史數(shù)據(jù),所以大數(shù)據(jù)分析實際上就是兩步,第一步記錄歷史數(shù)據(jù),第二步根據(jù)這些歷史數(shù)據(jù)去預(yù)測未來。如果由于工藝變化導(dǎo)致未來和歷史是不一致的,那么大數(shù)據(jù)分析的最根本假設(shè)就已經(jīng)不成立了。這也是大數(shù)據(jù)分析的一個痛點所在。
怎么去解決這一問題?從我來看,大數(shù)據(jù)未來發(fā)展的一個最大難點就是缺乏復(fù)合型的人才。要找到一個既懂?dāng)?shù)據(jù)又懂專業(yè)領(lǐng)域的雙料人才非常困難,所以培養(yǎng)跨學(xué)科的人才是我們昆山杜克學(xué)校的一個重要任務(wù)。
昆山杜克大學(xué)剛剛成立了一個大數(shù)據(jù)中心,里面有很多昆山杜克大學(xué)的教授,以及美國杜克大學(xué)的教授,我們一起合作致力于中國大數(shù)據(jù)人才的培養(yǎng),也希望與中國的企業(yè)合作共同貢獻(xiàn)一份力量。