工業(yè)大數(shù)據(jù)的未來發(fā)展方向——從阿里和航天說起

郭睿 瑞翼大數(shù)據(jù)創(chuàng)新中心 2016-12-13 08:41:26

2016年12月5日,清華大數(shù)據(jù)技術(shù)·前沿系列講座——“工業(yè)大數(shù)據(jù)的技術(shù)趨勢與應(yīng)用場景”在清華大學(xué)FIT樓多功能廳成功舉辦,本期講座邀請到了阿里巴巴集團副總裁、阿里云業(yè)務(wù)總經(jīng)理劉松、航天科工集團航天云網(wǎng)科技發(fā)展有限公司副總經(jīng)理祝守宇和阿里云事業(yè)群數(shù)據(jù)業(yè)務(wù)總架構(gòu)師周衛(wèi)天來為大家介紹工業(yè)大數(shù)據(jù)的建設(shè)背景、發(fā)展現(xiàn)狀、國家戰(zhàn)略、發(fā)展趨勢、競爭對手、發(fā)展啟示及建設(shè)意義。

劉總主要從三個層面的角度分享了他的想法。

一、數(shù)據(jù)技術(shù)(Data Technology)的發(fā)展趨勢作。目前數(shù)據(jù)成為互聯(lián)網(wǎng)平臺企業(yè)的關(guān)鍵技術(shù),包括蘋果、谷歌、亞馬遜等全球十大科技公司都逐漸演變成數(shù)據(jù)化、智能化的平臺公司。數(shù)據(jù)技術(shù)的(DT)發(fā)展將對各行各業(yè)產(chǎn)生影響,新一代信息技術(shù)的優(yōu)化使得全球的軟件定義、數(shù)據(jù)驅(qū)動的商業(yè)模式逐步明顯,數(shù)據(jù)智能也會在各個傳統(tǒng)行業(yè)得以應(yīng)用。

二、中國工業(yè)互聯(lián)網(wǎng)的路徑選擇。德國公司發(fā)展工業(yè)4.0的原因是害怕谷歌、facebook等互聯(lián)網(wǎng)平臺公司對消費互聯(lián)網(wǎng)數(shù)據(jù)的控制,提出工業(yè)4.0與其抗衡;而美國以GE為代表推出了predix平臺,但仍然采用著將軟件工程作為工業(yè)附屬的操作模式,這種模式目前看來可行,但是橫向擴展有限,而美國東西海岸的科技界對此仍處于不合作狀態(tài)。目前在中國,基于良好的移動互聯(lián)網(wǎng)經(jīng)濟,如果將互聯(lián)網(wǎng)的平臺模式和傳統(tǒng)工業(yè)(包括汽車、飛機、機床、能源互聯(lián)網(wǎng))等產(chǎn)業(yè)結(jié)合起來,探索出新的跨界重混模式,會因為巨大互補效應(yīng)而產(chǎn)生化學(xué)反應(yīng),中國制造業(yè)可能會走上一條換道升級的路徑。

三、中國工業(yè)大數(shù)據(jù)的挑戰(zhàn)與機遇。目前中國的工業(yè)生產(chǎn)模式很重,通過數(shù)據(jù)智能改進的產(chǎn)業(yè)機會非常大。除了技術(shù)和產(chǎn)品層,中國工業(yè)大數(shù)據(jù)要解決的非技術(shù)挑戰(zhàn)主要有兩點:一是文化的問題。工業(yè)企業(yè)文化和互聯(lián)網(wǎng)企業(yè)文化差異很大,要解決work together的問題;二是人才的問題。這個領(lǐng)域需要的人才非常廣泛,要有對工業(yè)本身理解的人才,需要了解具體的生產(chǎn)工藝,要有工業(yè)軟件人才、要有數(shù)據(jù)處理的人才,這個領(lǐng)域是一個絕對跨界融合的產(chǎn)業(yè),難點在于跨界合作的人才集成。工業(yè)大數(shù)據(jù)的推進問題,我們首先考慮的是能不能把人才高效地積聚起來。人的要素、文化的要素是推進工業(yè)大數(shù)據(jù)兩個最重要的因素。

航天科工集團航天云網(wǎng)副總經(jīng)理的祝守宇為大家分享工業(yè)互聯(lián)網(wǎng)和工業(yè)大數(shù)據(jù)的應(yīng)用

整體技術(shù)框架

那么如何看待工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)呢?通過與消費互聯(lián)網(wǎng)對比,我們可以得到更好的理解。消費互聯(lián)網(wǎng)時代是以人的連接為主,主要形式實際上是手機和PC,手機數(shù)據(jù)量又遠遠超過PC。它的數(shù)據(jù)產(chǎn)生于三個方面,PC、手機、消費型智能硬件(手環(huán)、手表)。工業(yè)互聯(lián)網(wǎng)以機器生產(chǎn)系統(tǒng)為主,數(shù)據(jù)來源主要有三項。第一個是復(fù)雜裝備,第二是生產(chǎn)體系,第三個是工業(yè)級的智能硬件,比如說空調(diào)、充電裝置、路燈等等小型的裝備,大的復(fù)雜裝備包括航空發(fā)動機等等。全球的物聯(lián)網(wǎng),連接進網(wǎng)的設(shè)備,預(yù)計到2019年大概是250億個,PC和手機大概八九十億。從設(shè)備鏈接的數(shù)量來看,工業(yè)設(shè)備的聯(lián)網(wǎng)要遠超消費聯(lián)網(wǎng)。

消費聯(lián)網(wǎng)的啟示

我們來分析一下消費互聯(lián)網(wǎng)的產(chǎn)業(yè)鏈條。消費互聯(lián)網(wǎng)的產(chǎn)業(yè)鏈條是通過手機和PC產(chǎn)生數(shù)據(jù),通過基礎(chǔ)平臺運營商為鏈接(移動、聯(lián)通等),在運營商之上產(chǎn)生BAT類似的應(yīng)用,這一類應(yīng)用從運營商的角度來講叫OTT。整個產(chǎn)業(yè)的推動實際上是通過運營商來完成的,向下來推動手機和智能硬件的發(fā)展,向上推動應(yīng)用的發(fā)展,當(dāng)然最有價值的就是這個行業(yè)的推動者。

同樣的,工業(yè)互聯(lián)網(wǎng)中采用的數(shù)據(jù)不一樣但數(shù)據(jù)設(shè)備仍然是最頂層的基礎(chǔ),往上一層是現(xiàn)代的云計算大數(shù)據(jù)平臺,是像航天云網(wǎng)和阿里這樣的企業(yè)等等,再上面的是一些工業(yè)級的應(yīng)用,所以從產(chǎn)業(yè)推動來講,跟消費互聯(lián)網(wǎng)很類似。最終價值和重要性,需要靠中間的平臺層去推動整個產(chǎn)業(yè)的發(fā)展。借助業(yè)界的大拿講的話,“遠景清晰可見,工業(yè)互聯(lián)網(wǎng)”是變革的真正機遇,這將遠遠超越“消費互聯(lián)網(wǎng)”。

相比于大數(shù)據(jù)技術(shù)在消費級互聯(lián)網(wǎng)中的應(yīng)用,我們的工業(yè)大數(shù)據(jù)是大家更應(yīng)該投入的產(chǎn)業(yè),這是一件舉足輕重的大事,我們也能夠在更大的舞臺上,做出更多對人類發(fā)展有巨大貢獻的事?!百Y源共享、能力協(xié)同、開放合作、互利共贏”是航天云網(wǎng)人的企業(yè)內(nèi)涵和精神理念,作為國家的戰(zhàn)略性平臺,歡迎大家加入我們的隊伍,也歡迎大家跟我們合作。

阿里云事業(yè)群數(shù)據(jù)業(yè)務(wù)總架構(gòu)師周衛(wèi)天老師為大家?guī)砭实难葜v

周衛(wèi)天老師通過融合一些案例對整個大數(shù)據(jù)領(lǐng)域的技術(shù)發(fā)展趨勢與工業(yè)大數(shù)據(jù)的技術(shù)驅(qū)使向在場的觀眾進行分享。

信息革命2.0:DT時代正式開啟

DT時代已經(jīng)來臨。數(shù)據(jù)取代石油,成為全球經(jīng)濟基礎(chǔ)要素。IT技術(shù)成為重要生產(chǎn)力,云計算成為基礎(chǔ)設(shè)施,互聯(lián)網(wǎng)+物聯(lián)網(wǎng)構(gòu)成萬物互聯(lián)的信息交互渠道,全球市值TOP5第一次全部都是科技公司:Apple,Google,微軟,Amazon,F(xiàn)acebook全部是云化、數(shù)據(jù)化、智能化的公司。

2009年,馬云先生講了阿里巴巴是一家數(shù)據(jù)公司,在2010年的時候,馬云先生反復(fù)強調(diào)要做云計算,堅持發(fā)展云計算。數(shù)據(jù)平臺的核心是軟件能力,未來五年,大數(shù)據(jù)的發(fā)展趨勢就包括延伸軟件平臺,把傳感的技術(shù)、芯片的技術(shù)集成起來。

大數(shù)據(jù)趨勢分析與展望

數(shù)據(jù)分析處理能力實戰(zhàn)錘煉


阿里在實戰(zhàn)中的阿里大數(shù)據(jù)是怎么來的?首先體現(xiàn)在支付能力上。剛剛過去的“雙十一”,阿里有兩個驚人的數(shù)據(jù),12萬筆/秒支付的頂峰; 峰值支持能力10分鐘,30分鐘壓測能力,10.5億筆總支付的記錄,電商平臺、螞蟻支付拉高了整個阿里體系的技術(shù)能力。這類金融系統(tǒng)每秒十幾萬筆是非常了不起的數(shù)據(jù)。

阿里在數(shù)據(jù)處理上的經(jīng)驗總結(jié)為兩點。第一,是數(shù)據(jù)處理,第二,是人工智能。阿里有一個天池平臺,由于支持大量多業(yè)務(wù),今天阿里已經(jīng)有了幾百萬張表。在我們國家,比如一些大的部委,十幾萬張或者是幾十萬張表已經(jīng)很大了,當(dāng)我們處理百萬張表的時候,建模就不能用傳統(tǒng)的方式來做。按照我的主要業(yè)務(wù)營銷、財務(wù)、實踐模塊,把表與表之間的關(guān)系,設(shè)計地非常圓滿,然后基于這個之上再來開發(fā)應(yīng)用。在阿里,因為互聯(lián)網(wǎng)的快速增長、野蠻增長,來一個業(yè)務(wù)就建一個表,一個表拉幾個字段,每晚會對增量數(shù)據(jù)進行對比,這是阿里本身的一套技術(shù)體系。所有元數(shù)據(jù)表,每一個字段都有一個開發(fā)的同學(xué)認領(lǐng),對主要的所有字段都會按照數(shù)據(jù)的級別、按照業(yè)務(wù)的重要程度、調(diào)用的頻率排重要度進行排列。數(shù)據(jù)之后會經(jīng)平臺的甄別來判定數(shù)據(jù)的可信程度。確保了數(shù)據(jù)質(zhì)量的準(zhǔn)確性、唯一性,數(shù)據(jù)的準(zhǔn)確性對數(shù)據(jù)分析至關(guān)重要。

阿里大數(shù)據(jù)平臺于數(shù)據(jù)智能

數(shù)據(jù)智能平臺

第二,今天,阿里云后面有一支比較大的團隊做視覺智能、語音智能。將數(shù)據(jù)打通,包括線上線下的數(shù)據(jù),網(wǎng)上的虛擬身份的ID,怎么跟電話號碼、身分證號碼怎么打通,把數(shù)據(jù)進行有效的利用。阿里擁有一個天池眾智平臺,所有涉及到高級算法、智能算法的問題,通過眾智平臺,由阿里自己的科學(xué)家把問題的目標(biāo)、問題進行分解,平臺上五萬名科學(xué)家和算法愛好者提供一個最好的方案。正是因為這樣一個大數(shù)據(jù)智能平臺才支撐了阿里形形色色的業(yè)務(wù)。

阿里的登月歷程與選擇

阿里在2013年開啟登月工程,把原來很多的業(yè)務(wù)、支付寶、小貸、集團的B2B,以及后來已經(jīng)開始有收購的業(yè)務(wù),做到統(tǒng)一的平臺上來。

階段一:阿里啟動前約2到3個月進行了全面的工作準(zhǔn)備,進行了公共平臺和服務(wù)層的建設(shè)搭建;數(shù)據(jù)規(guī)范、指標(biāo)體系、數(shù)據(jù)安全、質(zhì)量控制的流程制度及工具的開發(fā);成立了登月數(shù)據(jù)委員會(全職同學(xué)不同時期約七到十人左右;虛擬團隊的同學(xué)每個主要業(yè)務(wù)團隊都規(guī)定了對接接口的同學(xué))

階段二:2014年正式啟動從云梯1遷移到云梯2的過程,最終分解為幾十個登月項目。云梯2中開發(fā)、調(diào)度、質(zhì)量控制和元數(shù)據(jù)管理Meta是全新的、不一樣的一套體系。比如:DQC和ODPS底層的大數(shù)據(jù)統(tǒng)計分析功能、計量功能的演化。光是元數(shù)據(jù)Meta管理和統(tǒng)計分析的模式和云梯1里面的Oracle庫、GP庫、開源Hadoop庫很不一樣。2015年6月所有老系統(tǒng)全部接管,完成了新舊系統(tǒng)的并除。

阿里登月的啟示

對于大數(shù)據(jù)的技術(shù)走向和趨勢,周總提到了三點:

一、智能化

所謂智能化本質(zhì)上是計算機化,不是固定僵硬的系統(tǒng),而是能自動執(zhí)行程序、可編程可演化的系統(tǒng),更高的要求是具有自學(xué)習(xí)和自適應(yīng)功能。無人自動駕駛汽車是智能化的標(biāo)志性產(chǎn)品,它融合實時感知、 導(dǎo)航、 自動駕駛、 聯(lián)網(wǎng)通信等技術(shù),比有人駕駛更安全、更節(jié)能。

大數(shù)據(jù)發(fā)展趨勢

二、個性化

個性化的背后是大數(shù)據(jù)和視覺識別技術(shù)的發(fā)展。人臉識別、語音智能、OCR證件的認證,這是個性化很早的一面。最新的語音識別的數(shù)據(jù)是利用深層的神經(jīng)網(wǎng)絡(luò),正是由于現(xiàn)在數(shù)據(jù)的爆發(fā),以及計算處理能力的提升,也就是GPU很多的能力,今天生成的神經(jīng)網(wǎng)絡(luò)已經(jīng)能夠計算到12層、13層了。

個性化的數(shù)據(jù)庫。以某衣服制造廠商的數(shù)據(jù)庫為例,其版型數(shù)據(jù)庫能做到3000+版型/天,而如果使用手工打版,每天生產(chǎn)1200多套西服的紅領(lǐng),至少需要500多個打版師傅。款式數(shù)據(jù)庫,這是實現(xiàn)客戶訂單提交、產(chǎn)品設(shè)計、生產(chǎn)制造、采購營銷、物流配送、售后服務(wù)一體化的開放性互聯(lián)網(wǎng)平臺,做到了個性化和融合化的完美契合。

個性化的搜索引擎-千人千面。實時預(yù)測用戶對物品偏好,個性化推薦,千人千面,支持定制推薦算法。

差異化的核心能力

三、融合化

大數(shù)據(jù)跟工業(yè)制造當(dāng)中的特征工程是可以結(jié)合的,讓大數(shù)據(jù)去完善、加強原來特征工程中對于工業(yè)制造的質(zhì)量控制、質(zhì)量改善、良品率的提升,同時大數(shù)據(jù)的分析能做傳統(tǒng)特征工程不能做的事情。

大數(shù)據(jù)融合特征工程

智能工廠、貨運列車故障檢測需求分析、重型的設(shè)備公司等等,這些重型機械企業(yè)都在轉(zhuǎn)型,通過大數(shù)據(jù)可以預(yù)測出最有價值的客戶,甚至在融資、將來設(shè)備的租賃方面等都有貢獻。

我們的大數(shù)據(jù)跟工業(yè)的特征工程、傳統(tǒng)經(jīng)驗融合起來,產(chǎn)生更多的智能,從而讓大數(shù)據(jù)能夠真正地為智能制造、互聯(lián)網(wǎng)+的華麗轉(zhuǎn)身做一點貢獻、做一點力量。



長按二維碼關(guān)注我們