人工智能加碼企業(yè)服務(wù),開(kāi)數(shù)科技幫助企業(yè)挖掘深度數(shù)據(jù)價(jià)值

黃志磊 億歐 2017-02-17 09:35:51

商業(yè)數(shù)據(jù)分析有很多種,以日志數(shù)據(jù)為代表的機(jī)器數(shù)據(jù)是互聯(lián)網(wǎng)公司最常見(jiàn)數(shù)據(jù)之一,國(guó)際上,提供日志分析業(yè)務(wù)的Splunk公司也已實(shí)現(xiàn)幾百億人民幣市值。作為企業(yè)方數(shù)據(jù)資產(chǎn)之一,日志等機(jī)器數(shù)據(jù)承載著企業(yè)中諸多過(guò)程記錄信息,基于這些數(shù)據(jù),更多價(jià)值點(diǎn)值得企業(yè)方與數(shù)據(jù)分析公司合作進(jìn)行深度挖掘,以便增進(jìn)營(yíng)收、減少成本并優(yōu)化效率。 

人工智能

致力于非結(jié)構(gòu)化數(shù)據(jù)分析的開(kāi)數(shù)科技(OPEN01)利用“日志分析+NLP(Natural Language Processing,自然語(yǔ)言處理)”,實(shí)現(xiàn)實(shí)時(shí)企業(yè)大數(shù)據(jù)分析,為企業(yè)提供全面且完善的數(shù)據(jù)分析服務(wù)。其技術(shù)合伙人Samuel Lee博士作為麻省理工大學(xué)計(jì)算科學(xué)與人工智能實(shí)驗(yàn)室(MIT-CSAIL)科學(xué)家,在大數(shù)據(jù)與人工智能方面有著深刻技術(shù)背景,曾主持研發(fā)了BioModels量化模型全球數(shù)據(jù)標(biāo)準(zhǔn)與系統(tǒng),并被記載入歐盟ISBE方案架構(gòu)書(shū);商業(yè)合伙人熊梓鍇博士則是擁有深厚商業(yè)數(shù)據(jù)分析從業(yè)經(jīng)歷的戰(zhàn)略運(yùn)營(yíng)管理專(zhuān)家,曾在著名咨詢(xún)公司羅蘭貝格(Roland Berger,國(guó)際知名管理咨詢(xún)公司)從事戰(zhàn)略咨詢(xún)、世界五百?gòu)?qiáng)企業(yè)Bayer醫(yī)藥負(fù)責(zé)戰(zhàn)略管理與銷(xiāo)售效能管理、并曾在凱博(Copal Partners,全球化金融分析和行業(yè)研究公司)擔(dān)任過(guò)高級(jí)分析工作,在創(chuàng)立開(kāi)數(shù)科技之前,熊博士還是精準(zhǔn)醫(yī)療公司Genetron Health泛生子創(chuàng)始團(tuán)隊(duì)成員。

談起開(kāi)數(shù)科技創(chuàng)立契機(jī),熊博士表示:過(guò)往咨詢(xún)和戰(zhàn)略從業(yè)經(jīng)歷,使其有機(jī)會(huì)在多個(gè)行業(yè)領(lǐng)域,接觸到企業(yè)內(nèi)部最真實(shí)的數(shù)據(jù)分析需求。這其中有超過(guò)80%數(shù)據(jù)是以非結(jié)構(gòu)化的形式存在,這些數(shù)據(jù)結(jié)構(gòu)復(fù)雜多樣、數(shù)據(jù)關(guān)聯(lián)性較差。在企業(yè)實(shí)際商業(yè)決策過(guò)程中,原始數(shù)據(jù)結(jié)構(gòu)并不適合直接展開(kāi)分析,在結(jié)構(gòu)層面就對(duì)數(shù)據(jù)分析造成困難,更無(wú)法從多個(gè)維度聯(lián)系數(shù)據(jù)并產(chǎn)生商業(yè)價(jià)值。 

早在十年前,熊博士就曾與Samuel博士在劍橋結(jié)識(shí)。由于專(zhuān)業(yè)關(guān)系,二人曾多次討論商業(yè)與數(shù)據(jù)分析結(jié)合可能性,以及如何最終實(shí)現(xiàn)“讓計(jì)算機(jī)讀懂?dāng)?shù)據(jù)”這一目標(biāo)。彼時(shí)二人發(fā)現(xiàn),數(shù)據(jù)分析有兩個(gè)難點(diǎn)尚未解決:首先是企業(yè)對(duì)數(shù)據(jù)分析需求還未充分產(chǎn)生,行業(yè)普遍還處于信息化的初級(jí)階段;其次是計(jì)算能力和算法發(fā)展仍不足,在當(dāng)時(shí)還缺乏完備機(jī)器學(xué)習(xí)算法能讓計(jì)算機(jī)擁有對(duì)大規(guī)模數(shù)據(jù)閱讀能力和自我提升。 

也正是從那時(shí)起,二人就開(kāi)始在技術(shù)和商業(yè)需求方面進(jìn)行探索,最終在2016年創(chuàng)辦成立開(kāi)數(shù)科技,寓意“打開(kāi)數(shù)字,挖掘并展示數(shù)據(jù)深層價(jià)值”。在IT設(shè)備儲(chǔ)存數(shù)據(jù)已常態(tài)化的今天,數(shù)據(jù)價(jià)值挖掘卻越來(lái)越難,其中一個(gè)主要原因在于非結(jié)構(gòu)化數(shù)據(jù)不能簡(jiǎn)單實(shí)現(xiàn)結(jié)構(gòu)化。對(duì)此,熊博士向億歐介紹,從技術(shù)難度來(lái)說(shuō),對(duì)日志等機(jī)器數(shù)據(jù)、以及文本等自然語(yǔ)言這些非結(jié)構(gòu)化數(shù)據(jù)的分析是數(shù)據(jù)行業(yè)難點(diǎn)。首先一個(gè)原因在于數(shù)據(jù)量:非結(jié)構(gòu)化數(shù)據(jù)占比非常巨大,而日志、文字等文本數(shù)據(jù)之間又存在強(qiáng)聯(lián)系,大量數(shù)據(jù)和交叉維度分析對(duì)計(jì)算機(jī)處理能力提出了高要求;其次,數(shù)據(jù)分析結(jié)果的實(shí)時(shí)性也逐漸被企業(yè)重視,并對(duì)IT架構(gòu)提出更高要求,傳統(tǒng)BI(Business Intelligence,商業(yè)智能)分析軟件在進(jìn)行數(shù)據(jù)智能化分析時(shí)很難實(shí)現(xiàn)實(shí)時(shí)分析,大數(shù)據(jù)量使得系統(tǒng)計(jì)算壓力驟增,而難以掌握實(shí)時(shí)分析結(jié)果,則直接影響企業(yè)決策的制定和實(shí)施。 

基于此,開(kāi)數(shù)科技著眼于現(xiàn)有企業(yè)數(shù)據(jù)分析需求和物聯(lián)網(wǎng)發(fā)展前景,開(kāi)發(fā)了“朗錄”(CAMPASS)平臺(tái)軟件,通過(guò)云端服務(wù)和軟硬一體機(jī)形式,為中型和大型客戶(hù)提供機(jī)器數(shù)據(jù)分析的企業(yè)服務(wù)。 

其中朗錄的網(wǎng)絡(luò)服務(wù)器模塊通過(guò)挖掘服務(wù)器日志數(shù)據(jù),為企業(yè)提供一下功能:

1)運(yùn)營(yíng)維護(hù):通過(guò)日志分析判斷諸如網(wǎng)站故障等原因,并提供防護(hù)建議,檢查日常運(yùn)營(yíng)過(guò)程中可能出現(xiàn)的潛在風(fēng)險(xiǎn)與故障原因;

2)精準(zhǔn)營(yíng)銷(xiāo):在日志中不乏用戶(hù)大量行為記錄,企業(yè)可以獲得精準(zhǔn)用戶(hù)畫(huà)像,為營(yíng)銷(xiāo)提供數(shù)據(jù)支撐;

3)合規(guī)審計(jì):日志作為服務(wù)器最本源的機(jī)器數(shù)據(jù),被認(rèn)為是最佳的“信息取證”來(lái)源,有助于了解企業(yè)目前的規(guī)范性是否達(dá)標(biāo),并作為審計(jì)跟蹤的有力支撐。 

基于云端SaaS服務(wù),企業(yè)用戶(hù)可以隨時(shí)通過(guò)互聯(lián)網(wǎng)獲取數(shù)據(jù)分析結(jié)果。更重要的是,作為大數(shù)據(jù)分析產(chǎn)品,朗錄實(shí)現(xiàn)了實(shí)時(shí)數(shù)據(jù)可視化查看,通過(guò)二維重構(gòu),企業(yè)用戶(hù)可實(shí)時(shí)查看地理、時(shí)間等多維度下數(shù)據(jù)分析結(jié)果,方便企業(yè)及時(shí)做出經(jīng)營(yíng)調(diào)整,真正實(shí)現(xiàn)對(duì)現(xiàn)實(shí)業(yè)務(wù)驅(qū)動(dòng)與改善。  

而在人工智能方面,開(kāi)數(shù)科技則是通過(guò)NLP技術(shù)及機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)強(qiáng)文本挖掘和知識(shí)網(wǎng)絡(luò)搭建。上述技術(shù)帶來(lái)的革新意義在于:NLP可以讓計(jì)算機(jī)直接讀懂自然語(yǔ)言數(shù)據(jù),結(jié)合機(jī)器學(xué)習(xí)算法分析,可以讓數(shù)據(jù)處理更為高效、產(chǎn)出更有價(jià)值的分析結(jié)果。以用戶(hù)訪(fǎng)問(wèn)為例,區(qū)域性用戶(hù)訪(fǎng)問(wèn)可以反映產(chǎn)品投放集中度,而用戶(hù)在社交網(wǎng)站、商業(yè)網(wǎng)站的互動(dòng)也能集中反映用戶(hù)對(duì)產(chǎn)品的取向性。傳統(tǒng)做法是對(duì)特征數(shù)據(jù)進(jìn)行定義,當(dāng)特征數(shù)據(jù)出現(xiàn)后即呈現(xiàn)對(duì)應(yīng)結(jié)果;事實(shí)上,自然語(yǔ)言復(fù)雜程度遠(yuǎn)高于定義所能提供的維度,加之?dāng)?shù)據(jù)量巨大,僅靠人工列舉無(wú)法完全獲得可靠結(jié)果,更難以形成知識(shí)網(wǎng)絡(luò)。 

傳統(tǒng)的數(shù)據(jù)分析產(chǎn)品專(zhuān)注于展示實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)計(jì)結(jié)果,一方面由于數(shù)據(jù)孤島的存在,難以展開(kāi)多維數(shù)據(jù)分析;另一方面從效率考慮,沒(méi)有良好的算法,即便是當(dāng)下先進(jìn)的彈性計(jì)算資源也很難承受大數(shù)據(jù)運(yùn)算壓力。NLP技術(shù)、機(jī)器學(xué)習(xí)算法和先進(jìn)IT架構(gòu)的引入,可以很好的解決問(wèn)題并真正釋放數(shù)據(jù)的價(jià)值。 

憑借NLP和機(jī)器學(xué)習(xí)算法、成熟的機(jī)器數(shù)據(jù)處理和分析技術(shù),開(kāi)數(shù)科技打造了具有情感分析引擎、人群畫(huà)像分析、產(chǎn)品口碑分析、熱議統(tǒng)計(jì)分析、用戶(hù)行為分析、品牌傳播分析的大數(shù)據(jù)智能平臺(tái)。通過(guò)了解網(wǎng)站所處數(shù)據(jù)特異性,基于行業(yè)、企業(yè)數(shù)據(jù)環(huán)境,針對(duì)性分析客戶(hù)關(guān)聯(lián)數(shù)據(jù),包括微博、企業(yè)博客、公開(kāi)文本等,最終實(shí)現(xiàn)數(shù)據(jù)強(qiáng)關(guān)聯(lián),獲得更具價(jià)值的分析結(jié)果。 

對(duì)于市場(chǎng)前景,熊博士向億歐分析:中國(guó)企業(yè)對(duì)海量數(shù)據(jù)的分析需求可以推至2008年電商行業(yè)爆發(fā)開(kāi)始,當(dāng)時(shí)中國(guó)市場(chǎng)涌現(xiàn)大量電商企業(yè),互聯(lián)網(wǎng)進(jìn)一步發(fā)展和豐富,隨著交易和網(wǎng)站信息井噴,海量數(shù)據(jù)出現(xiàn)并產(chǎn)生價(jià)值。“原有人口紅利、市場(chǎng)紅利使得早期電商企業(yè)獲得快速成長(zhǎng),然而在后移動(dòng)互聯(lián)網(wǎng)時(shí)代,簡(jiǎn)單的跑馬圈地機(jī)會(huì)越來(lái)越少,企業(yè)更多情況下需要精耕細(xì)作以提升效率?!毙荑麇|博士認(rèn)為,電商數(shù)據(jù)需求只是互聯(lián)網(wǎng)眾多企業(yè)需求的冰山一角,出行、視頻、企業(yè)服務(wù)等領(lǐng)域也都需要數(shù)據(jù)分析。未來(lái),更多智能化、工業(yè)化改造中出現(xiàn)的智能工業(yè)設(shè)備、物聯(lián)網(wǎng)設(shè)備進(jìn)一步加深了機(jī)器數(shù)據(jù)挖掘需求,市場(chǎng)前景會(huì)更大。 

作為一家數(shù)據(jù)分析型企業(yè),開(kāi)數(shù)科技在戰(zhàn)略和產(chǎn)品方面并不局限于日志分析,而是致力于打造面對(duì)企業(yè)的非結(jié)構(gòu)化數(shù)據(jù)分析平臺(tái),該平臺(tái)上會(huì)形成一系列服務(wù)于不同應(yīng)用場(chǎng)景的數(shù)據(jù)產(chǎn)品。這些產(chǎn)品與市場(chǎng)上其他數(shù)據(jù)產(chǎn)品將共同開(kāi)拓未來(lái)的大數(shù)據(jù)市場(chǎng)。

在客戶(hù)服務(wù)方面,開(kāi)數(shù)科技以“云端+部署”形式,滿(mǎn)足不同層級(jí)企業(yè)客戶(hù)需求。一方面,可以為KA級(jí)客戶(hù)提供定制化企業(yè)服務(wù),基于企業(yè)特點(diǎn)行業(yè)屬性實(shí)現(xiàn)“軟硬結(jié)合”服務(wù);而中小企業(yè)則可以根據(jù)其提供的功能全面的云端SaaS服務(wù),快速有效實(shí)現(xiàn)日常數(shù)據(jù)分析需求。 

回過(guò)頭來(lái)聊創(chuàng)業(yè),Samuel Lee博士和熊梓鍇博士都擁有資深的國(guó)際一流研究背景,旨在用自身技術(shù)滿(mǎn)足市場(chǎng)上尚未被滿(mǎn)足的、快速成長(zhǎng)的非結(jié)構(gòu)化數(shù)據(jù)分析需要。在人工智能技術(shù)大爆發(fā)、創(chuàng)業(yè)公司林立的情況下,身處新一波創(chuàng)業(yè)浪潮中,科學(xué)技術(shù)水平仍然是大數(shù)據(jù)公司的核心競(jìng)爭(zhēng)力與壁壘。

三、四十年前美國(guó)市場(chǎng)上就已出現(xiàn)科學(xué)家創(chuàng)業(yè)浪潮,“將知識(shí)轉(zhuǎn)化為生產(chǎn)力”是當(dāng)時(shí)大學(xué)與商業(yè)公司合作的主要訴求,傳統(tǒng)硅谷公司中,科學(xué)家搭配商業(yè)人才是常有的創(chuàng)業(yè)路線(xiàn)。因此熊梓鍇博士認(rèn)為,科學(xué)家背景的知識(shí)型創(chuàng)業(yè)在中國(guó)也將成為一股潮流,市場(chǎng)上會(huì)涌現(xiàn)出越來(lái)越多技術(shù)驅(qū)動(dòng)型創(chuàng)業(yè)團(tuán)隊(duì)。在產(chǎn)業(yè)升級(jí)浪潮中,開(kāi)數(shù)科技希望憑借技術(shù)實(shí)力與行業(yè)見(jiàn)解,在產(chǎn)業(yè)升級(jí)機(jī)會(huì)下幫助到更多互聯(lián)網(wǎng)企業(yè)以及傳統(tǒng)企業(yè),實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的目標(biāo),讓更多企業(yè)感受到數(shù)據(jù)分析帶來(lái)的商業(yè)價(jià)值。


長(zhǎng)按二維碼關(guān)注我們