谷銀觀點
谷銀基金行業月度簡報 | 大數據闆塊
政策 知識 技術總結
三種(zhǒng)最典型的大數據存儲技術路線
大數據領域過(guò)去5年發(fā)展很快、熱度很高,但是總的來說目前還(hái)在起(qǐ)步階段。近期由中關村大數據産業聯盟舉辦的“大數據100分”線上研讨會中,南大通用的CTO、資深業界專家武新博士同衆多網友分享了底層數據處理技術的發(fā)展趨勢和正在經(jīng)曆的巨大變革。以下爲分享實錄:
1. 數據價值的發(fā)現與使用
在大數據的4個V中,最顯著的特征應該是Value(價值)。不管數據多大,是什麼(me)結構,來源如何,能(néng)給使用者帶來價值的數據是最重要的數據。
我跟數據打了20多年的交道(dào),從來沒(méi)感覺到搞數據的地位有今天這(zhè)麼(me)高。整個社會對(duì)數據的認知變了,大數據最大的貢獻至少是讓社會各個層面(miàn)開(kāi)始認識到數據的重要性,包括最高領導和底層的老百姓。
目前大家基本達成(chéng)共識:數據像石油、煤一樣(yàng)是寶貴的資産,其内在的價值非常巨大。另外一個顯著的貢獻無疑是互聯網企業對(duì)于數據的巧妙使用和價值體現。
2. 數據處理技術的回顧
互聯網的數據“大”是不争的事(shì)實,現在分析一下數據處理技術面(miàn)臨的挑戰。目前除了互聯網企業外,數據處理領域還(hái)是傳統關系型數據庫(RDBMS)的天下。傳統RDBMS的核心設計思想基本上是30年前形成(chéng)的。過(guò)去30年脫穎而出的無疑是Oracle公司。全世界數據庫市場基本上被(bèi)Oracle,IBM/DB2,Microsoft/SQL Server 壟斷,其他幾家市場份額都(dōu)比較小。SAP去年收購了Sybase,也想成(chéng)爲數據庫廠商。有份量的獨立數據庫廠商現在就剩下Oracle和Teradata。開(kāi)源數據庫主要是MySQL,PostgreSQL,除了互聯網領域外,其他行業用的很少。這(zhè)些數據庫當年主要是面(miàn)向(xiàng)OLTP交易型需求設計、開(kāi)發(fā)的,是用來開(kāi)發(fā)人機會話應用爲主的。這(zhè)些傳統數據庫底層的物理存儲格式都(dōu)是行存儲,比較适合數據頻繁的增删改操作,但對(duì)于統計分析類的查詢,行存儲其實效率很低。在這(zhè)些成(chéng)熟的數據庫産品中,有2個典型特例:一個是Teradata,一個是Sybase IQ。
Teradata一開(kāi)始就使用MPP(Massive Parallel Processing)架構,以軟硬一體機的産品方式提供給客戶,其定位是高端客戶的數據倉庫和決策分析系統,Teradata在全世界的客戶隻有幾千個。在這(zhè)個數據分析高端市場上,Teradata一直是老大,在數據分析技術上Oracle和IBM打不過(guò)Teradata。Sybase IQ是一款最早基于列存儲的關系型數據庫産品,其定位跟Teradata類似,不過(guò)是以軟件方式銷售的。Teradata和Sybase IQ在數據分析應用上的性能(néng)其實都(dōu)比Oracle,DB2等要普遍好(hǎo)。
3. 數據增長(cháng)加速,數據多樣(yàng)化,大數據時代來臨
如果說現在是大數據時代了,其實是數據來源發(fā)生了質的變化。在互聯網出現之前,數據主要是人機會話方式産生的,以結構化數據爲主。所以大家都(dōu)需要傳統的RDBMS來管理這(zhè)些數據和應用系統。那時候的數據增長(cháng)緩慢、系統都(dōu)比較孤立,用傳統數據庫基本可以滿足各類應用開(kāi)發(fā)。
互聯網的出現和快速發(fā)展,尤其是移動互聯網的發(fā)展,加上數碼設備的大規模使用,今天數據的主要來源已經(jīng)不是人機會話了,而是通過(guò)設備、服務器、應用自動産生的。傳統行業的數據同時也多起(qǐ)來了,這(zhè)些數據以非結構、半結構化爲主,而真正的交易數據量并不大,增長(cháng)并不快。機器産生的數據正在幾何級增長(cháng),比如基因數據、各種(zhǒng)用戶行爲數據、定位數據、圖片、視頻、氣象、地震、醫療等等。
所謂的“大數據應用”主要是對(duì)各類數據進(jìn)行整理、交叉分析、比對(duì),對(duì)數據進(jìn)行深度挖掘,對(duì)用戶提供自助的即席、叠代分析能(néng)力。還(hái)有一類就是對(duì)非結構化數據的特征提取,以及半結構化數據的内容檢索、理解等。
傳統數據庫對(duì)這(zhè)類需求和應用無論在技術上還(hái)是功能(néng)上都(dōu)幾乎束手無策。這(zhè)樣(yàng)其實就給類似Hadoop的技術和平台提供了很好(hǎo)的發(fā)展機會和空間。互聯網公司自然就選擇能(néng)支撐自己業務的開(kāi)源技術了,反過(guò)來又推動了開(kāi)源技術的快速發(fā)展。
4. 新的數據處理技術、産品和創新
爲了應對(duì)數據處理的壓力,過(guò)去十年間在數據處理技術領域有了很多的創新和發(fā)展。除了面(miàn)向(xiàng)高并發(fā)、短事(shì)務的OLTP内存數據庫外(Altibase, Timesten),其他的技術創新和産品都(dōu)是面(miàn)向(xiàng)數據分析的,而且是大規模數據分析的,也可以說是大數據分析的。
在這(zhè)些面(miàn)向(xiàng)數據分析的創新和産品中,除了基于Hadoop環境下的各種(zhǒng)NoSQL外,還(hái)有一類是基于Shared Nothing架構的面(miàn)向(xiàng)結構化數據分析的新型數據庫産品(可以叫(jiào)做NewSQL),如:Greenplum(EMC收購),Vertica(HP 收購),Asterdata(TD 收購),以及南大通用在國(guó)内開(kāi)發(fā)的GBase 8a MPP Cluster等。目前可以看到的類似開(kāi)源和商用産品達到幾十個,而且還(hái)有新的産品不斷湧出。一個有趣的現象是這(zhè)些新的數據庫廠商多數都(dōu)還(hái)沒(méi)有10年曆史,而且發(fā)展好(hǎo)的基本都(dōu)被(bèi)收購了。收購這(zhè)些新型數據庫廠商的公司,比如EMC、HP,都(dōu)希望通過(guò)收購新技術和産品進(jìn)入大數據處理市場,是新的玩家。SAP除了收購Sybase外,自己開(kāi)發(fā)了一款叫(jiào)HANA的新産品,這(zhè)是一款基于内存、面(miàn)向(xiàng)數據分析的内存數據庫産品。
這(zhè)類新的分析型數據庫産品的共性主要是:
架構基于大規模分布式計算(MPP);硬件基于X86 PC 服務器;存儲基于服務器自帶的本地硬盤;操作系統主要是Linux;擁有極高的橫向(xiàng)擴展能(néng)力(scale out)和内在的故障容錯能(néng)力和數據高可用保障機制;能(néng)大大降低每TB數據的處理成(chéng)本,爲“大數據”處理提供技術和性價比支撐。
總的來看,數據處理技術進(jìn)入了一個新的創新和發(fā)展高潮,機會很多。這(zhè)裡(lǐ)的主要原因是一直沿用了30年的傳統數據庫技術遇到了技術瓶頸,而市場和用戶的需求在推動著(zhe)技術的創新,并爲此創造了很多機會。在大數據面(miàn)前,越來越多的用戶願意嘗試新技術和新産品,不那麼(me)保守了,因爲大家開(kāi)始清晰地看到傳統技術的瓶頸,選擇新的技術才有可能(néng)解決他們面(miàn)臨的新問題。
現在的總體趨勢是在數據量快速增長(cháng)、多類數據分析并存的需求壓力下,數據處理技術朝著(zhe)細分方向(xiàng)發(fā)展,過(guò)去30年一種(zhǒng)平台滿足所有應用需求的時代已經(jīng)過(guò)去。我們必須開(kāi)始根據應用需求和數據量選擇最适合的産品和技術來支撐應用。世界數據處理市場格局正在發(fā)生革命性的變化,傳統數據庫(OldSQL)一統天下變成(chéng)了OldSQL+NewSQL+NoSQL+其他新技術(流、實時、内存等)共同支撐多類應用的局面(miàn)。在大數據時代,需要的是數據驅動最優平台和産品的選擇。
5. MPP關系型數據庫與Hadoop的非關系型數據庫
大數據存儲技術路線最典型的共有三種(zhǒng):
第一種(zhǒng)是采用MPP架構的新型數據庫集群,重點面(miàn)向(xiàng)行業大數據,采用Shared Nothing架構,通過(guò)列存儲、粗粒度索引等多項大數據處理技術,再結合MPP架構高效的分布式計算模式,完成(chéng)對(duì)分析類應用的支撐,運行環境多爲低成(chéng)本PC Server,具有高性能(néng)和高擴展性的特點,在企業分析類應用領域獲得極其廣泛的應用。
這(zhè)類MPP産品可以有效支撐PB級别的結構化數據分析,這(zhè)是傳統數據庫技術無法勝任的。對(duì)于企業新一代的數據倉庫和結構化數據分析,目前最佳選擇是MPP數據庫。
圖1:MPP架構
第二種(zhǒng)是基于Hadoop的技術擴展和封裝,圍繞Hadoop衍生出相關的大數據技術,應對(duì)傳統關系型數據庫較難處理的數據和場景,例如針對(duì)非結構化數據的存儲和計算等,充分利用Hadoop開(kāi)源的優勢,伴随相關技術的不斷進(jìn)步,其應用場景也將(jiāng)逐步擴大,目前最爲典型的應用場景就是通過(guò)擴展和封裝Hadoop來實現對(duì)互聯網大數據存儲、分析的支撐。這(zhè)裡(lǐ)面(miàn)有幾十種(zhǒng)NoSQL技術,也在進(jìn)一步的細分。對(duì)于非結構、半結構化數據處理、複雜的ETL流程、複雜的數據挖掘和計算模型,Hadoop平台更擅長(cháng)。
第三種(zhǒng)是大數據一體機,這(zhè)是一種(zhǒng)專爲大數據的分析處理而設計的軟、硬件結合的産品,由一組集成(chéng)的服務器、存儲設備、操作系統、數據庫管理系統以及爲數據查詢、處理、分析用途而特别預先安裝及優化的軟件組成(chéng),高性能(néng)大數據一體機具有良好(hǎo)的穩定性和縱向(xiàng)擴展性。
6. 數據倉庫的重要性
在互聯網高速發(fā)展之前,無論是電信運營商,還(hái)是大銀行,保險公司等都(dōu)花費了巨額資金建立了自己的企業級數據倉庫。這(zhè)些倉庫主要是爲企業決策者生成(chéng)企業的一些關鍵指标(KPI),有的企業有幾千張、甚至上萬張KPI報表,有日表,周表,月表等等。這(zhè)些系統有幾個主要特征:
技術架構主要基于傳統RDBMS + 小型機 + 高端陣列 (就是大家說的IOE),當然數據庫有部分DB2,Teradata等。
報表基本都(dōu)是固定的靜态報表,産生的方式是T+1 (無法即時産生)。
數據量增長(cháng)相對(duì)緩慢,DW的環境變化很少。
最終用戶隻能(néng)看彙總的報表,很少能(néng)夠基于彙總數據做動态drilldown (鑽取)。
多數領導基本上認爲花了很多錢,但看不出是否值得做,有雞肋的感覺。最後(hòu)大家對(duì)大量的報表都(dōu)視而不見了。
這(zhè)類系統屬于“高富帥”,是有錢的企業給領導用的。
最後(hòu),目前多數企業和部門根本就沒(méi)有數據倉庫。其實大家對(duì)傳統數據的分析還(hái)沒(méi)做得太好(hǎo)、還(hái)沒(méi)有普及,現在又遇上了大數據。
數據倉庫對(duì)企業是真正有用的,其關鍵還(hái)是如何把數據用好(hǎo)。
7. 數據處理技術的核心問題到底是什麼(me)?
其實我們一直面(miàn)臨著(zhe)數據處理中最核心、最大的問題,那就是性能(néng)問題。性能(néng)不好(hǎo)的技術和産品是沒(méi)有生命力的。數據處理性能(néng)問題不是因爲大數據才出現,也不會有了大數據技術而消失。處理性能(néng)的提升將(jiāng)促進(jìn)對(duì)數據價值的挖掘和使用,而數據價值挖掘的越多、越深入,對(duì)處理技術要求就越高。
目前的數據倉庫隻能(néng)滿足一些靜态統計需求,而且是T+1模式;也是因爲性能(néng)問題,運營商無法有效構造超過(guò)PB級别的大數據倉庫,無法提供即席查詢、自助分析、複雜模型叠代分析的能(néng)力,更無法讓大量一線人員使用數據分析手段。
今天如果做“大數據”數據倉庫,運營商面(miàn)臨的挑戰比上個10年要大的多。目前沒(méi)有單一技術和平台能(néng)夠滿足類似運營商的數據分析需求。可選的方案隻能(néng)是混搭架構,用不同的分布式技術來支撐一個超越PB級的數據倉庫系統。這(zhè)個混搭架構主要的核心是新一代的MPP并行數據庫集群+ Hadoop集群,再加上一些内存計算、甚至流計算技術等。
大數據需要多元化的技術來支撐。當前數據處理對(duì)企業的挑戰越來越大,主要是下面(miàn)幾個原因:
第一個原因是數據量已經(jīng)是上一代的一個數量級了,1個省份級運營商1年就可超越1PB結構化數據。
第二個原因是“大數據”關注的更多是用戶行爲、群體趨勢、事(shì)件之間的相關性等,而不僅僅是過(guò)去的KPI,。這(zhè)就對(duì)數據分析平台對(duì)數據的分析能(néng)力和性能(néng)提出了新的要求和挑戰。
圖2:未來大數據處理的核心技術
8. 總結——新型MPP數據庫的價值
技術:基于列存儲+MPP架構的新型數據庫在核心技術上跟傳統數據庫有巨大差别,是爲面(miàn)向(xiàng)結構化數據分析設計開(kāi)發(fā)的,能(néng)夠有效處理PB級别的數據量。在技術上爲很多行業用戶解決了數據處理性能(néng)問題。
用戶價值:新型數據庫是運行在x-86 PC服務器之上的,可以大大降低數據處理的成(chéng)本(1個數量級)。
未來趨勢:新型數據庫將(jiāng)逐步與Hadoop生态系統結合混搭使用,用MPP處理PB級别的、高質量的結構化數據,同時爲應用提供豐富的SQL和事(shì)務支持能(néng)力;用Hadoop實現半結構化、非結構化數據處理。這(zhè)樣(yàng)可同時滿足結構化、半結構化和非結構化數據的處理需求。
下圖是南大通用正在做的大數據處理平台架構圖,將(jiāng)逐步把MPP與Hadoop技術融合在一起(qǐ),爲用戶提供透明的數據管理平台。
圖3:MPP與Hadoop技術融合的産品架構圖
熱點 趨勢 動态
數字經(jīng)濟持續高速發(fā)展,5G將(jiāng)成(chéng)爲其重要推動力
事(shì)件
在“2018年IDC中國(guó)數字化轉型年度盛典”上,IDC中國(guó)區總裁霍錦潔表示,到2021年,全球數字經(jīng)濟規模將(jiāng)達到45萬億美元,全球數字經(jīng)濟的比重將(jiāng)超過(guò)50%;中國(guó)是全球數字經(jīng)濟的引領者之一,到2021年,中國(guó)數字經(jīng)濟規模將(jiāng)達到8.5萬億美元,中國(guó)數字經(jīng)濟的比重將(jiāng)超過(guò)55%。
從IDC提出的第三平台的三大篇章來看,以第三平台爲核心的信息技術正在由試點創新進(jìn)入倍增創新,進(jìn)而演進(jìn)成(chéng)智能(néng)創新,倍增洞察(洞察無處不在)、倍增觸達(動态邊緣無限)、倍增開(kāi)發(fā)(應用爆發(fā)增長(cháng))、倍增期望(社交社會演化)、倍增信任(安全更爲泛在)5大新浪潮將(jiāng)有效支撐第三平台第二篇章的主題“倍增創新”。
事(shì)件點評
1、數字經(jīng)濟規模持續擴大,占比持續擴大
數字化轉型是以客戶爲中心,對(duì)企業業務進(jìn)行自動化改革,不斷提升企業産品競争力和提供創新的服務。企業將(jiāng)從用戶需求出發(fā),全方位打造讓客戶滿意的産品,以及讓客戶滿意的服務。據統計,截至2017年,50%以上的中國(guó)TOP1000大企業都(dōu)將(jiāng)把數字化轉型作爲公司的戰略核心。《準備應戰,蓄勢待發(fā),觀望等待:亞太地區全數字化轉型就緒性技術展望》白皮書指出,全數字化颠覆正在席卷所有國(guó)家、所有行業,技術創新隻會讓變革的步伐加快。重點聚焦中國(guó)市場的《全數字化就緒型網絡智引數字經(jīng)濟未來》白皮書則顯示,中國(guó)數字經(jīng)濟占GDP的比重已超30%,數字化成(chéng)爲經(jīng)濟增長(cháng)的新引擎。可以看出,數字化轉型是企業未來發(fā)展的必經(jīng)之路。
圖4: 2016年數字經(jīng)濟規模(億美元)
據IDC預測,到2021年,全球數字經(jīng)濟規模將(jiāng)達到45萬億美元,全球數字經(jīng)濟的比重將(jiāng)超過(guò)50%。根據2016年的數據,美國(guó)以10萬億美元的數字經(jīng)濟位居全球數據經(jīng)濟第一,其占據了58%的GDP比重,其他排名靠前的國(guó)家除了中國(guó)數字經(jīng)濟都(dōu)達到了50%以上。
合理預計,中國(guó)的數字經(jīng)濟比重將(jiāng)會持續上升。IDC方預計在2021年,中國(guó)作爲全球數字經(jīng)濟的領導人之一,其數字經(jīng)濟規模將(jiāng)達到8.5萬億美元,比重將(jiāng)超過(guò)55%。
2、通信底層構築數字經(jīng)濟高速公路,5G驅動數字經(jīng)濟再次提速
近日舉行的2018年中國(guó)國(guó)際信息通信展覽會暨ICT中國(guó)·2018高層論壇開(kāi)幕式上,工信部副部長(cháng)辛國(guó)斌指出,作爲數字經(jīng)濟的重要組成(chéng)部分和關鍵支撐,我國(guó)信息通信業保持蓬勃發(fā)展的态勢,在推動數字産業化和産業數字化,推進(jìn)網絡信息技術和實體經(jīng)濟深度融合等方面(miàn)發(fā)揮著(zhe)重要作用。
傳統運營商以中國(guó)移動和中國(guó)聯通爲代表紛紛將(jiāng)數字經(jīng)濟列爲企業轉型的重點方向(xiàng)。中國(guó)移動以“智慧教育”“智慧工業”“智慧農業”“智慧交通”“智慧金融”5個分行業模塊進(jìn)行數字化改革。中國(guó)移動在“智慧城市”方面(miàn)利用雲計算、大數據、物聯網、人工智能(néng)等手段實現城市人、物、事(shì)件的等城市動态運行數據的有效感知。
我們認爲,網絡基礎設施建設是數字化轉型的底層設施的重要保障,因此5G的快速部署和光網絡建設的推進(jìn)將(jiāng)對(duì)數字經(jīng)濟提供有力的支撐。
物聯網有望步入快速發(fā)展期,協同大數據、雲計算共同前進(jìn)
事(shì)件
10月20日-10月21日,2018世界物聯網大會中國(guó)國(guó)家會議中心舉行,大會上發(fā)布了首部《世界物聯網白皮書》中英文版發(fā)布。
會上,世界物聯網大會執行主席何緒明提出了世界物聯網的組成(chéng)架構模式和發(fā)展方向(xiàng),概述了五大洲主要國(guó)家的物聯網建設和産生發(fā)展狀況。呼籲各國(guó)企業向(xiàng)物聯網轉型升級。
中國(guó)工程院院士邬賀铨在大會上表示,有研究認爲,到2020年,全球工業物聯網産值將(jiāng)達到1510億美元,預計物聯網的使用將(jiāng)帶來1.9萬億美元的生産力提升和1770億美元的生産成(chéng)本降低。工業物聯網的支撐技術主要包括大數據、人工智能(néng)、信息安全、移動互聯網、5G、物聯網、雲計算、區塊鏈等;而在工業應用上,還(hái)需要先進(jìn)制造技術、機器人、信息物理系統等相關技術的支撐。同時指出工業物聯網更大的市場價值體現在垂直行業的應用上。
事(shì)件點評
1、物聯網有望步入快速發(fā)展,開(kāi)啓萬物互聯核心技術
物聯網以互聯網爲基礎,實現物與物之間的信息傳輸。物聯網的發(fā)展需要三項關鍵支撐技術:傳感器技術、RFID标簽和嵌入式系統技術。可以應用于交通、消防、環境、工業、醫療等領域。
根據研究機構Gartner公司的調查,2017年全球物聯網設備數量達到了84億,比2016年的64億增長(cháng)31%,預計到2020年物聯網設備數量將(jiāng)達到204億。
圖5: 全球互聯網設備數量(億)
同時,預計到2020年,全球工業物聯網産值將(jiāng)達到1510億美元,物聯網的使用將(jiāng)帶來1.9萬億美元的生産力提升和1770億美元的生産成(chéng)本降低。
工業物聯網的支撐技術主要包括大數據、人工智能(néng)、信息安全、移動互聯網、5G、物聯網、雲計算、區塊鏈等;而在工業應用上,還(hái)需要先進(jìn)制造技術、機器人、信息物理系統等相關技術的支撐。現階段,随著(zhe)5G、雲計算、大數據、區塊鏈等技術的逐漸成(chéng)熟化,我們認爲將(jiāng)會加快物聯網的發(fā)展。
2、物聯網將(jiāng)帶來巨大産值空間,産業鏈全面(miàn)迎來發(fā)展機遇
中國(guó)物聯網起(qǐ)步早,在1999年就啓動了物聯網核心傳感網技術研究,技術在全球領先。另外中國(guó)在傳感網方面(miàn)擁有大量專利,并且是少數能(néng)實現物聯網全産業鏈的國(guó)家之一。
物聯網的應用領域非常廣,遍及我們生活的方方面(miàn)面(miàn),從環境到交通,從健康到食品等等。據分析,今年的物聯網將(jiāng)聚焦于以下幾大領域:智慧零售,運用物聯網技術實現精準銷售;智慧物流,在物流的運輸、倉儲、運輸、配送等各個環節實現系統感知、全面(miàn)分析及處理;智慧能(néng)源保護,應用于智慧井蓋監測水位以及其狀态、智能(néng)水電表實現遠程抄表、智能(néng)垃圾桶自動感應等;智能(néng)醫療,幫助醫院實現對(duì)人的智能(néng)化管理和對(duì)物的智能(néng)化管理;智慧農業,實現農業生産全過(guò)程的信息感知、精準管理和智能(néng)控制等等。
我們認爲,物聯網的應用,可以讓企業快速收集産品和企業業務流程數據,提高市場敏捷性,同時,可以挖掘出更多的業務,更好(hǎo)地爲客戶服務。物聯網的到來將(jiāng)給企業業務結構進(jìn)一步優化,業務方向(xiàng)更精準化,客戶服務更智能(néng)化,將(jiāng)給多個領域、多個公司提供大量的發(fā)展機遇。
3、與大數據、雲計算相輔相成(chéng),促進(jìn)數字經(jīng)濟全面(miàn)提速
物聯網近幾年高速增長(cháng),并且逐漸深入應用到工業、農業、交通、家居、醫療、物流等諸多領域,物聯網的技術核心在于傳感數據的獲取和分析,對(duì)這(zhè)些數據的分析從而改善産品性能(néng),改進(jìn)運營模式等。海量數據的産生,需要大數據技術的來進(jìn)行處理分析,僅僅物物相聯很難産生質變。而大數據又離不開(kāi)雲計算,雲計算爲大數據的運算提供資源層的靈活性。
我們認爲,大數據和物聯網將(jiāng)持續相輔相成(chéng),發(fā)揮各自的優勢。“物聯網+大數據+雲計算”是未來的一個重要發(fā)展方向(xiàng),將(jiāng)給人類生活帶來巨大的改變。同時,物聯網將(jiāng)會推進(jìn)數字化經(jīng)濟快速發(fā)展和占據數字經(jīng)濟的重要比例。
投資 并購 重組
雲上貴州大數據集團成(chéng)立 茅台集團4.5億元入股
10月19日,雲上貴州大數據(集團)有限公司注冊成(chéng)立,注冊資本170000萬元人民币,工商資料備案的經(jīng)營範圍包括:數據采集、存儲、開(kāi)發(fā)、處理、服務和應用;大數據軟件研發(fā)及服務;信息咨詢服務;計算機信息系統集成(chéng);硬件研發(fā)銷售;數據服務平台建設;數據庫系統服務器等設備及存儲空間租賃及相關配套服務;軟件企業孵化及配套樓宇經(jīng)濟;教育培訓信息咨詢。
目前雲上貴州大數據集團包括五家股東,分别是貴州省人民政府國(guó)有資産監督管理委員會、中國(guó)貴州茅台酒廠(集團)有限責任公司、 貴州金融控股(集團)有限責任公司、貴陽市工業投資(集團)有限公司和貴州雙龍航空港開(kāi)發(fā)投資(集團)有限公司,持股比例分别是38.24%、26.47%、17.65%、11.76%和5.88%。
其中,貴州省國(guó)資委出資6.5億元,茅台集團出資4.5億元。
雲上貴州這(zhè)一名字,與蘋果中國(guó)iCloud密切挂鈎。今年1月,蘋果宣布,從2月28日起(qǐ),蘋果將(jiāng)iCloud(中國(guó))服務切換到由雲上貴州大數據産業發(fā)展有限公司運營,這(zhè)一決定适用于國(guó)家或地區設置爲中國(guó)的Apple ID。蘋果表示,iCloud轉由雲上貴州運營後(hòu)將(jiāng)有助于繼續提升iCloud服務的速度和可靠性,并遵守中國(guó)法規。
據介紹,雲上貴州大數據産業發(fā)展有限公司于2014年11月經(jīng)貴州省人民政府批準成(chéng)立,注冊資金23500萬元,由貴州省大數據發(fā)展管理局履行出資人職責,貴州省國(guó)有企業監事(shì)會進(jìn)行監管。
公開(kāi)信息顯示,2017年12月,貴州省以雲上貴州大數據産業發(fā)展有限公司爲主體組建成(chéng)立雲上貴州大數據(集團)有限公司,承擔全省政府大數據信息化項目及政府數據資源開(kāi)發(fā)經(jīng)營,打造支撐貴州省大數據産業發(fā)展的戰略性、引領性、創新性企業集團。
數據寶入股運營華東江蘇大數據交易中心 開(kāi)啓大數據産業新篇章
近日,中國(guó)領先的國(guó)有數據資産增值運營服務商—貴州數據寶網絡科技有限公司(以下簡稱“數據寶”)入股華東江蘇大數據交易中心并成(chéng)爲其運營方.
數據寶——中國(guó)領先的國(guó)有數據資産增值運營服務商,2016年成(chéng)立于中國(guó)首個大數據綜合試驗區貴州省貴安新區,承擔國(guó)有大數據資産增值共享開(kāi)放流通先行試點之重任,同時也是華東江蘇大數據交易中心的股東方與運營方;股東方包括:貴州省貴安新區(産業基金)、中科院中科創星(産業基金)、國(guó)家工業信息安全發(fā)展研究中心 (工業和信息化部電子第一研究所) 全資子公司、海爾 (旗下青島政府引導基金) 及上海拓鵬集團;數據寶已獲公安、銀聯、鐵路、航旅、司法、工商、電信運營商等二十多個國(guó)家部委、央企權威的大數據資源授權,助力金融、互聯網、服務等商業機構運用國(guó)有大數據完善運營管理、風險控制、精準營銷、産品研發(fā)、客戶服務等各個環節。數據寶是國(guó)内少數同時具備“國(guó)資參股、政府監管扶持、市場化運作、大數據資産交易合法經(jīng)營資質”屬性的大數據“國(guó)家隊”。
華東江蘇大數據交易中心——作爲華東地區首家由國(guó)家批準設立,跨區域、标準化、綜合性的大數據交易平台,華東江蘇大數據交易中心秉承“開(kāi)放 共享 互動 共赢”的精神,以數據資源歸集,圍繞企業需求數據産品,實現個人、企業及政府數據變現,最終實現數據資産證券化。激活數據資産,爲傳統産業的升級轉型提供可行的解決方案。
AI大數據公司高重科技完成(chéng)億元級A輪融資,多家機構投資
AI大數據公司上海高重信息科技有限公司于近日完成(chéng)A輪億元級人民币融資,本輪由毅達資本等多家知名機構投資。此前,高重科技還(hái)曾獲由海瀛産業基金出資的天使輪融資,以及天安金控出資的Pre-A 輪融資,具體金額未透露。
A輪融資完成(chéng)後(hòu),高重科技將(jiāng)引進(jìn)更多 AI 行業高端人才,優化視頻結構化産品,建立國(guó)内各主要區域、國(guó)外分支機構體系,加強場景落地能(néng)力。
高重科技創立于2014 年,是一家以安防爲應用場景的人工智能(néng)公司,緻力于開(kāi)展基于移動互聯及大數據安全等技術的研究和相關産品的開(kāi)發(fā),旗下産品包括Sniper-高級持續威脅防護、Sniper-防勒索系統、FRA-人臉識别認證等,可爲電商企業、政府機構、遊戲娛樂等領域提供信息安全服務。
目前,高重科技公司規模接近百人,主要集中在超算科研技術、算法及建模、工程化落地測試、品牌商務四個部門。
上市公司/标杆企業分析
美亞柏科:公司三季度業績承壓,大數據業務有望成(chéng)爲新引擎
公司發(fā)布 2018 年三季報,前三季度實現收入 7.24 億,同比增長(cháng) 22.15%;歸母淨利潤 4737 萬,同比減少 27.97%;扣非後(hòu)的歸母淨利潤 2801 萬,同比減少 49.31%。
大數據産品占比提升, 毛利率有所下降
前三季度公司毛利率爲 59.10%,相比于去年同期毛利率 63.54%有所下降。 主要因前三季度公司毛利率較低的大數據業務較去年同期有所增加,導緻綜合毛利率有所下降。 同時, 根據公司業務發(fā)展規劃,公司增加了人員儲備、加大了研發(fā)和市場推廣的投入,這(zhè)些投入的增加導緻前三季度費用較去年同期有較大增加。
風險概要:
1.電子數據取證業務增速不達預期: 短期受到如組建監察委、國(guó)地稅合并等國(guó)家機構改革的影響,公司電子數據取證業務訂單落地以及項目的驗收出現滞後(hòu), 如果組建監察委、國(guó)地稅合并的完成(chéng)進(jìn)度低于預期, 則公司電子數據取證業務增速存在不達預期的風險;
2.大數據信息化業務推廣進(jìn)度不達預期:公司城市公共安全平台目前推廣及建設比較成(chéng)熟的城市包括廈門、沈陽,如果城市公共安全平台在其他省市的推廣進(jìn)度不達預期,則公司的大數據信息化業務存在推廣進(jìn)度不達預期的風險;
3.國(guó)際市場業務發(fā)展不達預期:爲滿足符合國(guó)際市場需求的産品,公司在西安研發(fā)中心建立了專門的國(guó)際化技術服務團隊, 如果公司電子數據取證産品的國(guó)際版本的開(kāi)發(fā)進(jìn)度低于預期,公司的國(guó)際市場業務存在發(fā)展不達預期的風險。