谷銀觀點
谷銀關注 | 3D視覺風雲再起(qǐ),誰會是新“四小龍”?
龍隐于野。
全文5036字,閱讀約需10分鍾
文|陳俊一
編輯|苑晶銘 常亮
題圖|Pixabay
在AI賽道(dào)備受質疑、多家企業持續虧損的當下,3月下旬以來,卻有一批3D視覺企業相繼公布融資消息:
3月23日,成(chéng)立于2021年6月的跨維智能(néng)宣布完成(chéng)近千萬美元天使輪融資;3月24日,成(chéng)立于2021年7月的地标科技宣布完成(chéng)數千萬元天使輪融資;3月29日,已在工業3D視覺領域專注5年的翌視科技宣布完成(chéng)超億元A輪及A+輪融資。
據介紹,跨維智能(néng)提供3D視覺相機、算法和軟硬件一體化等三維視覺領域解決方案,已應用于半導體、3C電子、汽車、金屬加工等工業制造場景;地标科技提供3D無序抓取系統、3D點雲軌迹引導定位系統以及3D點雲高精度檢測系統;翌視科技的産品也覆蓋了消費電子、汽車和新能(néng)源等領域的3D檢測測量市場。
可以看出,汽車、工業等領域,仍是3D視覺新融資企業的主要應用場景。當然,也有部分手機品牌采用3D深感攝像頭,如最新的榮耀Magic4 Pro、iPhone 13系列等。
在AI賽道(dào)中,計算機視覺是最大的分支,占據了一半以上市場份額。據統計,2019年,我國(guó)計算機視覺核心産業規模和帶動相關産業規模分别爲633.3億元和1438.6億元,各占AI核心與相關産業的58.2%和37.6%。
計算機視覺最大的應用場景,則是安防影像。據統計,2020年安防仍占據計算機視覺應用層67.9%的份額,且應用技術依然以2D視覺爲主。3D視覺在工業等領域的應用,放在計算機視覺的大海之中,隻能(néng)算是小池塘。
但2022年,這(zhè)一狀況可能(néng)即將(jiāng)改變。
iPhone X與國(guó)内第一波3D機器視覺創業潮
從黑白到彩色、從低分辨率到高分辨率、從靜态圖像到動态影像、從2D平面(miàn)到3D立體,人類的視覺傳感技術經(jīng)曆了四次變革。嚴格意義上,以3D視覺技術爲代表的第四次視覺革命,與前三次有著(zhe)本質的不同:前三者都(dōu)是基于2D平面(miàn);而在3D視覺領域,黑白與彩色沒(méi)有什麼(me)分别,甚至有沒(méi)有環境光都(dōu)不影響三維信息的構建。
四次視覺革命是以技術類型區分,時間上并不是遞進(jìn)關系。其實早在1922年,第一部3D電影《The Power of Love》就已經(jīng)用兩(liǎng)個分别拍攝紅色與綠色畫面(miàn)的攝像機拍攝出來。但直到2017年9月,蘋果發(fā)布的iPhone X首次搭載3D結構光深度攝像頭,3D視覺技術才第一次引爆公衆認知,甚至還(hái)引發(fā)一場手機應該以指紋識别爲主還(hái)是以3D人臉識别爲主的大讨論。
但這(zhè)場科技媒體的大讨論,隻涉及蘋果引入3D結構光技術第一個層面(miàn)的意義——不用人體接觸即可快捷解鎖。實際上,蘋果基于3D傳感器,還(hái)想進(jìn)一步開(kāi)發(fā)增強現實(AR)等其他應用和服務。解鎖,隻是第一步。
iPhone X的3D激光掃描采用了VCSEL(Vertical Cavity Surface Emitting Laser, 簡稱面(miàn)射型激光)激光器,相比LED紅外光源在精确度、小型化、低功耗、可靠性等方面(miàn)有很強優勢。此前,3D視覺主要在工業領域少量應用,整個市場規模不大,包括上遊各類3D視覺傳感器硬件供應商,中遊3D視覺感知方案商、下遊應用算法方案商。
在3D視覺領域,實驗室産品早在20世紀80年代就已經(jīng)出現,産業和消費領域應用則較晚。微軟、英特爾、谷歌、蘋果等是入局較早的企業,2009年E3遊戲展上,微軟配合Xbox 360主機發(fā)布了第一代基于結構光技術的3D視覺感知産品Kinect深度攝像頭,用于捕捉三維空間中人體的運動,實現通過(guò)體态的人機交互。英特爾則于2013發(fā)布基于結構光技術的産品RealSense,用于實現手勢識别、面(miàn)部分析、背景移除及3D掃描等功能(néng)。
蘋果2013年通過(guò)收購PrimeSense,成(chéng)爲繼微軟、英特爾之後(hòu)第三家量産消費級3D結構光深度傳感器的企業,并在2017年將(jiāng)其搭載于iPhone X及後(hòu)續系列大規模走量,推動了3D結構光行業的發(fā)展。
國(guó)内3D視覺領域的創業公司,其實在蘋果發(fā)布iPhone X之前也已經(jīng)有所進(jìn)展。比如創立于2013年的奧比中光,早在2015年已經(jīng)完成(chéng)Astra、Astra Pro、Astra mini等系列3D深度攝像頭量産,并在2016年獲得聯發(fā)科的戰略入股,成(chéng)爲全球第四家可以量産消費級3D結構光深度攝像傳感器的廠商。
2018年,三維人臉解鎖幾乎成(chéng)了國(guó)内衆多高端智能(néng)手機的标配,各家企業通過(guò)相關硬件搭配各自不同的AI點陣模型算法、容錯算法、自校準算法等,以盡可能(néng)提高識别準确率。
如2018年5月發(fā)布、宣稱是國(guó)産首部搭載前置結構光鏡頭手機的小米8透明探索版,采用的就是初創企業螳螂慧視提供的方案。
2018年6月發(fā)布的OPPO FIND X,其3D結構光硬件采用奧比中光方案,算法采用曠視FACE++,通過(guò)投射1.5萬個散斑來構建3D面(miàn)部模型,宣稱是安卓陣營首個3D結構光技術接近蘋果XS的終端。
2018年10月發(fā)布的華爲 MATE20 Pro,則使用自主研發(fā)的軟硬件方案,采用和蘋果同樣(yàng)的VCSEL光原理、具備同樣(yàng)的散斑投射數量(3萬),宣稱誤識别率不高于百萬分之一,能(néng)夠配合多維度用戶使用場景如3D建模等。
而從2013年奧比中光創立到2018年國(guó)内旗艦手機大量采用3D視覺方案的5年間,據統計國(guó)内有30家以上的3D視覺領域企業相繼創業,如螳螂慧視、光鑒科技、靈明光子等。前不久登陸科創闆的格靈深瞳,也同樣(yàng)專注于三維計算機視覺技術。
據普華有策數據,2019年全球 3D視覺感知市場規模爲50億美元,且市場規模將(jiāng)快速發(fā)展,預計在2025年達到150億美元,2019-2025年複合增長(cháng)率約爲20%。
有趣的是,2018年3D結構光風潮之後(hòu),近兩(liǎng)年國(guó)内旗艦手機,如小米11Ultra、小米12Pro,vivo X70系列,OPPO Find X5 系列等,都(dōu)沒(méi)有采用3D結構光的人臉識别技術。
3D視覺技術,依然在工業領域持續耕耘。在消費領域,蘋果帶來短暫火爆之後(hòu),3D視覺似乎依然缺席消費級産品的大規模應用,僅在掃地機器人等少數領域應用。
第二波3D視覺創業潮:瞄準汽車與工業
從2013年到iPhone X發(fā)布前後(hòu),堪稱國(guó)内第一波3D視覺創業潮。2021年至今,無論是看融資還(hái)是看落地場景,第二波3D視覺創業潮正在發(fā)生。
據億歐不完全統計,僅2022年第一季度,3D視覺領域發(fā)生融資就超過(guò)10起(qǐ)。而2021年上半年3D視覺領域融資事(shì)件一共也才14起(qǐ),3D視覺領域的融資頻次和密度同比顯著增高。
2021年,也有圖漾科技,寶鏈智能(néng)、賽那德、埃瓦科技、視比特機器人、視海芯圖、靈西機器人等衆多3D視覺企業獲得融資,梅卡曼德機器人甚至獲得近10億元C輪融資。
從融資企業名稱也能(néng)簡單看出,消費領域并不是3D視覺技術的主陣地。但在更多工業、産業、物聯網等領域,3D視覺技術已經(jīng)在落地商用。
如奧比中光2021年12月發(fā)布 iToF技術生态首款标品相機Femto,就是專爲AIoT領域多元開(kāi)發(fā)需求而設計。同步發(fā)布的,還(hái)有奧比中光首款算法SDK Orbbec Pose,可适配Femto相機完成(chéng)一系列基于人體骨骼算法的3D應用開(kāi)發(fā),目前已正式在奧比中光3D視覺開(kāi)發(fā)者社區上線。
據了解,奧比中光已經(jīng)將(jiāng)多種(zhǒng)3D感知技術落地于消費電子、移動支付、智能(néng)通行、工業制造、智慧家居、智能(néng)輔助駕駛等領域,包括諸如智能(néng)機器人、3D攝像頭手機、3D刷臉支付終端、3D人臉門鎖等創新應用産品,多款産品達到百萬級量産。
但百萬級量産在消費品領域仍不算大規模,手機出貨量往往都(dōu)是千萬級規模。比如僅僅2017年發(fā)布的iPhoneX在生産周期内使用的激光器數量,據光鑒科技創始人朱力介紹就超過(guò) 400 億顆,超過(guò)此前人類生産激光器數量的總和。
手機的出貨規模盡管誘人,但3D視覺仍需要擴展更多場景。衆多3D視覺企業也在將(jiāng)落地場景從從手機、刷臉支付延伸到智能(néng)安防、智能(néng)制造、智能(néng)硬件等更多領域。
安防依然還(hái)是2D視覺技術爲主的領域,但随著(zhe)攝像頭數量越來越多、分辨率越來越高,數據傳輸與分析所需要的帶寬、算力也越來越高。
而且,2D視覺成(chéng)像中的投影現象,使得物體幾何形狀和表面(miàn)反射特性、光源與物體及攝像機之間的空間關系等都(dōu)被(bèi)綜合成(chéng)單一的圖像灰度值,很難區分其立體信息。而3D視覺,則是在以物體爲中心的坐标系中描述3D物體的形狀及空間組織,能(néng)夠傳達2D視覺所不能(néng)區分的空間信息。
3D視覺相比2D視覺,實際上所需的數據量是降低的,能(néng)夠降低傳統 2D 攝像頭方案的數據傳輸和能(néng)耗,節省大量運營成(chéng)本。這(zhè)是一個反直覺的特點——3D視覺在傳達更豐富的視覺信息時所需的存儲空間,并不一定比2D視覺信息大。
3D視覺從工業領域走向(xiàng)更多領域
在衆多業内人士看來,3D視覺技術在未來會應用到更多行業、結合産生出更多改變人們生活的高科技産品。
以汽車制造行業爲例,汽車動力部件往往形狀不規則、重量大、不便于人力作業,這(zhè)就需要使用自動化機械臂。但機械臂面(miàn)對(duì)不規則部件,在動作編程、制作夾具等方面(miàn)的難度就比較大。
針對(duì)汽車動力部件的上下料、搬運、安裝等自動化痛點,機器人3D視覺方案提供商埃爾森提供的“3D視覺傳感器+機械臂”組合,就是一種(zhǒng)可行的方案。
從汽車制造到電動車電池制造、半導體電子、食品生産、工業檢測,以及倉儲搬運、混合拆垛、物流分揀等多個領域的生産制造自動化、質量檢測自動化中,3D視覺傳感器已經(jīng)開(kāi)始普及,可實現人臉識别、手勢識别、人體骨架識别、三維測量、環境感知、避障、跟随、三維地圖重建、缺陷檢測等多種(zhǒng)功能(néng)。
比如3D匹配缺陷檢測,就是將(jiāng)3D傳感器采集的物體3D點雲數據與标準CAD進(jìn)行對(duì)比,根據預先設定的差異阈值生成(chéng)包含高度、寬度和體積數據的差異報告,從而發(fā)現缺陷品。
3D視覺最大的規模需求,是在工業領域還(hái)是消費領域,是在生産制造還(hái)是物流運輸?
其實不分領域,各行業都(dōu)對(duì)3D視覺有著(zhe)較大的需求,同時相關企業也在積極拓展3D視覺的應用場景。
如緻力于3D視覺底層研發(fā)及應用拓展的螳螂慧視,一方面(miàn)瞄準智能(néng)眼睛、智能(néng)手機等消費領域,研發(fā)具有專業級成(chéng)像質量、消費級成(chéng)本的新一代3D傳感器、3D成(chéng)像器件,可供AR/VR UGC設備采用,或用于3D人臉識别、步态識别等場景。
另一方面(miàn),也在涉足物流、AR智慧旅遊、智慧畜牧業、3D醫美、汽車碰撞檢測、3D影棚、全息實時直播、全息實時會議等業務并提供給方案,跨越多個領域。
比如將(jiāng)三維空間掃描設備用于室内空間數字化,既可以爲家裝行業定制化家具提供精準的空間尺寸,也可以爲貝殼等中介行業提供更直觀的房源信息。
智能(néng)門鎖,樓宇門禁等領域也是3D視覺的應用場景。
據了解,2021年10月發(fā)布的小米首款3D結構光智能(néng)門鎖,埃瓦科技可能(néng)就是3D人臉識别智能(néng)門鎖方案的提供商之一。基于自主研發(fā)的3D視覺AI專用芯片,埃瓦科技實際上可以爲更多領域提供一站式服務和模塊化解決方案:安防、掃地機器人、新零售、3D交互等領域。
安防的市場量級,據中商産業研究院,2022年預計將(jiāng)達到10134億元的市場規模。
掃地機器人需要對(duì)整個室内3D空間具備感知能(néng)力,制定智能(néng)的避障策略,具有空間建模、定位、路徑優化等能(néng)力,對(duì)3D傳感器的需求量非常大。據了解,2020年我國(guó)掃地機器人銷量654萬台,2021年預計銷量爲885萬台,已經(jīng)接近千萬量級。
智能(néng)門鎖也已經(jīng)具有幾百萬量級的市場規模,據奧維雲網(AVC)推總數據,2021年中國(guó)智能(néng)門鎖市場銷量爲458萬套。隻是其中指紋識别甚至密碼鎖仍占據較高比例,3D傳感器還(hái)需要進(jìn)一步滲透。
這(zhè)些具有高出貨量、對(duì)3D視覺方案有需求的産品,如手機、安防攝像頭、自動駕駛汽車以及更多工業品,都(dōu)爲3D視覺傳感器提供了廣闊的發(fā)展空間。而目前,各行各業對(duì)3D視覺技術的利用,依然處于很早期的階段。3D視覺企業,大多也依然處于從0到1的階段。
幾年前,因爲商湯、曠視、雲從、依圖占據了計算機視覺賽道(dào)50%以上的市場份額,被(bèi)人們稱之爲“計算機視覺四小龍”。“四小龍”也因此鎖定了人們更多的關注,成(chéng)爲計算機視覺賽道(dào)常常見諸報端的企業案例。
在3D視覺領域,哪四家企業能(néng)夠占據超過(guò)50%的市場份額,有資格成(chéng)爲3D視覺領域的“四小龍”?
在行業從0到1的階段,市場格局尚未穩固,“四小龍”們可能(néng)暫時“龍隐于野”。但在從1到10的行業爆發(fā)階段,不需要幾年,甚至一年之内,3D視覺賽道(dào)的“四小龍”們就會初顯排位。