最近有一家中國(guó)公司以黑馬之姿在自動(dòng)駕駛領(lǐng)域異軍突起。圖森科技宣布,該公司在自動(dòng)駕駛算法公開(kāi)排行榜KITTI和Cityscapes評(píng)測(cè)數(shù)據(jù)集上獲得了九個(gè)世界第一。 這是KITTI和Cityscapes評(píng)測(cè)數(shù)據(jù)集上第一次有一家公司“霸榜“。而圖森科技的競(jìng)爭(zhēng)者,都是百度、三星、英偉達(dá)、斯坦福、中科院、多倫多大學(xué)、NEC實(shí)驗(yàn)室、加州大學(xué)圣迭戈分校等這些名企名校及科研機(jī)構(gòu)。和這些巨頭們相比,圖森只是一個(gè)剛成立一年的創(chuàng)業(yè)公司。 即便獲得了如此驚人的成績(jī),圖森科技CEO陳默依舊很不滿足。他對(duì)新浪科技說(shuō),“霸榜“其實(shí)是為了向投資人證明圖森科技在自動(dòng)駕駛領(lǐng)域是領(lǐng)頭羊,這僅是手段。圖森真正想做、并且在做的事情其實(shí)是貨運(yùn)商用車的自動(dòng)駕駛。 根據(jù)中物聯(lián)統(tǒng)計(jì)數(shù)據(jù)顯示,2015年道路運(yùn)輸費(fèi)用3.3萬(wàn)億元,可交易的公路貨運(yùn)市場(chǎng)總體規(guī)模在2.6萬(wàn)億左右。 陳默認(rèn)為這是一個(gè)無(wú)比巨大的市場(chǎng),至于巨頭云集,而且高難度和高復(fù)雜度的大眾消費(fèi)級(jí)自動(dòng)駕駛,他坦言并不興趣,落地需要的時(shí)間太長(zhǎng),而時(shí)間對(duì)于一家創(chuàng)業(yè)公司而言太寶貴了。 “自動(dòng)駕駛加貨運(yùn)足夠支撐起圖森科技的夢(mèng)想,我們想改變行業(yè),我們也想帶著圖森上市。更現(xiàn)實(shí)的角度來(lái)說(shuō),年輕的圖森科技還可以在這個(gè)領(lǐng)域進(jìn)行彎道超車。“陳默說(shuō),2017年是他們對(duì)貨運(yùn)自動(dòng)駕駛落地的預(yù)期,現(xiàn)在就是和時(shí)間賽跑。 人工智能中國(guó)并不遜于國(guó)外 現(xiàn)在的投資圈,人工智能已經(jīng)成為最熱的議題,但是和以往互聯(lián)網(wǎng)的投資相比,中國(guó)的投資人們似乎更愿意去看國(guó)外的創(chuàng)業(yè)公司,認(rèn)為他們?cè)谶@個(gè)領(lǐng)域更加先進(jìn)。 對(duì)于這種取向,陳默有些忿忿不平,他覺(jué)得其他方面可能確實(shí)存在這種差異,但是基于大數(shù)據(jù)和深度學(xué)習(xí)的人工智能,中國(guó)和國(guó)外幾乎是同時(shí)起步,差距其實(shí)很小,甚至在不少領(lǐng)域都是領(lǐng)先的。 “去參加 KITTI和Cityscapes評(píng)測(cè)數(shù)據(jù)集,目的其實(shí)很簡(jiǎn)單。我們說(shuō)自己是領(lǐng)先的,怎么證明?沒(méi)有什么比這種世界級(jí)的公開(kāi)排行榜更具有說(shuō)服力了,因?yàn)閰⑴c者都是最牛的機(jī)構(gòu)和人。“ KITTI由德國(guó)卡爾斯魯厄理工學(xué)院和豐田美國(guó)技術(shù)研究院聯(lián)合創(chuàng)辦,是目前國(guó)際上最大的自動(dòng)駕駛場(chǎng)景下的計(jì)算機(jī)視覺(jué)算法評(píng)測(cè)數(shù)據(jù)集。 用了一個(gè)月時(shí)間,圖森科技在KITTI數(shù)據(jù)集上,拿到了目標(biāo)檢測(cè)中車輛檢測(cè)、行人檢測(cè)、自行車三個(gè)單項(xiàng)、目標(biāo)追蹤中車輛追蹤、行人追蹤的兩個(gè)單項(xiàng)、道路分割包括urban unmarked、urban marked、urban multiple marked三個(gè)場(chǎng)景及前三個(gè)場(chǎng)景的平均值urban road等四個(gè)單項(xiàng)四個(gè)單項(xiàng)的總計(jì)九項(xiàng)第一。 而Cityscapes數(shù)據(jù)集則是由奔馳主推,提供無(wú)人駕駛環(huán)境下的圖像分割數(shù)據(jù)集。用于評(píng)估視覺(jué)算法在城區(qū)場(chǎng)景語(yǔ)義理解方面的性能。在fine和coarse兩套評(píng)測(cè)標(biāo)準(zhǔn)中,圖森排名靠前,人臉關(guān)鍵點(diǎn)定位的兩個(gè)評(píng)測(cè)數(shù)據(jù)集300W和AFLW上排名第一。 十年積累 去參加KITTI和Cityscapes評(píng)測(cè)數(shù)據(jù)集“刷榜“其實(shí)是一件很冒險(xiǎn)的事情,因?yàn)閰⒓舆@種級(jí)別的競(jìng)爭(zhēng),無(wú)論是大公司還是小公司,都需要相關(guān)的研究團(tuán)隊(duì)和個(gè)人全身心地投入,工作停擺。如果沒(méi)有拿到成績(jī),對(duì)于創(chuàng)業(yè)公司而言,無(wú)疑是沉重打擊。 尤其是圖森科技還有著巨大的野心,不滿足于一兩項(xiàng)的第一。 陳默告訴新浪科技,這種規(guī)模化的“霸榜“是他們一開(kāi)始就想好的,要的就是不鳴則已,一鳴驚人的效果。所以他們選擇了最開(kāi)始就攻克難的項(xiàng)目,有把握的項(xiàng)目放在后面,甚至有項(xiàng)目?jī)H用了一天時(shí)間,在最后截止日期上交的。 之所以敢這么做,陳默說(shuō)是因?yàn)樗刑貏e牛的團(tuán)隊(duì)。 圖森科技有兩個(gè)團(tuán)隊(duì),工程及商業(yè)化團(tuán)隊(duì)在中國(guó)北京,核心算法研究院在美國(guó)加州圣地亞哥。目前公司規(guī)模70人左右,北美研究院有20個(gè)人在做核心算法,國(guó)內(nèi)算法部門10人,硬件部門10人,工程部門10人。 北美研究院由聯(lián)合創(chuàng)始人兼CTO的侯曉迪領(lǐng)導(dǎo),他是加州理工學(xué)院的博士,計(jì)算機(jī)視覺(jué)和認(rèn)知科學(xué)領(lǐng)域?qū)<遥瑒?chuàng)立了基于頻域的視覺(jué)注意機(jī)制理論,基于這個(gè)理論的論文已經(jīng)被引用2000多次。 國(guó)內(nèi)算法團(tuán)隊(duì)由首席科學(xué)家王乃巖帶領(lǐng),他是香港科技大學(xué)博士,2014 Google PhD Fellow計(jì)劃的入選者,多次在國(guó)際數(shù)據(jù)挖掘和計(jì)算機(jī)視覺(jué)比賽中名列前茅。 工程技術(shù)VP郝佳男,南洋理工大學(xué)博士,有十年并行和分布式運(yùn)算研究經(jīng)驗(yàn),曾是淡馬錫國(guó)家實(shí)驗(yàn)室研究員。另一位算法科學(xué)家黃澤鏵則是卡內(nèi)基梅隆大學(xué)機(jī)器人學(xué)碩士,計(jì)算機(jī)視覺(jué)和人臉?lè)治鲱I(lǐng)域?qū)<遥?fù)責(zé)圖森的駕駛員監(jiān)控系統(tǒng)研發(fā)。 圖森科技成立于2015年9月份,陳默認(rèn)可“黑馬“的論調(diào),卻不愿意別人給圖森貼上“AI新人“的標(biāo)簽。“我們團(tuán)隊(duì)已經(jīng)在人工智能方面研究了十年,這一年僅僅是厚積薄發(fā)而已“。 自動(dòng)駕駛加貨運(yùn) 在自動(dòng)駕駛之前,圖森科技最開(kāi)始做的是基于圖片識(shí)別的廣告業(yè)務(wù),為用戶瀏覽過(guò)的圖片打上關(guān)鍵詞標(biāo)簽,通過(guò)算法精準(zhǔn)匹配,讓廣告主找到最適合產(chǎn)品定位的投放廣告位等工作。 雖然營(yíng)收在千萬(wàn)級(jí),但陳默和他的小伙伴的們并不滿足于此。陳默直言,技術(shù)團(tuán)隊(duì)們想做一些更酷的能改變世界事情,而他通過(guò)幾次創(chuàng)業(yè),已經(jīng)實(shí)現(xiàn)了財(cái)務(wù)自由,這次他希望能帶著一個(gè)公司走向上市。計(jì)算機(jī)視覺(jué)在廣告領(lǐng)域,天花板太低。 轉(zhuǎn)型是從今年年初開(kāi)始的,陳默說(shuō)轉(zhuǎn)型的決定很快都在團(tuán)隊(duì)內(nèi)部和投資人新浪那里通過(guò)了,那么轉(zhuǎn)向哪里? “計(jì)算機(jī)視覺(jué)目前就人臉識(shí)別、安防和交通三大應(yīng)用領(lǐng)域。人臉識(shí)別和安防可以歸到一大類中,國(guó)內(nèi)幾家計(jì)算機(jī)視覺(jué)公司已經(jīng)做了很久了,而且還有海康威視、大華等上市公司,不是一個(gè)好跑道。自動(dòng)駕駛,雖然有很多大公司在嘗試,但是整個(gè)市場(chǎng)還在探索,而且前景廣闊。“ 雖然說(shuō)目前自動(dòng)駕駛還在探索階段,但是自動(dòng)駕駛是目前最為熱門的科技領(lǐng)域也是無(wú)可回避的事實(shí)。谷歌、百度、英特爾、Uber、豐田、本田、福特等科技和車企巨頭,Mobileye等大量專業(yè)技術(shù)提供方都是圖森要面臨的對(duì)手。 而陳默眼中,他們和圖森其實(shí)是不同跑道的選手。“他們想攻占的是大眾消費(fèi)市場(chǎng),面對(duì)的是消費(fèi)者。而我們想做的是貨運(yùn)商用市場(chǎng),面對(duì)的是企業(yè)“。 按照他的介紹,在自動(dòng)駕駛上,圖森互聯(lián)的目標(biāo)是與運(yùn)營(yíng)車輛企業(yè)合作,為定制攝像頭配合毫米波雷達(dá)的低成本自動(dòng)駕駛算法和解決方案。模式其實(shí)與國(guó)外自動(dòng)駕駛卡車公司Otto相似,為高速公路、礦區(qū)卡車提供自動(dòng)駕駛系統(tǒng)。 圖森目前正在和北奔研究院、北京理工大學(xué)進(jìn)行合作,聯(lián)合研發(fā)軍用重型汽車的自動(dòng)駕駛技術(shù)。北奔主要提供整車平臺(tái)以及相關(guān)試驗(yàn)資源,北理工為自動(dòng)駕駛車輛的研發(fā)提供運(yùn)動(dòng)控制技術(shù),圖森負(fù)責(zé)計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)算法部分,提供以攝像頭為主、配合毫米波雷達(dá)和視覺(jué)芯片的、經(jīng)濟(jì)型自動(dòng)駕駛解決方案。最快需要1年的時(shí)間出原型車。 陳默的設(shè)想是,圖森技術(shù)的自動(dòng)駕駛汽車在2017年或者2018年就可以上路。 快速商業(yè)化落地 作為一個(gè)連續(xù)創(chuàng)業(yè)者,陳默將自己定義為一個(gè)務(wù)實(shí)的領(lǐng)導(dǎo)者,這讓他避開(kāi)了技術(shù)公司常常會(huì)遇到的一些理想主義的坑,也讓圖森在商業(yè)化上走得也比較早。無(wú)論是貨運(yùn)還是多目攝像頭加毫米波雷達(dá)的綜合解決方案,都是立足于讓技術(shù)更好地落地。 “以激光雷達(dá)為核心,然后配上高精度地圖的技術(shù)路線,不適合創(chuàng)業(yè)公司,成本太高了,一套64線激光雷達(dá)要8萬(wàn)美元,一臺(tái)無(wú)人駕駛車基本上要裝四部,而且降價(jià)恐怕至少要等到2020年。為什么谷歌先行了這么多年,一直沒(méi)有大規(guī)模推廣,成本是很大的一個(gè)因素“。 對(duì)于圖森所選擇的計(jì)算機(jī)視覺(jué)加毫米波雷達(dá)的方案,陳默表示,這會(huì)讓成本降到激光雷達(dá)的二十分之一,而且能夠?qū)崿F(xiàn)數(shù)據(jù)采集和高精地圖標(biāo)定的快速部署,低成本和易量產(chǎn)讓這種方案在商業(yè)化上會(huì)走得更快。最大的難點(diǎn)就是對(duì)算法的要求極高,但是這是圖森的優(yōu)勢(shì)所在。而且有一天計(jì)算機(jī)視覺(jué)識(shí)別和深度足夠強(qiáng)大的時(shí)候,可能就再也不需要激光雷達(dá)了。 選擇貨運(yùn)方向,也是現(xiàn)實(shí)和理想的結(jié)合。 “貨運(yùn)是個(gè)萬(wàn)億級(jí)的市場(chǎng),中國(guó)有兩千多萬(wàn)的運(yùn)營(yíng)車輛,從市場(chǎng)容量來(lái)看,這是一個(gè)天花板極高的市場(chǎng)。而且自動(dòng)駕駛減少貨運(yùn)公司雇傭成本,讓他們也愿意和我們合作。“據(jù)陳默透露,已經(jīng)有物流公司打算和圖森合作試點(diǎn)。 從技術(shù)難度而言,貨運(yùn)也是一個(gè)更快落地的方向。路線單一,基本都是高速路段,路況復(fù)雜程度遠(yuǎn)遠(yuǎn)低于城區(qū),數(shù)據(jù)好收集等等都是貨運(yùn)的優(yōu)點(diǎn)。 按照陳默的計(jì)劃,最開(kāi)始的目標(biāo)是讓每輛車減少一個(gè)司機(jī),在指定路段下自動(dòng)駕駛。到最后一個(gè)運(yùn)輸車隊(duì)只需要一到兩個(gè)司機(jī),其他車輛追隨領(lǐng)頭車無(wú)人駕駛。這個(gè)原型化方案最快將在1年半之內(nèi)達(dá)成。接下來(lái),服務(wù)還可以蔓延到整個(gè)車隊(duì)的管理系統(tǒng)。 更近能夠?qū)崿F(xiàn)的事情是ADAS硬件的落地,圖森將從“兩客一危“、室內(nèi)公交等運(yùn)營(yíng)車輛入手。通過(guò)將4路攝像頭連接車內(nèi)計(jì)算機(jī),在碰撞之前,對(duì)周邊行人和車輛進(jìn)行識(shí)別以及運(yùn)行軌跡的測(cè)算,從而為司機(jī)提供碰撞預(yù)警。該產(chǎn)品將在4個(gè)月后投入市場(chǎng),目標(biāo)客戶是公交公司以及運(yùn)營(yíng)車企等。 陳默說(shuō),從起步到上市,肯定是漫長(zhǎng)而艱辛的過(guò)程。但是這次他憋著一口氣,要和兄弟們一起帶著圖森上市。
«
未來(lái)人類生命安危 或離不開(kāi)人工智能
|
OKCoin幣行比特幣回溫 比特幣支付在日本成潮流
»