隨著深度學(xué)習(xí)在多個(gè)人工智能的細(xì)分領(lǐng)域日趨成熟化和規(guī)?;?,多模態(tài)融合正成為人工智能研究新的熱點(diǎn)方向和趨勢(shì)。作為國(guó)內(nèi)互聯(lián)網(wǎng)公司,汽車(chē)之家在人工智能研究和應(yīng)用方面一直占有優(yōu)勢(shì),并將多模態(tài)融合技術(shù)應(yīng)用于為主機(jī)廠賦能的數(shù)字化產(chǎn)品中。近期,汽車(chē)之家人工智能算法團(tuán)隊(duì)在今年TextCaps任務(wù)中CIDEr獲得了98.59分的成績(jī)。
TextCaps是Facebook發(fā)布的一個(gè)大型的圖像閱讀理解任務(wù),該項(xiàng)比賽囊括了圖像識(shí)別、圖像描述、圖像字幕等多個(gè)圖像領(lǐng)域的任務(wù),一經(jīng)宣布就吸引了眾多國(guó)內(nèi)外的學(xué)術(shù)專家以及科研團(tuán)隊(duì)參加。汽車(chē)之家代表隊(duì)在眾多來(lái)自全球的算法團(tuán)隊(duì)角逐中脫穎而出,充分展現(xiàn)了汽車(chē)之家在高科技研究中攻堅(jiān)克難的匠心精神。
Text-Caption是一個(gè)涉及圖像中視覺(jué)信息和文字信息的多模態(tài)任務(wù),其目的是對(duì)一張圖片生成一句涵蓋其所有信息的文字描述。它不僅需要利用模型去理解圖片的內(nèi)容,還需要用自然語(yǔ)言去表達(dá)它們之間的關(guān)系,需要參賽者在CV(Ocr、Object Detection)、NLP(Text Generation)、Model Fusion等領(lǐng)域都具備很高的專業(yè)知識(shí),具有很高的挑戰(zhàn)性。
基于公司的海量數(shù)據(jù),汽車(chē)之家人工智能算法團(tuán)隊(duì)在語(yǔ)音、視覺(jué)、NLP等技術(shù)方向均積累了大量的應(yīng)用經(jīng)驗(yàn),并基于人工智能多模態(tài)技術(shù)的優(yōu)勢(shì)賦能公司數(shù)據(jù)產(chǎn)品研發(fā),在知識(shí)庫(kù)構(gòu)建、培訓(xùn)系統(tǒng)開(kāi)發(fā)和智能生成等場(chǎng)景中廣泛應(yīng)用。以智能培訓(xùn)平臺(tái)為例,該平臺(tái)旨在滿足主機(jī)廠新車(chē)發(fā)布后培訓(xùn)經(jīng)銷(xiāo)商銷(xiāo)售能力的需求,結(jié)合汽車(chē)之家和平安集團(tuán)的數(shù)據(jù)及技術(shù)優(yōu)勢(shì),將人工智能多模態(tài)技術(shù)應(yīng)用于智能陪練、防作弊、問(wèn)答機(jī)器人3大場(chǎng)景模塊。
隨著公司創(chuàng)新業(yè)務(wù)的大力發(fā)展,越來(lái)越多的場(chǎng)景需要人工智能技術(shù)的加持,例如視頻資源的結(jié)構(gòu)化分析、視頻/圖片中文本知識(shí)結(jié)構(gòu)化提取存儲(chǔ)、通話中的語(yǔ)義理解等。汽車(chē)之家始終將科技軟實(shí)力作為公司數(shù)字化的基石,其技術(shù)團(tuán)隊(duì)在多模態(tài)方向的技術(shù)積累與突破,不僅為公司的“生態(tài)化”戰(zhàn)略推進(jìn)打造技術(shù)護(hù)城河,同時(shí)為公司創(chuàng)新業(yè)務(wù)發(fā)展與賦能行業(yè)數(shù)字化轉(zhuǎn)型提供了堅(jiān)實(shí)后盾。
聲明:本文為廣告信息,不代表本站觀點(diǎn)。如有違規(guī)或侵權(quán),請(qǐng)聯(lián)系我們。