報(bào)告題目:細(xì)粒度視覺(jué)分類(lèi)與檢索
報(bào)告人:彭宇新
主持人:趙世杰
報(bào)告時(shí)間:2021年11月11日(周四)晚上19:00
報(bào)告地點(diǎn):騰訊會(huì)議ID:127 470 024
報(bào)告簡(jiǎn)介:
與一般的視覺(jué)分類(lèi)不同,細(xì)粒度視覺(jué)分類(lèi)旨在對(duì)粗粒度的大類(lèi)(如鳥(niǎo)、車(chē)等)進(jìn)行細(xì)粒度的子類(lèi)劃分(如大冠蠅霸鹟、阿卡迪亞霸鹟、藍(lán)鹀等鳥(niǎo)類(lèi)子類(lèi)別;奧迪A6、A8等車(chē)類(lèi)子類(lèi)別),其挑戰(zhàn)在于外形、顏色等相似導(dǎo)致的不同類(lèi)別差異小,姿態(tài)、視角等不同導(dǎo)致的相同類(lèi)別差異大。如何借鑒人腦的認(rèn)知機(jī)理,模擬視覺(jué)注意力機(jī)制學(xué)習(xí)多粒度的辨識(shí)性特征,突破細(xì)粒度視覺(jué)分類(lèi)難題,對(duì)于提高計(jì)算機(jī)的感知和認(rèn)知能力至關(guān)重要。本報(bào)告將介紹我們?cè)诩?xì)粒度視覺(jué)分類(lèi)上的相關(guān)研究進(jìn)展,包括空間拓?fù)渥⒁饬W(xué)習(xí)、堆疊式深度強(qiáng)化學(xué)習(xí)、層次化深度增量遷移學(xué)習(xí)等方法,以及我們?cè)诩?xì)粒度跨媒體檢索上的探索,實(shí)現(xiàn)了由圖像、視頻到跨媒體的擴(kuò)展,由分類(lèi)到檢索的擴(kuò)展。
報(bào)告人簡(jiǎn)歷:
彭宇新,北京大學(xué)二級(jí)教授、博士生導(dǎo)師、國(guó)家杰出青年科學(xué)基金獲得者、國(guó)家級(jí)高層次人才計(jì)劃入選者、中國(guó)人工智能產(chǎn)業(yè)創(chuàng)新聯(lián)盟專(zhuān)家委員會(huì)主任、中國(guó)工程院“人工智能2.0”規(guī)劃專(zhuān)家委員會(huì)專(zhuān)家、北京圖象圖形學(xué)學(xué)會(huì)副理事長(zhǎng)、中國(guó)圖象圖形學(xué)學(xué)會(huì)副秘書(shū)長(zhǎng)。主要研究方向?yàn)榭缑襟w分析與推理、圖像視頻識(shí)別與理解、計(jì)算機(jī)視覺(jué)、人工智能。以第一完成人獲2016年北京市技術(shù)發(fā)明一等獎(jiǎng)和2020年中國(guó)電子學(xué)會(huì)科技進(jìn)步一等獎(jiǎng),2008年獲北京大學(xué)寶鋼獎(jiǎng)教金優(yōu)秀獎(jiǎng),2017年獲北京大學(xué)教學(xué)優(yōu)秀獎(jiǎng)。主持了863、國(guó)家自然科學(xué)基金等20多個(gè)項(xiàng)目,發(fā)表論文160多篇,包括ACM/IEEE Trans和CCF A類(lèi)論文70多篇。多次參加由美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)局NIST舉辦的國(guó)際評(píng)測(cè)TRECVID視頻樣例搜索比賽,均獲第一名。主持研發(fā)的跨媒體互聯(lián)網(wǎng)內(nèi)容分析與識(shí)別系統(tǒng)已經(jīng)應(yīng)用于公安部、工信部、國(guó)家廣播電視總局等單位。擔(dān)任IEEE TCSVT等期刊編委。