Riemann7的個人博客分享 http://www.ueservicedoffices.com/u/Riemann7

博文

Learning-to-learn項目總結

已有 463 次閱讀 2019-5-2 23:20 |個人分類:科研DEMO|系統分類:科研筆記

        過去的一年,我主要領導和參與了兩個項目,分別是語音分離和learning-to-learn。其中語音分離還是原來的老本行聲音技術下面的一個小領域,在其他博文已經做了介紹。本篇文章的目的主要是總結一下learning-to-learn項目的經驗,以便吃一塹長一智。

        Learning to learn項目主要包含三個子課題,分別是機械臂自動控制、推薦系統、以及小樣本學習(few-shot learning)等。這篇文章主要介紹機械臂自動控制和小樣本學習。

        對于機械臂自動控制,隨著技術的進步,各種設備的智能化程度已經有了很大的提高,在人們生活和工作的各種場景中得到了應用,極大的方便了人們的生活和工作。盡管如此,設備智能化的程度仍然不夠高,還需要進一步地提高。讓機械臂更加智能、能夠快速學會完成各種任務、適應各種環境、實現自主控制的需求變得越來越廣泛和迫切,因為這不僅能夠極大地降低人力成本,而且能夠提高生產效率。

        本子課題提出基于強化學習和元學習相結合的機械臂自主控制方法,使得機械臂能夠利用先驗知識,更快速地學會完成新的任務。這不僅對于縮短訓練時間,提高計算資源的利用率,而且對于最終的性能的提高,都有很大幫助。另外,由于在真實環境中訓練機械臂的成本過于高昂,大部分機械臂控制模型的訓練都是在仿真環境中進行的,待模型訓練完成后再遷移到真實環境中去。但由于真實環境與仿真環境總是存在不可避免的差異,將仿真環境中訓練好的模型直接遷移到真實環境,效果往往并不理想。而通過將元學習與強化學習相結合,可以使用少量樣本對仿真環境中訓練的模型進行微調,從而快速地適應真實環境。

        通過應用本項目所研發的技術,可以極大地提高工業機械臂的自動化程度,譬如快速地轉換到執行新的任務、快速地部署到新的產品生產流水線等等,從而為企業節省大量部署成本和時間,進而引領一場新的生產方式的變革。下面是我們的機械臂的演示demo的視頻:

image.png

如需完整視頻,可以聯系我(shiziqiang@cn.fujitsu.com或者shiziqiang7@gmail.com

        關于小樣本學習,對于人類來說,僅僅需要少量樣本就能學會不同的概念,比如幼兒僅僅需要看過一張或者少量幾張貓和狗的照片,就可以對未知的貓狗圖片進行分類。而目前的AI系統都需要大量的標注樣本數據進行模型的訓練,但實際應用中,很多問題是沒有大量的標注數據,并且獲取標注數據的成本也非常大,例如在醫療領域、安全領域等。

        因此,如何通過舉一反三的方式進行小樣本學習,成為了一個重要的研究方向。拿分類問題來說,訓練集中每個類可能只有一張或者幾張樣本。它面臨的問題是:(1)訓練過程中有從未見過的新類,只能借助每類少數幾個標注樣本;(2)不改變已經訓練好的模型。解決少樣本學習問題,對于提高數據利用效率,學習泛化知識有著至關重要的作用。

        去年一年通過我們的努力,提出了通過在對抗特征中學習的方法在公開數據集miniImageNet和tieredImageNet上都取得了目前世界最好的性能,其中在miniImageNet上五類僅僅標注1張圖片,分類準確率達到63.28%,在tieredImageNet上五類僅僅標注1張圖片,分類準確率達到69.54%;如果每類的標注增加到5張標注圖片,則分類準確率提高到78.70%和84.35%。相關論文請查看https://arxiv.org/pdf/1903.10225.pdf。

image.png

圖1 對抗區域注意力可視化






http://www.ueservicedoffices.com/blog-907554-1176769.html

上一篇:語音聲音分離軟件FurcaNeXt v1.0
下一篇:參加ICASSP2019國際學術會議

0

該博文允許注冊用戶評論 請點擊登錄 評論 (0 個評論)

數據加載中...
掃一掃,分享此博文

Archiver|手機版|科學網 ( 京ICP備14006957 )

GMT+8, 2019-5-18 04:13

Powered by ScienceNet.cn

Copyright © 2007- 中國科學報社

返回頂部
时时彩平台