close
本文根據Seq2Seq模型在機器翻譯問題取得不錯的成果,提出影像標注也是一種翻譯的概念,使用Seq2Seq模型解決影像標注問題
將這種使用CNN提取影像特徵,RNN生成影像標注的模型稱作NIC網路。
使用CNN解析影像特徵,獲得影像特徵向量最後通過RNN將此影像向量解碼成英文描述
在多個資料集上驗證此方法的可行性與穩定性。
後續研究為Show Attend and Tell,將Seq2Seq常用的改進方法- Attention Mechanism 引入獲得了State of Art的效果。
文章標籤
全站熱搜
留言列表