close

本文根據Seq2Seq模型在機器翻譯問題取得不錯的成果,提出影像標注也是一種翻譯的概念,使用Seq2Seq模型解決影像標注問題

將這種使用CNN提取影像特徵,RNN生成影像標注的模型稱作NIC網路。

使用CNN解析影像特徵,獲得影像特徵向量最後通過RNN將此影像向量解碼成英文描述

在多個資料集上驗證此方法的可行性與穩定性。

後續研究為Show Attend and Tell,將Seq2Seq常用的改進方法- Attention Mechanism 引入獲得了State of Art的效果。


arrow
arrow

    低階ㄇㄋ 發表在 痞客邦 留言(0) 人氣()