[論文筆記]Show and Tell: A Neural Image Caption Generator @ 蟲匯聚之所

關閉廣告

Mar 27 Fri 2020 10:00
[論文筆記]Show and Tell: A Neural Image Caption Generator

本文根據Seq2Seq模型在機器翻譯問題取得不錯的成果，提出影像標注也是一種翻譯的概念，使用Seq2Seq模型解決影像標注問題

將這種使用CNN提取影像特徵，RNN生成影像標注的模型稱作NIC網路。

使用CNN解析影像特徵，獲得影像特徵向量最後通過RNN將此影像向量解碼成英文描述

在多個資料集上驗證此方法的可行性與穩定性。

後續研究為Show Attend and Tell，將Seq2Seq常用的改進方法- Attention Mechanism 引入獲得了State of Art的效果。

低階ㄇㄋ

蟲匯聚之所

低階ㄇㄋ發表在痞客邦留言(0) 人氣()

E-mail轉寄

▲top

留言列表

發表留言

誰來我家

參觀人氣

本日人氣：
累積人氣：

月曆

«	四月 2024					»
日	一	二	三	四	五	六
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

站方公告

我的好友

文章分類

碼農 (8)

打雜相關 (3)

雜七雜八 (9)

財經相關 (2)

未分類文章 (99)

文章精選

所有文章列表

文章搜尋

新聞交換(RSS)

POWERED BY

(登入)

活動快報

痞客邦...

凡03/23開始，只要至痞客邦APP好康購買票券，就額外... 看更多活動好康

QR Code

動態訂閱

{{ article.user_name }}
{{ article.timestamp * 1000 | date:'MMM.dd.y.hh.mm' }}
{{ article.title }}
{{ article.content }}

我要留言

我的連結

PIXNET Facebook Yahoo! Google MSN

您尚未登入，將以訪客身份留言。亦可以上方服務帳號登入留言

請輸入暱稱 ( 最多顯示 6 個中文字元 )

請輸入標題 ( 最多顯示 9 個中文字元 )

請輸入內容 ( 最多 140 個中文字元 )

請輸入左方認證碼：

看不懂,換張圖

請輸入驗證碼