检 索
学术期刊
切换导航
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
按学科分类
Journals by Subject
按期刊分类
Journals by Title
医药卫生
Medicine & Health
工程技术
Engineering & Technology
数学与物理
Math & Physics
经济与管理
Economics & Management
人文社科
Humanities & Social Sciences
化学与材料
Chemistry & Materials
信息通讯
Information & Communication
地球与环境
Earth & Environment
生命科学
Life Sciences
首页
文章
从视觉到文本:图像描述生成的研究进展综述
DOI:
,
PDF
,
下载:
30
浏览: 296
作者:
魏忠钰1 范智昊1 王瑞泽2 承怡菁1 赵王榕1 黄萱菁3
;
作者单位:
1.复旦大学大数据学院;2.复旦大学工程与应用技术研究院;3.复旦大学计算机科学与技术学院
;
关键词:
图像描述生成;跨模态特征对齐;文献综述
;
摘要:
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。
投稿
相关文章
大数据技术在金融风控中的应用研究
程序化护理干预模式在脑出血患者中的应用及对认知水平的影响研究
一种用于小孔径攻丝的工装设计
一种便携式自动控制气动短路接地装置研制
关于建筑电气安装工程施工质量控制研究
学术共建
清华大学出版社
北大中文系
国家工程技术数字图书馆
维普网
万方数据库