文章标题
作者姓名
关键词
单位名称
检索
AI智能检索
学术期刊
首页
文章
期刊
投稿
首发
学术会议
图书中心
新闻
新闻动态
科学前沿
合作
我们
一封信
按学科分类
按期刊分类
医药卫生
(21)
工程技术
(38)
数学与物理
(12)
经济与管理
(12)
人文社科
(41)
化学与材料
(9)
信息通讯
(10)
地球与环境
(25)
生命科学
(2)
首页
>
文章
从视觉到文本:图像描述生成的研究进展综述
DOI
:
,
PDF
下载:
30
浏览: 399
作者
:
魏忠钰1
;
范智昊1
;
王瑞泽2
;
承怡菁1
;
赵王榕1
;
黄萱菁3
;
作者单位
:
1.复旦大学大数据学院;2.复旦大学工程与应用技术研究院;3.复旦大学计算机科学与技术学院
;
关键词
:
图像描述生成
;
跨模态特征对齐
;
文献综述
;
摘要:
近年来,跨模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对跨视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像描述生成模型的性能评价和图像描述生成模型的主要发展过程四个方面对相关文献进行介绍和总结。最后,该文给出了几个未来的重点研究方向,包括跨视觉和语言模态的特征对齐、自动化评价指标的设计以及多样化图像描述生成。
投稿
相关文章
应用免疫检查点抑制剂慢性阻塞性肺病治疗的探索
体育课与课余体育活动整合研究
品管圈在提高跌倒高危病人复评率的效果观察及应用
摄食训练食物温度的精准分级对脑卒中吞咽障碍患者的影响研究
论存在函数不能用二次迭代函数表示
学术共建
清华大学出版社
北大中文系
国家工程技术数字图书馆
维普网
万方数据库
版权所有 © 2025 世纪中文出版社
京ICP备2024086036号-2