基于多模态特征的视频密集描述生成方法
马苗,陈小秋,田卓钰
基于多模态特征的视频密集描述生成方法
A Dense Video Captioning Method Based on Multi-modal Features
{{custom_ref.label}} |
{{custom_citation.content}}
{{custom_citation.annotation}}
|
/
〈 | 〉 |