本文共 396 字,大约阅读时间需要 1 分钟。
论文创新点 本文提出了一种全新的零样本学习框架,称为ZSLViT(Zero-Shot Learning Vision Transformer),旨在通过渐进式学习与语义相关的视觉特征,显著提升视觉语义交互的效果。我们引入了一种名为语义嵌入token学习(SET)机制,该机制通过语义增强和语义引导的方式,进一步优化了视觉特征的表达和语义信息的捕捉能力。
本文提出了一种全新的零样本学习框架,称为ZSLViT(Zero-Shot Learning Vision Transformer),旨在通过渐进式学习与语义相关的视觉特征,显著提升视觉语义交互的效果。我们引入了一种名为语义嵌入token学习(SET)机制,该机制通过语义增强和语义引导的方式,进一步优化了视觉特征的表达和语义信息的捕捉能力。
转载地址:http://htrfk.baihongyu.com/