清秀发卡

文章
4
资源
0
加入时间
2年10月24天

【论文阅读】Adaptive Cross-Modal Prototypes for Cross-Domain Visual-Language Retrieval

文章目录阅读目标问题回答摘要引入方法网络输入视觉编码器EvE_vEv​和文本编码器ElE_lEl​文本龙骨KlK_lKl​视觉龙骨KvK_vKv​源原型网络PsP^sPs目标原型网络PtP^tPt子网络及输入输出最大化互信息阅读目标了解在跨模态检索中如何构建原型了解本文是如何应对non-iid问题的问题回答原型在本文中是一个线性映射层的参数,此映射层的输出代表原型表示给每个样本分配的概率,原型对照的基准是作者通过聚类自主构建的龙骨(聚类中心),而样本对照的基准则是龙骨对每个样本分配的概率最

信息的度量(信息熵)

信息熵:一条信息的信息量和其不确定性有着直接的关系,比如我们想弄清楚一个非常不确定的事需要大量的信息,可以认为信息量就是不确定性的多少。比如错过了世界杯,想要猜32个球队哪只是冠军,可以先问是1-16吗,假如猜对了,可以继续问1-8吗,这样就需要五次就可以知道哪个球队是冠军,所以谁是冠军这个信息就是5.有些人发现可能不需要五次就能猜出来谁是冠军,因为有些球队夺冠的可能性更大一些,因此猜的时...