百独托管7500 紫田网络超高转化播放器收cps[推荐]速盾CDN 免实名免备防屏蔽阿里云 爆款特卖9.9元封顶提升alexa、IP流量7Q5团队
【腾讯云】中小企福利专场【腾讯云】多款产品1折起高防 随时退换 好耶数据小飞国外网赚带你月入万元炎黄网络4H4G10M 99每月
香港带宽CN2/美国站群优惠中客数据中心 服务器租用联盟系统移动广告平台 中易企业专场腾讯云服务器2.5折九九数据 工信部正规资质
腾讯云新用户大礼包代金券高价收cpa注册量高价展示【腾讯云】2核2G/9.93起租服务器找45互联 随时退换阿里云 短信服务 验证秒达

[国内信息] 免费领取阿里云服务器2000元代金券! [复制链接]
查看:625204 | 回复:3442

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-2 09:28:05 | 显示全部楼层 来自 中国河北衡水
左图来自低质量相机,并且是前向拍摄;右图来自高质量相机,并且是侧向拍摄;因为相机拍摄质量以及拍摄视角不同,这就导致POI牌匾的亮度、形状、清晰度等都存在非常大的差异。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-2 14:27:12 | 显示全部楼层 来自 中国河北衡水
而如何在差异较大的异源数据中实现POI牌匾检索,是一个非常具有挑战性的问题。

遮挡严重

在道路场景中,经常存在树木以及车辆等干扰信息,并且由于拍摄视角原因,拍摄到的POI牌匾经常会面临严重的遮挡问题
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-2 18:35:14 | 显示全部楼层 来自 中国河北衡水
POI牌匾还有一个独有特性就是对文本强依赖,主要是对POI名称文本的依赖。在下图场景中,两个牌匾的整体布局以及颜色都非常相似,但是其中POI名称发生了变化。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-5 08:45:17 | 显示全部楼层 来自 中国河北衡水
在我们的业务场景中,存在一些外观相似而细节有一定差异的牌匾,如图8 (c) 所示,在这种情况下,我们希望模型可以关注到牌匾中的细粒度信息,比如牌匾中文字的字体、文字排版或者是文字内容本身。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-5 10:09:58 | 显示全部楼层 来自 中国河北衡水
而注意力机制则可以帮助模型在大量信息中准确地关注到能够区分不同牌匾更为关键的部分。因此,我们在网络中引入了注意力模块,让模型学习关键信息,以提升全局特征的辨别能力。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-5 12:44:49 | 显示全部楼层 来自 中国河北衡水
我们采用了空间注意力机制SGE(Spatial Group-wise Enhance)[4],SGE通过对特征图上的每个空间位置生成一个注意力因子来调整每个空间位置处特征的重要性。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-5 15:31:39 | 显示全部楼层 来自 中国河北衡水
,使用语义特征向量和特征图进行position-wise点乘,得到注意力图,然后将注意力图与特征图进行position-wise点乘,以此来增强特征,从而获得在空间上分布更好的语义特征。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-5 19:54:18 | 显示全部楼层 来自 中国河北衡水
为了减少局部特征的损失,我们对网络backbone进行了改进,取消了ResNet网络最后一个block中的下采样,使得最终的特征图中包含更多的局部信息。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-6 09:26:10 | 显示全部楼层 来自 中国河北衡水
除此之外,我们使用GeM[3]池化层替代了最后一个global average pooling,GeM是一种可学习的特征聚合方法,global max pooling和global average pooling都是它的特殊情况,使用GeM池化可以进一步提升全局特征鲁棒性。
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

141

主题

9万

帖子

1030

积分

落伍者(两全齐美)

Rank: 2

贡献
7732
鲜花
24
注册时间
2008-10-11

落伍者落伍手机绑定

 楼主| 发表于 2022-10-6 12:17:07 | 显示全部楼层 来自 中国河北衡水
在针对全局特征进行优化以后,现有模型仍然在以下三个方面表现不够好:1)牌匾截断的情况,特征学习质量差,如图8(a);2)遮挡的牌匾,特征中引入一些无关的上下文信息
腾讯云爆款2核2G3M云服务器首年 61元,叠加红包再享折上折,官网活动网址:https://curl.qcloud.com/UHULq3SQ
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

论坛客服/商务合作/投诉举报:2171544 (QQ)
落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
© 2001-2014

浙公网安备 33060302000191号

浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

  落伍法律顾问: ITlaw-庄毅雄

手机版|找回帐号|不能发帖?|Archiver|落伍者

GMT+8, 2024-5-5 20:52 , Processed in 0.114457 second(s), 26 queries , Gzip On.

返回顶部