gydtep 发表于 2021-12-7 18:12:42

为了优化牌匾检索效果,我们融合了牌匾中的视觉信息与文本信息,设计了多模态检索模型。针对视觉信息,我们优化了模型全局特征和局部特征的提取能力。针对文本信息,我们使用BERT对牌匾的OCR结果进行编码,将其作为辅助特征,并与视觉特征融合后进行度量学习。

gydtep 发表于 2021-12-8 11:12:51

和CNN相比,Transformer具有全局感受野以及高阶相关性建模的特点,使其在特征提取上有着更好的表征能力。此外,Transformer的输入较为灵活,可以方便地将其他模态信息进行编码,并和图像特征一起输入到模型中,因此其在多模特征融合上也有较大的优势。

gydtep 发表于 2021-12-9 07:46:29

实际实践过程中,我们通过不断的迭代以提升特征的精准度与全面度,具体的核心几个提取过程为:

1、特征扩充:元数据中的字段有可能为原始数据,这部分需要关联到具体数据表并找出有意义的字段。

gydtep 发表于 2021-12-9 17:21:24

这部分我们来探讨下如何用科技解决未来的问题,这里我提一下目前在做的几个方面:

第一件事情我们做了大概3年时间,达摩院AI Earth团队一致在研究如何用数字技术解决包括环境、气象、水利、农业等问题。

gydtep 发表于 2021-12-10 13:42:54

我们所有的云原生软件必须是开源的,云原生开源有一个非常基本的理念“三位一体”,我们自己用的技术,阿里云对客户提供的技术,和社区开源的技术,我们希望这些技术软件是一个版本,之间没有代差,在此基础上我们再针对业务做差异化的提升和改进,用“三位一体”的方式希望技术软件里能够真正跟开源形成一个血脉相通的整体。

gydtep 发表于 2021-12-11 13:33:52

浅析数据库并发控制机制中提到过,为了避免只读事务与写事务之间的冲突,避免写操作等待读操作,几乎所有的主流数据库都采用了多版本并发控制(MVCC)的方式,也就是为每条记录保存多份历史数据供读事务访问,新的写入只需要添加新的版本即可,无需等待。InnoDB在这里复用了Undo Log中已经记录的历史版本数据来满足MVCC的需求。

gydtep 发表于 2021-12-12 18:24:29

获得了可用的Undo Segment之后,该事务会在合适的位置初始化自己的Undo Log Header,之后,其所有修改产生的Undo Record都会顺序的通过trx_undo_report_row_operation顺序的写入当前的Undo Log,其中会根据是insert还是update类型,分别调用trx_undo_page_report_insert或者trx_undo_page_report_modify。

gydtep 发表于 2021-12-13 10:15:40

如果不可见就沿着Record或Undo Record中记录的rollptr一路找更老的历史版本。如下图所示,事务R开始需要查询表t上的id为1的记录,R开始时事务I已经提交,事务J还在运行,事务K还没开始,

gydtep 发表于 2021-12-14 06:35:28

拿到一个Undo Record之后,自然地,就是对其中内容的解析,这里会调用row_undo_ins_parse_undo_rec,从Undo Record中获取修改行的table,解析出其中记录的主键信息,如果是update类型,还会拿到一个update vector记录其相对于更新的一个版本的变化。

gydtep 发表于 2021-12-15 14:25:09

除了深耕自立自强的高科技,阿里还在践行“人人受益、责任担当、开放共享”的好科技,希望用技术给客户创造更好的价值,为社会创造更大的贡献。
页: 1 2 3 4 5 6 [7] 8 9 10 11 12 13 14 15 16
查看完整版本: 阿里云轻量应用服务器2核2G仅售:58元/年