gydtep 发表于 2020-10-13 14:44:00
JindoFS在对阿里云OSS适配优化的同时,提供分布式缓存和计算加速,刚刚写出去的和重复访问的数据可以缓存在本地设备上,包括HDD,SSD和内存,我们都分别专门优化过。gydtep 发表于 2020-10-13 16:17:38
彻底解决这些问题,完全满足文件系统语义,根本上需要自己实现文件元数据管理,像HDFS NameNode那样。gydtep 发表于 2020-10-13 16:24:38
HDFS有不少比较高级的特性和接口,比如支持truncate,append,concat,hsync,snapshot和Xattributes。gydtep 发表于 2020-10-13 16:34:28
像HBase依赖hsync/snapshot,Flink依赖truncate。数据湖架构的开放性也决定了还会有更多的引擎要对接上来,对这些高级接口有更多需求。gydtep 发表于 2020-10-13 18:44:09
基于这些因素,我们进一步开发和推出JindoFS block模式,在OSS对象存储的基础上针对大数据计算进行深度定制,仍然提供标准的HCFS接口,gydtep 发表于 2020-10-13 19:40:46
JindoFS block模式对标HDFS,不同的是采取云原生的架构,依托云平台我们做了大量简化,使得整个系统具有弹性,轻量和易于运维的特点和优势。gydtep 发表于 2020-10-14 07:39:24
直播带货是淘宝连接商品和消费者的重要方式,通过对直播视频中商品进行实时识别和推荐,可实现消费者边看边买的消费体验,gydtep 发表于 2020-10-14 09:46:17
最后,现有数据集多为单一的图片数据集,我们还提供了主播语音翻译文本、商品图标题文本等多模态的信息,进行多模态商品检索的研究,能够更加贴近真实场景。gydtep 发表于 2020-10-14 09:54:07
我们相信 Watch and Buy 数据集的这些特性将会持续激发视频多模态检索领域的技术创新研究。gydtep 发表于 2020-10-14 11:29:50
对产业发展和人们的日常生活来说,人工智能究竟可以做些什么?上至载人航天航空,下至微型机器人医疗,人工智能可谓是无处不在。