百独托管7500 紫田网络超高转化播放器收cps[推荐]速盾CDN 免实名免备防屏蔽阿里云 爆款特卖9.9元封顶提升alexa、IP流量7Q5团队
【腾讯云】中小企福利专场【腾讯云】多款产品1折起高防 随时退换 好耶数据小飞国外网赚带你月入万元炎黄网络4H4G10M 99每月
香港带宽CN2/美国站群优惠中客数据中心 服务器租用联盟系统移动广告平台 中易企业专场腾讯云服务器2.5折九九数据 工信部正规资质
腾讯云新用户大礼包代金券高价收cpa注册量高价展示【腾讯云】2核2G/9.93起租服务器找45互联 随时退换阿里云 短信服务 验证秒达

[交流] 百度蜘蛛抓取网站API链接的信息,讲解! [复制链接]
查看:2772 | 回复:4

698

主题

3561

帖子

3521

积分

落伍者(两全齐美)

Rank: 2

贡献
907
鲜花
24
注册时间
2008-10-28

落伍手机绑定落伍者

发表于 2021-11-9 15:19:35 | 显示全部楼层 |阅读模式 来自 中国广东惠州
本帖最后由 blogabs 于 2021-11-9 15:28 编辑

百度蜘蛛抓取网站API链接的信息,是以下这种情况:



蜘蛛抓取数据的链接大多数带有/api/,而非网站前端正常访问的网址。

对此,我们打开一条带/api/链接,在网页可以看到一个原始数据,

从反馈来看,这段数据是被“获取成功”的,但有什么用呢?

这种情况比较少见,我在百度站长论坛也没找到合理的解释,但这些天观察下来,我只能自己给出这样的解释:

对静态或伪静态网页,百度蜘蛛进到一个页面后,会先抓取该页面文字、图片、链接、样式等数据,然后接着到一个页面抓取内容;

但对由Javascript生成的网页,百度蜘蛛进入后,发现除了一个标题和几条Javascript链接,其它什么都没有。

遇到这种情况,百度蜘蛛要么放弃,要么只能顺着Javascript链接去抓取数据。

由此,我们大概可以知道,为什么百度蜘蛛会抓取网站API链接里的信息?

因为网站的/api/链接被写进Javascript的代码里,用来调用各种信息。

而百度蜘蛛顺着这个/api/链接抓取到各种信息。

原本我想在robots文件禁用/api/,但考虑到这个站点是新站,所以没有禁止百度蜘蛛抓取。

目前该站点已经被百度收录了。





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复

使用道具 举报

3667

主题

5353

帖子

9

积分

落伍者(一心一意)

Rank: 1

贡献
143
鲜花
0
注册时间
2012-3-15

QQ绑定落伍者落伍手机绑定

发表于 2021-12-16 10:17:15 | 显示全部楼层 来自 中国山东济南
这是什么意思呀,想办法把关键词优化上来可以吗。
回复 支持 反对

使用道具 举报

9

主题

289

帖子

13

积分

落伍者(一心一意)

Rank: 1

贡献
196
鲜花
0
注册时间
2021-12-12

落伍者落伍微信绑定

发表于 2021-12-21 11:36:45 | 显示全部楼层 来自 中国湖南娄底
没看明白
福利社www.183fls.com
回复

使用道具 举报

698

主题

3561

帖子

3521

积分

落伍者(两全齐美)

Rank: 2

贡献
907
鲜花
24
注册时间
2008-10-28

落伍手机绑定落伍者

 楼主| 发表于 2021-12-23 16:36:49 | 显示全部楼层 来自 中国广东惠州

Javascript SEO,可以去了解一下
回复 支持 反对

使用道具 举报

4

主题

5968

帖子

5053

积分

落伍者(三羊开泰)

Rank: 3Rank: 3

贡献
1
鲜花
0
注册时间
2013-9-5

落伍微信绑定落伍手机绑定

发表于 2022-1-22 20:47:14 | 显示全部楼层 来自 中国河南郑州
看不懂
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

论坛客服/商务合作/投诉举报:2171544 (QQ)
落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
© 2001-2014

浙公网安备 33060302000191号

浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

  落伍法律顾问: ITlaw-庄毅雄

手机版|找回帐号|不能发帖?|Archiver|落伍者

GMT+8, 2024-4-27 03:22 , Processed in 0.116239 second(s), 32 queries , Gzip On.

返回顶部