百独托管7500 紫田网络超高转化播放器收cps[推荐]速盾CDN 免实名免备防屏蔽阿里云 爆款特卖9.9元封顶提升alexa、IP流量7Q5团队
【腾讯云】中小企福利专场【腾讯云】多款产品1折起高防 随时退换 好耶数据小飞国外网赚带你月入万元炎黄网络4H4G10M 99每月
香港带宽CN2/美国站群优惠中客数据中心 服务器租用联盟系统移动广告平台 中易企业专场腾讯云服务器2.5折九九数据 工信部正规资质
腾讯云新用户大礼包代金券高价收cpa注册量高价展示【腾讯云】2核2G/9.93起租服务器找45互联 随时退换阿里云 短信服务 验证秒达

[技术交流] 千万级数据用帝国如何搞数据库?分表蛋疼啊~~ [复制链接]
查看:10881 | 回复:49

3156

主题

6万

帖子

5万

积分

落伍者(五谷丰登)

Rank: 8Rank: 8

贡献
2715
鲜花
114
注册时间
2002-1-31
发表于 2015-7-24 13:09:00 | 显示全部楼层 来自 中国北京
这么多数据
楼下鸡鸡短细软
回复 支持 反对

使用道具 举报

51

主题

1801

帖子

3508

积分

落伍者(两全齐美)

Rank: 2

贡献
2122
鲜花
40
注册时间
2007-10-12

QQ绑定落伍微信绑定落伍手机绑定

发表于 2015-7-24 13:11:58 | 显示全部楼层 来自 中国辽宁大连
我的站四千多万数据,分表
没有使用cms, 自己写的程序,asp.net + mysql
最好是先确定一下分类吧,然后再进行数据的填充。
回复 支持 反对

使用道具 举报

351

主题

1万

帖子

1万

积分

落伍者(四季发财)

河南人

Rank: 4

贡献
2094
鲜花
107
注册时间
2006-7-31

QQ绑定落伍手机绑定

 楼主| 发表于 2015-7-24 13:17:02 | 显示全部楼层 来自 中国河南郑州
阿江 发表于 2015-7-24 13:07
换MSSQL,亿级数据无压力。

江哥,这个数据量帝国应该搞得定,而且不怕占硬盘,生成HTML的。

问题是帝国需要分表,一般是一个大栏目对应一个分表,每个表我估计能撑200-400万。

但是不同表之间的数据没法转移。比如说A文章我刚开始分成了 旅游栏目,后来发现是摄影栏目的,想转出去都没办法了。除非一开始就把数据分好。

可是于我不是特别现实,我需要先把它们都放出去,然后慢慢分类。
卖签名
回复 支持 反对

使用道具 举报

351

主题

1万

帖子

1万

积分

落伍者(四季发财)

河南人

Rank: 4

贡献
2094
鲜花
107
注册时间
2006-7-31

QQ绑定落伍手机绑定

 楼主| 发表于 2015-7-24 13:17:42 | 显示全部楼层 来自 中国河南郑州
leexiaochong 发表于 2015-7-24 13:11
我的站四千多万数据,分表
没有使用cms, 自己写的程序,asp.net + mysql
最好是先确定一下分类吧,然后再 ...

兄台的意思是,一开始就把信息分好类?

目前来看,也只能这样了。
卖签名
回复 支持 反对

使用道具 举报

51

主题

1801

帖子

3508

积分

落伍者(两全齐美)

Rank: 2

贡献
2122
鲜花
40
注册时间
2007-10-12

QQ绑定落伍微信绑定落伍手机绑定

发表于 2015-7-24 13:23:19 | 显示全部楼层 来自 中国辽宁大连
yuewolf 发表于 2015-7-24 13:17
兄台的意思是,一开始就把信息分好类?

目前来看,也只能这样了。

省得以后再搞麻烦,URL都被搜索引擎收录了,再移动更换URL不好。
数据量太大,只让数据库做存储,不要再做过多的计算,不要让数据库计算搜索操作,
非要给网站加个搜索,可以使用lucene+盘古中文分词搞,也可以使用百度的站内搜索
个人建议还是使用百度站内搜索吧,既然开始都说了要做以量取胜的站,搜索功能不会放在第一位,
而是要把搜索引擎及用户放在第一位即可。
回复 支持 反对

使用道具 举报

1099

主题

9546

帖子

9446

积分

落伍管理

正牌猪头,别无分店

Rank: 12Rank: 12Rank: 12

贡献
7068
鲜花
762
注册时间
2004-5-12

落伍手机绑定

发表于 2015-7-24 13:24:57 | 显示全部楼层 来自 中国广东茂名
MySQL分区,可以考虑InnoDB加大量分区来实现
这样前端将没有任何变化,平时使用就是读写一个表。
装B之人必有傻B之处。
回复 支持 反对

使用道具 举报

351

主题

1万

帖子

1万

积分

落伍者(四季发财)

河南人

Rank: 4

贡献
2094
鲜花
107
注册时间
2006-7-31

QQ绑定落伍手机绑定

 楼主| 发表于 2015-7-24 13:28:14 | 显示全部楼层 来自 中国河南郑州
leexiaochong 发表于 2015-7-24 13:23
省得以后再搞麻烦,URL都被搜索引擎收录了,再移动更换URL不好。
数据量太大,只让数据库做存储,不要再 ...

的确如你所说,负载什么的只要勉强撑得住都无所谓,生成嘛,慢点就慢点。

现在考虑的也是URL的统一性。如果不分表,这个URL地址设置成类似 /art/ym/d/id.html 随便换栏目都不怕。但量上来以后,怕后台那里就搞不定了。

如果分表,一开始不分好的话,后面转移起来就超级麻烦了。

搜索的确是打算用百度站内搜索的,程序自带的就不想了。还有一些相关信息等,也会用百度等第三方的,尽量少查询。

连续想了好久,只能一点点先分类,然后发布出去。万一有分类错误的,就那样吧,反正冲量的,就确定不了精确度了。
卖签名
回复 支持 反对

使用道具 举报

351

主题

1万

帖子

1万

积分

落伍者(四季发财)

河南人

Rank: 4

贡献
2094
鲜花
107
注册时间
2006-7-31

QQ绑定落伍手机绑定

 楼主| 发表于 2015-7-24 13:29:21 | 显示全部楼层 来自 中国河南郑州
crazy 发表于 2015-7-24 13:24
MySQL分区,可以考虑InnoDB加大量分区来实现
这样前端将没有任何变化,平时使用就是读写一个表。

Crazy 哥,您的意思是这样分区以后,单表也搞得定?
卖签名
回复 支持 反对

使用道具 举报

392

主题

2万

帖子

2万

积分

落伍热心会员

Rank: 7Rank: 7Rank: 7

贡献
1139
鲜花
543
注册时间
2001-10-4

落伍ASP落伍爱心勋章落伍草根英雄落伍手机绑定

发表于 2015-7-24 13:44:18 | 显示全部楼层 来自 中国河南郑州
yuewolf 发表于 2015-7-24 13:17
江哥,这个数据量帝国应该搞得定,而且不怕占硬盘,生成HTML的。

问题是帝国需要分表,一般是一个大栏 ...


你实验过MYSQL对这种规模的表不分表真的不行?
如果只是依据栏目分表的话,对于MSSQL来说分不分表效率是几乎没有差别的,尤其是只有几千万行数据量的话更不是问题了。
有听说MySQL承受力不如MSSQL,但应该差别不会很大吧。
常常数据库的承受力是超乎想像的。

参考C版的方法升级硬件看看,对大数据库来说硬件性能尤其是磁盘性能影响很大。
也许我没拿到满分,还不算是完美的人。所以我比谁都认真,努力赶上你的标准。
回复 支持 反对

使用道具 举报

351

主题

1万

帖子

1万

积分

落伍者(四季发财)

河南人

Rank: 4

贡献
2094
鲜花
107
注册时间
2006-7-31

QQ绑定落伍手机绑定

 楼主| 发表于 2015-7-24 14:02:53 | 显示全部楼层 来自 中国河南郑州
阿江 发表于 2015-7-24 13:44
你实验过MYSQL对这种规模的表不分表真的不行?
如果只是依据栏目分表的话,对于MSSQL来说分不分表效率 ...

重新看了一遍WC在帝国6.0时代的2000万信息测试,其中有一句:

单表无论是50万、400万甚至1000万数据在管理信息列表与生成页面效率基本是相同的


我想自己很可能是进入误区了。在他的测试文章中最大单表数据是 400万,可现在过去了这么久,应该能承受更多了。

而且,分区配合帝国自带的副表分表,应该搞得定。

还是自己动手测试吧。

感谢@阿江 @leexiaochong @crazy 等热心人,排名无先后。
卖签名
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

论坛客服/商务合作/投诉举报:2171544 (QQ)
落伍者创建于2001/03/14,本站内容均为会员发表,并不代表落伍立场!
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论!
落伍官方微信:2030286 邮箱:(djfsys@gmail.com|tech@im286.com)
© 2001-2014

浙公网安备 33060302000191号

浙ICP备11034705号 BBS专项电子公告通信管[2010]226号

  落伍法律顾问: ITlaw-庄毅雄

手机版|找回帐号|不能发帖?|Archiver|落伍者

GMT+8, 2024-6-16 07:13 , Processed in 0.128797 second(s), 27 queries , Gzip On.

返回顶部