mongodb与mysql全表扫描能力PK
admin
2023-04-12 05:23:08
0

nosql的数据在内存里,而传统rdbms,某个select第一次执行的时候,如果发现内存里没有需要的数据(比如mysql的innodb buffer pool),会去从磁盘读取,然后再开始计算,这样子从原理上就必然比nosql要慢一些,但是,会慢多少呢?可以用一个分组统计的全表扫描来PK下。


测试环境如下:

server:阿里云服务器(Ubuntu14.04+1核cpu和 1G内存)

mysql:5.5.41

mysql服务端参数:innodb_buffer_pool_size = 512M   (其余都默认)

mongodb:2.4.9


这里用一个1000多万行记录的表作为测试对象,这个表只有一个字段:imsi。

在mysql里建测试对象,导表:

create database db_test;

create table ul_inbound(imsi varchar(15));
load data infile '/tmp/inbound.sub.log' into table ul_inbound(imsi);


测试结果:

mysql> select imsi,count(*) from ul_inbound group by imsi having count(*) >5000;
+-----------------+----------+
| imsi            | count(*) |
+-----------------+----------+
| 250017831851018 |     5166 |
| 283100106389033 |    21291 |
| 302720304966683 |    41598 |
| 302720502859575 |     8787 |
| 302720505260881 |     7932 |
| 310170801568405 |     6018 |
| 310170802085117 |    13452 |
| 310170802299726 |    13824 |
| 310410577936479 |     5772 |
| 310410610359421 |     5790 |
| 310410661857060 |     7038 |
| 310410669731926 |     7788 |
| 310410671702203 |     6705 |
| 310410673812082 |     5403 |
+-----------------+----------+
53 rows in set (1 min 47.73 sec)


花了107秒。


在mongodb里导入数据(导入到my_mongodb的sub里):

#!/usr/bin/python
# Python:2.7.6
# Filename:mongodb.py
import pymongo
import random

conn = pymongo.Connection("127.0.0.1",27017)  #Connection() without parameters will default connect localhost mongodb
db = conn.my_mongodb
for imsi in open('inbound.sub.log'):
    imsi = imsi.strip('\n')
    db.sub.insert({'imsi':imsi})


> use my_mongodb;
switched to db my_mongodb
> db.sub.aggregate( [ { $group: { _id: "$imsi",  count: { $sum: 1 } } }, { $match: { count: { $gt: 5000 } } } ]);
{
        "result" : [
                {
                        "_id" : "401025006559964",
                        "count" : 17982
                },
                {
                        "_id" : "310410757405261",
                        "count" : 7269
                },


10秒左右搞定。


注:

1)这个只是为了测试全表扫描能力,实际mysql查询能力会受到索引、服务端参数等诸多因素的影响。

2)mongodb的使用,必须内存管够,如果内存不够,要用swap,能力会大受影响。



相关内容

热门资讯

玩家攻略科普“扣点点到底是不是... 玩家攻略科普“扣点点到底是不是挂?”(其实是有挂)您好,扣点点这个游戏其实有挂的,确实是有挂的,需要...
我来教教您“新永和炸/金/花开... 我来教教您“新永和炸/金/花开挂器?”(太坑了原来有挂)您好,新永和炸/金/花这个游戏其实有挂的,确...
今日重大发现“阿道夫游戏可以开... 有 亲,根据资深记者爆料阿道夫游戏是可以开挂的,确实有挂(咨询软件无需打...
玩家最新攻略“山西扣点点到底是... 您好:山西扣点点这款游戏可以开挂,确实是有挂的,需要了解加客服微信【9784099】很多玩家在这款游...
最新引进“多多来了是不是有挂?... 网上科普关于“多多来了有没有挂”话题很是火热,小编也是针对多多来了作*弊开挂的方法以及开挂对应的知识...
不缺会员不差钱,多家教培机构突... 明明有300多名会员、月入流水也有30万元+、不缺生源更不差钱,这样的优质教培机构竟被硬生生祸害到关...
今日重大通报“新贝壳炸/金/花... 网上科普关于“新贝壳炸/金/花有没有挂”话题很是火热,小编也是针对新贝壳炸/金/花作*弊开挂的方法以...
新能源车跑高速没电,两人推车被... 极目新闻记者 吴昌华12月26日晚,广东交警发布信息:凌晨的高速公路上,一辆新能源车跑高速没电,两人...
玩家最新攻略“欢乐游辅助器?”... 网上科普关于“欢乐游有没有挂”话题很是火热,小编也是针对欢乐游作*弊开挂的方法以及开挂对应的知识点,...
玩家分享攻略“卡农牛牛辅助器?... 家人们!今天小编来为大家解答卡农牛牛透视挂怎么安装这个问题咨询软件客服徽9784099的挂在哪里买很...