mongodb中使用mapreduce进行分组统计
admin
2023-04-12 14:21:24
0

最近在统计某一个时间段的url去重数,由于数据量巨大导致报错,提示:

distinct failed: {
"errmsg" : "exception: distinct too big, 16mb cap",
"code" : 17217,
"ok" : 0
} at src/mongo/shell/collection.js:1108

最终通过mapreduce来解决如下:

//定义map函数
map=function(){
    emit(this.url,{"count":1});
}
//定义reduce函数
reduce=function(key,values){
    var total=0;
    for(var i=0; i < values.length; i++){
        total+=values[i].count;
    }
    return {count:total}
}
//执行mapreduce函数,其中out的值是存储执行结果的集合
db.runCommand({"mapreduce":"visit","map":map,"reduce":reduce,"query":{"vtime":{"$gte":1412611200,"$lte":1413907119}},"out":"test.tmp"});

关于mapreduce的选项解释如下:

"out":{replace:"collection name"} -- mapreduce输出结果会替换掉原来的collection,collection不存在则创建
"out":{merge:"collection name"} -- 将新老数据进行合并,新的替换旧的,没有的添加进去
"out":{reduce:"collection name"}-- 存在老数据时,在原来的基础上加新的数据(即new value=old value+mapreduce value)
"out":{inline:1} -- 不会创建collection,结果保存在内存里面,只限于结果小于16MB的情况


相关内容

热门资讯

今日重磅消息“国民麻将怎么开挂... 网上科普关于“国民麻将有没有挂”话题很是火热,小编也是针对国民麻将作*弊开挂的方法以及开挂对应的知识...
终于明白“红中麻将有挂吗?”(... 网上科普关于“红中麻将有没有挂”话题很是火热,小编也是针对红中麻将作*弊开挂的方法以及开挂对应的知识...
【今日要闻】“新华棋牌有挂吗?... 您好:新华棋牌这款游戏可以开挂,确实是有挂的,需要了解加客服微信【9752949】很多玩家在这款游戏...
今日重大发现“麻友圈2贵阳捉鸡... 您好:麻友圈2贵阳捉鸡这款游戏可以开挂,确实是有挂的,需要了解加客服微信【4282891】很多玩家在...
玩家最新攻略“腾讯掼蛋有挂吗?... 您好:腾讯掼蛋这款游戏可以开挂,确实是有挂的,需要了解加客服微信【4282891】很多玩家在这款游戏...
最新引进“山西互动有没有挂?”... 最新引进“山西互动有没有挂?”(太坑了原来有挂)您好,山西互动这个游戏其实有挂的,确实是有挂的,需要...
【第一财经】“功夫熊猫金花开挂... 【第一财经】“功夫熊猫金花开挂神器?”(外卦神器下载)您好,功夫熊猫金花这个游戏其实有挂的,确实是有...
【第一资讯】“七千在线可以开挂... 网上科普关于“七千在线有没有挂”话题很是火热,小编也是针对七千在线作*弊开挂的方法以及开挂对应的知识...
最新引进“老友内蒙古麻将辅助器... 最新引进“老友内蒙古麻将辅助器?”(外卦神器下载)您好,老友内蒙古麻将这个游戏其实有挂的,确实是有挂...
演员闫学晶哭穷引争议,称儿子年... 来源 | 《中国经营报》、大河报、浙江经视、白鹿视频、封面新闻、公开信息封图 | 来自网络12月29...