MongoDB-Map&Reduce
admin
2023-04-11 19:24:02
0

模拟大数据搜索场景--‐何旭东

请使用脚本插入本次课程中的Map&Reduce举例的学生表到1000w条文档。字段

保持不变。

使用Map&Reduce 计算出10

请提交Map&Reduce 程序,已经对应的计算结果。

>

db.users.count();

10000000

>

db.users.find();

{

"_id"

:

ObjectId("55ca9ae785b177a46da9494f"),

"classid"

:

1,

"age"

:

37,

"name"

:

"name0"

}

{

"_id"

:

ObjectId("55ca9ae785b177a46da94950"),

"classid"

:

1,

"age"

:

12,

"name"

:

"name1"

}

{

"_id"

:

ObjectId("55ca9ae785b177a46da94951"),

"classid"

:

1,

"age"

:

31,

"name"

:

"name2"

}

{

"_id"

:

ObjectId("55ca9ae785b177a46da94952"),

"classid"

:

2,

"age"

:

27,

"name"

:

"name3"

}

脚本创建模拟数据:

for (var i=1;

i<10000000;i++){ db.users.save({classid:Math.ceil(Math.random()*(2)),age:Math.cei

l(Math.random()*(38-8)+8),name:"name"+i}) };

Map 函数 Map 函数必须调用emit(key,value)返回键值对。使用this 返回当前待

处理的文档。

> mapf = function(){emit(this.classid, 1)}

function (){emit(this.classid, 1)}

Reduce 函数

Reduce 函数接收的参数类似Group 效果,已经按照健聚合过一次

将Map 返回的键值序列组合成{key, [value1,value2,value3,....,valuen]}传递给

Reduce,Reduce 函数对values 统计

> reducef=function (key, values) {

... var count = 0;

... values.forEach(function (v) {count += v;}); return count;

... }

function (key, values) {

var count = 0;

values.forEach(function (v) {count += v;}); return count;

}

Options 更多的控制细节

> res = db.runCommand({ mapreduce:"users", map:mapf, reduce:reducef,

out:"users_res",

finalize:ff,

query:{age:{$lt:10}}

...

});

{

"result"

:

"users_res",

"timeMillis"

:

6251,

"counts"

:

{

"input"

:

333716,

"emit"

:

333716,

"reduce"

:

6676,

"output"

:

2

},

"ok"

:

1

}

>

结果:

>

db.users_res.find();

{

"_id"

:

1,

"value"

:

{

"classid"

:

1,

"count"

:

167142

}

}

{

"_id"

:

2,

"value"

:

{

"classid"

:

2,

"count"

:

166574

}

}

1 班小于10 岁的有167142 人。2 班小于10 岁的有166574 人。

继续统计小于20 岁以下,每个班学生的个数:

> res = db.runCommand({ mapreduce:"users", map:mapf, reduce:reducef,

out:"users_2res", finalize:ff, query:{age:{$lt:20}}

... ... });

{

"result" : "users_2res",

"timeMillis" : 23247,

"counts" : {

"input" : 3666243,

"emit" : 3666243,

"reduce" : 73326,

"output" : 2

},

"ok" : 1

}

> db.users_2res.find();

{ "_id" : 1, "value" : { "classid" : 1, "count" : 1832306 } }

{ "_id" : 2, "value" : { "classid" : 2, "count" : 1833937 } }

1 班小于20 岁的有1832306 人。2 班小于20 岁的有1833937 人。


相关内容

热门资讯

魏平政出线几率高!国民党整合拼... 海峡导报综合报道 国民党迟未公布彰化县长人选,地方盛传,周三国民党中常可能会有答案,引发关注。对此,...
人均奖金600万,知道内存为什... 唯物的中国芯片产业深度观察AI带动存储狂飙,韩国存储大厂SK海力士也跟着起飞。近日,有投行预测其年终...
“洪迪厄斯”号邮轮最后一批转运... △当地时间5月11日,荷兰埃因霍温,身着防护服的人员在机场载有“洪迪厄斯”号乘客和船员的飞机旁工作当...
特朗普当场问:谁喜欢万斯?谁喜... 美国副总统万斯和国务卿鲁比奥谁会成为2028年共和党总统候选人备受关注,总统特朗普5月11日在白宫的...
实探杭州“被电商拉黑”街道:随... 据扬子晚报报道,5月6日,一名网友在社媒发帖称,自己在某电商平台看中了一款商品,商品界面却显示其地址...
大连女子烧烤店内用铁签喂狗,十... 5月11日,一段网传视频显示,女子让宠物狗坐在辽宁大连一家烧烤店的卡座上,并用铁签将肉串喂给宠物狗,...
沃尔核材获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示沃尔核材(002130)新获得一项实用新型专利授权,专利名为“...
科技伦理审查助力人工智能产业高... 转自:证券日报     本报记者 郭冀川     随着AI(人工智能)技术迭代加速,相关伦理审查的重...
捷昌驱动获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示捷昌驱动(603583)新获得一项实用新型专利授权,专利名为“...
2026云手机为什么这么火?这... 你是否也有过这样的念头:想试试云手机,但一看价格,月付几十甚至上百元,立马打了退堂鼓?又或者,你曾贪...