Mongodb是一种基于JSON文档的NOSQL数据库,其数据查询语言我们称之为MQL,如:
db.collectionA.find();--相当于select* from connectionA;
db.inventory.find({ status: “A” }, { item: 1, status: 1 } ) --相当于SELECT_id, item, status from inventory WHERE status = "A“
Find命令只适合用于单表查询(包括嵌套文档和数组查询)
Mongo中的复杂查询、多集合连接查询以及数据分析和计算,均需要使用到聚合查询。,格式如下:
db.collection.aggregate([{stage},{stage},……,{stage}]);
其中stage是聚合的一个步骤,每个stage都是一个json文档。
Mongodb的聚合架构是基于管道,按照stage顺序执行,类似于shell命令的管道,如:
ps–ef|grep LOCAL=NO|awk ‘{print $2}’|xargs kill -9 ,其处理过程为:
聚合查询处理过程如下:
其处理过程为:
转换成SQL相当于:
Selectcust_id,sum(amount) from orders where status=‘a’ group bycust_id;
常用的stage:
stage | 用途 | SQL等价运算符 | 备注 |
$match | 过滤 | WHERE、having | |
$project | 投影 | SELECT | |
$group | 分组 | group by | |
$lookup | 连接查询 | LEFT OUT JOIN | 在mongodb中建议使用嵌套文档,减少连接查询 |
$unwind | 拆解数组为文档 | ||
$sort | 排序 | ORDER BY |
常用的运算符:
运算符 | 用法 |
$eq/$gt/$gte/$lt/$lte | "=/>/>=/<=/<" |
$and/$or/$not/$in | and or not in |
$split | 按照分隔符将字符串拆成数组 |
$sum | sum() |
$avg/$min/$max | avg(),max(),min() |
$push | 将文档构成数组 |
例1:
源数据:
按照item进行分组统计quantity的和。
Selectitem,sum(quantity) from c1 group by item;对应聚合查询如下:
db.c1.aggregate( [ {$group: {_id:"$item", sum_quantity:{$sum:"$quantity"} } } ] ); |
结果:
按照item进行分组统计quantity的和,且结果大于10
Selectitem,sum(quantity) from c1 group by item having sum(quantity)>10;对应聚合查询如下:
db.c1.aggregate( [ {$group: {_id:"$item", sum_quantity:{$sum:"$quantity"}} }, {$match:{sum_quantity:{$gt:10}} } ] ) |
结果:
例2:
源数据:
聚合查询如下:
db.student.aggregate([{ $lookup: { from: "class", localField: "class_id", foreignField: "id", as: "class_info" } }, {$unwind:"$class_info"}, {$project:{"class_info._id":0,"class_info.id":0}}, {$match:{age:{$gte:16}}}, {$sort:{age:1}} ]).pretty(); |
结果:
Mongodb中除少量配置集合外,无相关的性能视图。早期版本只有db.currentOp()命令可查看会话信息,从3.6版开始提供$currentOpstage,可更加灵活的获取会话信息。
$currentOpstage只能在admin库执行
{$currentOp: { allUsers:
--显示当前的会话中,以客户端IP地址分组统计连接数
useadmin db.aggregate([ {$currentOp: { allUsers: true ,idleConnections:true} }, {$project:{IP:{$split:["$client",":"]}}}, {$project:{IP:{$split:["$client",":"]}}}, {$unwind:"$IP"}, {$match:{"IP":/^10./}}, {$group:{_id:"$IP",count:{$sum:1}}} ]); |
--查看当前活动会话正在执行的操作
useadmin db.aggregate([ {$currentOp: { allUsers: true ,idleConnections:false} }, {$project:{opid:1,client:1,op:1,ns:1,microsecs_running:1,command:1}}, {$match:{client:{$exists:true}}}, {$sort:{microsecs_running:-1}} ]).pretty(); |
---检查是否有会话在等待锁
db.aggregate([ {$currentOp: { allUsers: true ,idleConnections:false} }, {$project:{opid:1,client:1,op:1,ns:1,microsecs_running:1,waitingForLock:1}}, {$match:{"waitingForLock":true}}, {$count:"waitfor locks"} ]); |
如果存在大量锁等待,则首先检查是否存在表、库、全局锁
db.aggregate([ {$currentOp: { allUsers: true ,idleConnections:false} }, {$match:{$or:[{"locks.Global":"W"},{"locks.Database":"W"},{"locks.Collection":"W"}]}} ]) |
如果发现有会话持有表级、库级或者全局锁,则可根据其opid,执行db.killOp(opid)释放锁资源。如果未发现表级以上的锁,则检查不处于等待状态的会话在做些什么操作,再进行具体处理
$collStats返回表的统计信息,其信息比db.collection.status()详细,提供访问的ops时长信息。
$indexStatus 返回索引统计信息,可返回索引的访问次数,可用在数据治理中。
--结合js脚本,输出某个库中从未使用过的索引(输出json)
db.getCollectionNames().forEach(function(collection){ if(db[collection].getIndexes().length != 1) { print("Indexesfor " + collection + ":"); db[collection].aggregate([{ $indexStats:{} },{ $project:{ host:0 } }]).forEach( function(opDoc){ if(opDoc.accesses.ops == 0 && opDoc.name != "_id_") { printjson(opDoc); } }); } }); |
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/129983.html
摘要:一系统运维中网络方面的规划与思考在很多公司,岗位职责都是很明确的,专职转岗,每人或者每组负责一块业务。二系统运维中网络方面操作梳理在系统运维中,经常涉及的网络方面的操作,一般由以下几个方面组成。初步意见,交换机上线这台机器所连端口。运维是一门艺术,也是一门苦差事,每个人对此均有不同的理解,正所谓一千个人眼中有一千个哈姆雷特。干一行就要爱一行,既然选择了这个行业,较好是能把它做到较好,发挥自己...
阅读 1356·2023-01-11 13:20
阅读 1707·2023-01-11 13:20
阅读 1215·2023-01-11 13:20
阅读 1906·2023-01-11 13:20
阅读 4165·2023-01-11 13:20
阅读 2757·2023-01-11 13:20
阅读 1402·2023-01-11 13:20
阅读 3671·2023-01-11 13:20