在MongoDB中实现聚合函数

我们在本文中使用的NoSQL是MongoDB,它是一种开源的文档%ignore_a_1%系统,开发语言为C++。它提供了一种高效的面向文档的存储结构,同时

随着组织产生的数据爆炸性增长,从GB到TB,从TB到PB,传统的数据库已经无法通过垂直扩展来管理如此之大数据。传统方法存储和处理数据的成本将会随着数据量增长而显著增加。这使得很多组织都在寻找一种经济的解决方案,比如NoSQL数据库,它提供了所需的数据存储和处理能力、扩展性和成本效率。NoSQL数据库不使用SQL作为查询语言。这种数据库有多种不同的类型,比如文档结构存储、键值结构存储、图结构、对象数据库等等。

我们在本文中使用的NoSQL是MongoDB,它是一种开源的文档数据库系统,开发语言为C++。它提供了一种高效的面向文档的存储结构,同时支持通过MapReduce程序来处理所存储的文档;它的扩展性很好,而且支持自动分区。Mapreduce可以用来实现数据聚合。它的数据以BSON(二进制JSON)格式存储,在存储结构上支持动态schema,并且允许动态查询。和RDBMS的SQL查询不同,Mongo查询语言以JSON表示。

MongoDB提供了一个聚合框架,其中包括常用功能,比如count、distinct和group。然而更多的高级聚合函数,比如sum、average、max、min、variance(方差)和standard deviation(标准差)等需要通过MapReduce来实现。

这篇文章描述了在MongoDB存储的文档上使用MapReduce来实现通用的聚合函数,如sum、average、max、min、variance和standard deviation;聚合的典型应用包括销售数据的业务报表,比如将各地区的数据分组后计算销售总和、财务报表等。

我们从本文示例应用所需软件的安装开始。

软件安装

首先在本地机器上安装并设置MongoDB服务。

从Mongo网站上下载MongoDB,解压到本地目录,比如C:>Mongo 在上一个文件夹内创建数据目录。比如:C:MongoData    如果数据文件存放在其他地方,那么在用mongod.exe命令启动MongoDB时,需要在命令行加参数—-dbpath 启动服务    MongoDB提供了两种方式:mongod.exe以后台进程启动;mongo.exe启动命令行界面,可做管理操作。这两个可执行文件都位于Mongoin目录下; 进入Mongo安装目录的bin目录下,比如:C:> cd Mongoin

有两种启动方式,如下:

mongod.exe –dbpath C:Mongodata或者        mongod.exe –config mongodb.config        mongodb.config是Mongoin目录下的配置文件,需要在此配置文件中指定数据目录(比如,dbpath= C:MongoData)的位置。

连接到MongoDB,到这一步,mongo后台服务已经启动,可以通过:27017查看。 MongoDB启动运行后,我们接下来看它的聚合函数。

实现聚合函数

在关系数据库中,我们可以在数值型字段上执行包含预定义聚合函数的SQL语句,比如,SUM()、COUNT()、MAX()和MIN()。但是在MongoDB中,需要通过MapReduce功能来实现聚合以及批处理,它跟SQL里用来实现聚合的GROUP BY从句比较类似。下一节将描述关系数据库中SQL方式实现的聚合和相应的通过MongoDB提供的MapReduce实现的聚合。

为了讨论这个主题,我们考虑如下所示的Sales表,它以MongoDB中的反范式形式呈现。

Sales表

#

列名

数据类型

1

OrderId

INTEGER

2

OrderDate

STRING

3

Quantity

INTEGER

4

SalesAmt

DOUBLE

5

Profit

DOUBLE

6

CustomerName

STRING

7

City

STRING

8

State

STRING

9

ZipCode

STRING

10

Region

STRING

11

ProductId

INTEGER

12

ProductCategory

STRING

13

ProductSubCategory

STRING

14

ProductName

STRING

15

ShipDate

STRING

 

基于SQL和MapReduce的实现

我们提供了一个查询的样例集,这些查询使用聚合函数、过滤条件和分组从句,及其等效的MapReduce实现,即MongoDB实现SQL中GROUP BY的等效方式。在MongoDB存储的文档上执行聚合操作非常有用,这种方式的一个限制是聚合函数(比如,SUM、AVG、MIN、MAX)需要通过mapper和reducer函数来定制化实现。

MongoDB没有原生态的用户自定义函数(UDFs)支持。但是它允许使用db.system.js.save命令来创建并保存JavaScript函数,JavaScript函数可以在MapReduce中复用。下表是一些常用的聚合函数的实现。稍后,我们会讨论这些函数在MapReduce任务中的使用。

聚合函数

Javascript 函数

SUM

db.system.js.save( { _id : “Sum” ,value : function(key,values){var total = 0;for(var i = 0; i

AVERAGE

db.system.js.save( { _id : “Avg” ,value : function(key,values){var total = Sum(key,values);var mean = total/values.length;return mean;}});

MAX

db.system.js.save( { _id : “Max” ,value : function(key,values){var maxValue=values[0];for(var i=1;i

MIN

db.system.js.save( { _id : “Min” ,value : function(key,values){var minValue=values[0];for(var i=1;i

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1919266.html

(0)
上一篇 2025年2月22日 18:42:34
下一篇 2025年2月22日 18:43:20

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • navicat premium怎么上传数据库

    首先,在Navicat Premium中连接要导出数据库的mysql数据库。 填写好连接数据库的信息后就可以连接到需要导出的数据库了。 打开要导出的数据库。 将数据库的结构和数据导出为SQL文件。 相关推荐:《Navicat for mys…

    2025年2月23日 数据库
    100
  • navicat怎么打开数据库

    1、打开Navicat,点击左上角的‘Conection’按钮。 2、点击后,弹出菜单,我们要选择是哪种类型的数据库,根据你本地部署的数据库类型来选就行了,我这里选择MySql。 3、选择后,弹出窗口,在这个窗口上我们先输入数据库的Host…

    2025年2月23日 数据库
    100
  • navicat怎么清除数据库备份

    第一步,打开Navicat。 第二步,打开mysql数据库连接。 相关推荐:《Navicat for mysql使用图文教程》 第三步,点击备份所在的数据库,并选中备份菜单,此时显示已建的备份。 第四步,右击要删除的备份,在弹出菜单中选择“…

    2025年2月23日 数据库
    100
  • navicat怎么备份数据库

    本篇经验将和大家介绍如何利用Navicat for MySQL进行数据库备份的操作,希望对大家的工作和学习有所帮助! 推荐教程:mysql入门视频教程 1、打开桌面上的或者从开始程序中找到Navicat for MySQL,如下图所示: 2…

    2025年2月23日 数据库
    100
  • navicat新建数据库的步骤

    打开navicat工具,连接上您自己的mysql服务器,然后在如图所示的连接上右击,选择新建数据库。 相关推荐:《Navicat for mysql使用图文教程》 在新建数据库对话框中,需要输入数据库名称,选择字符集和排序规则,名称建议使用…

    2025年2月23日 数据库
    100
  • navicat怎么导入本地数据库

    navicat怎么导入本地数据库,为什么我没有找到该导入的功能呢?请看下面方法。 推荐教程:MySQL入门视频教程 1、首先我们打开软件,并且连接上本地数据库,选中连接,右键打开连接,直接双击也可以的 2、在本地数据库中我们新建一个数据库用…

    2025年2月23日 数据库
    100
  • navicat如何设置高级数据库属性

    Navicat是一套快速、可靠的数据库管理工具,在设置高级连接选项卡中还可以设置高级数据库属性,是否设置高级数据库属性不做强制性要求。如果需要设置高级数据库,前提是勾选“使用高级连接”。详细介绍如下: MySQL、PostgreSQL和Ma…

    2025年2月23日
    100
  • 怎么使用navicat连接数据库

      无论是本机安装的MySQL,还是远程服务器上的MySQL,对其进行管理都特别的麻烦,如何对其进行方便简单的管理呢?Navicat是一款管理MySQL数据库的软件,其简洁明了的界面,使我们能更好的管理数据库,对其进行增删改查的操作。 推荐…

    2025年2月23日 数据库
    100
  • navicat怎么创建数据库

      使用navicat快速创建数据库,我们这以创建Mysql数据库为例,其他数据库在navicat中操作都一样 推荐教程:MySQL数据库入门视频教程 1、打开navicat 2、选中数据库连接“root”右键-》新建数据库 3、填写数据库…

    2025年2月23日 数据库
    100
  • 如何使用navicat为数据库表建立索引?

    下面介绍如何使用Navicat为数据库表建立索引的具体操作方法。 推荐教程:MySQL数据库入门视频教程 1、打开Navicat 2、打开数据表所在的数据库,右击需要新增索引的数据库表,然后点击【设计表】 3、此时进入表设计界面 4、点击【…

    2025年2月23日 数据库
    100

发表回复

登录后才能评论