mongodb的分片底层原理（mongodb的分片原理简述）_MongoDB_数据存储_文章

mongodb的分片底层原理（mongodb的分片原理简述）

MongoDB工程师

2024-08-21 07:10:19

0次

本文目录一览：

1、MongoDB分片片键如何选择
2、如何搭建mongodb分片
3、为什么mongodb不能替代elasticsearch区别
4、mongodb切片坐标系定义
5、MongoDB自动分片介绍
6、mongodb多个collection及shard的问题

MongoDB分片片键如何选择

1、正如你所见，分片之后数据的存放位置依赖于片键，所以合理的选择片键十分重要。

2、使用片键的取值范围指定数据块设置分片的时候，需要从集合里选出一个字段，用该字段的值作为数据拆分的依据，这个字段称为片键（shard key），文档中的数据按照这个字段排序切分成块，分布到各个片上。

3、调整数据分布和负载模式也不轻松.MongoDB支持自动分片，可以摆脱手动分片的管理.集群自动切分数据，做负载均衡。

4、分布式存储，有点像关系SQL中的分表操作，但这些分表都可同时写操作，这种方式可有效缓解对单台服务器的压力。

5、这种情况有三种方法保证唯一字段的唯一性： 1）使用片键。 2）使用第二个集合保证唯一性。 3）使用本身便能保证唯一性的标识符。如ObjectId。开启一个集合的分片，之后mongo就可以在分片间分配这个集合的数据。

6、随着大数据时代的到来，Redis、MongoDB和HBase等NoSQL数据库也常用于数据的采集。

如何搭建mongodb分片

1、要构建一个 MongoDB Sharding Cluster，需要三种角色：Config Server 为了将一个特定的collection存储在多个shard中，需要为该collection指定一个shard key，例如{age： 1} ，shard key可以决定该条记录属于哪个chunk。

2、为了实现分片，你必须向MongoDB指定使用哪个索引作为片键，然后MongoDB会根据你的设置将你的数据划分到有着相同片键的数据块（Chunk）中。而后这些数据块将根据片键的大致顺序分散到副本集中。

3、创建数据库路径（data目录）、日志路径（logs目录）和日志文件（mongo.log文件），完成后如下图所示创建配置文件mongo.conf。

4、片键介绍数据划分（partitioning）关键问题是怎么样将一个集合中的数据均衡的分布在集群中的节点上。 MongoDB 数据划分的是在集合的层面上进行的，它根据片键来划分集合中的数据。

5、定义新的数据库名我们通过使用use new-databasename的语法去使用一个新的数据库，注意，即使你的数据库还没建立起来，依然可以这样使用，因为mongodb会在真正插入了数据后，才会真正建立起来。

为什么mongodb不能替代elasticsearch区别

1、与MongoDb不同， Elasticsearch 默认没有提供安全特性，如认证和授权。Elasticsearch和 Logstash & Kibana 一起称为ELK stack，用于快速查询数据并可视化展现分析数据。

2、MongoDB的核心优势是灵活的文档模型，高可用性复制集和可扩展的碎片集群。天通苑java培训建议可以尝试以多种方式了解MongoDB，例如MongoDB工具的实时监控，内存使用和页面错误，连接，数据库操作，复制集等。

3、当比较Elasticsearch中的文档和MongoDB中的文档，你会发现两者都可以有不同的结构，但Elasticsearch的文档中，相同字段必须有相同类型。这意味着，所有包含title字段的文档，title字段类型都必须一样，比如string。

4、mongodb和memcached不是一个范畴内的东西。mongodb是文档型的非关系型数据库，其优势在于查询功能比较强大，能存储海量数据。mongodb和memcached不存在谁替换谁的问题。和memcached更为接近的是redis。

5、可以用mongdbTemplate，elasticSearchTemplate。MongoDB与Elasticsearch都属于文档型数据库，Bson类同与Json，_objectid与_id原理一样。所以主数据与从数据迁移到Elasticsearch平台，数据模型几乎无需变化。

6、MongoDB更类似MySQL，支持字段索引、游标操作，其优势在于查询功能比较强大，擅长查询JSON数据，能存储海量数据，但是不支持事务。Mysql在大数据量时效率显著下降，MongoDB更多时候作为关系数据库的一种替代。

mongodb切片坐标系定义

1、接着是坐标系的定义：MongoDB可通过索引来获取相关对象的地址，成为“坐标系”。

MongoDB自动分片介绍

MongoDB的分片机制能够帮助你将你的数据库划分到多个服务器，通常在生产环境中可以将数据集划分到多个副本集中。但分片最好在数据库建立早期划分，因为一旦你的数据大于512GB那么分片划分就不是那么容易了。

MongoDB 的数据分块称为 chunk。每个 chunk 都是 Collection 中一段连续的数据记录，通常最大尺寸是 200MB，超出则生成新的数据块。

面向集合存储，容易存储对象类型的数据。在MongoDB 中数据被分组存储在集合中，集合类似RDBMS 中的表，一个集合中可以存储无限多的文档。（2）模式自由，采用无模式结构存储。

MongoDB的分片框架中有3个角色：1）Query Routers：路由 2）Config servers：元数据服务器 3）Shards：数据节点接着是坐标系的定义：MongoDB可通过索引来获取相关对象的地址，成为“坐标系”。

自动处理碎片，以支持云计算层次的扩展性支持RUBY，PYTHON，JAVA，C++，PHP等多种语言。

因为分片可以将数据分散到多个服务器，从而充分利用了服务器的并行处理能力。此外，MongoDB还提供了自动分片的功能，可以自动将数据迁移到新的服务器，从而简化了水平扩展的操作。

mongodb多个collection及shard的问题

1、实际上由于mongodb中分片是以collection为单位，因此一个shard上可以保存不同的数据。

2、简而言之，使用{_id： ‘hashed’}或{projectId： 1， _id： 1}来作为片键。几个月前，我们对MongoDB集群进行分片（shard）处理，数据设置了两个副本集合（replica set）。上周，我们添加了一个新的分片。

3、“chunks”集合（Collection）应该被分片，并且用索引”files_id：1”。

4、要构建一个 MongoDB Sharding Cluster，需要三种角色：Config Server 为了将一个特定的collection存储在多个shard中，需要为该collection指定一个shard key，例如{age： 1} ，shard key可以决定该条记录属于哪个chunk。

5、如果你不对这个collection执行sh.shardCollection（），那它就不是sharded collection，所以也就不会往其他shard上面写。这些mongodb的文档上都写了的，你在它网站上检索就行。

6、如果发现某个 doc 层次过深（超过 2 层），八成得考虑要拆分了，要不然性能和可维护性都会有问题。

有帮助

没帮助

上一篇：大量数据接收到mongodb（mongodb 大数据处理）

下一篇：mongodb多条件查询优化（mongodb的query多个查询条件）

更多栏目