MongoDB学习整理

[TOC]

想解决什么问题？目标是什么？

有一些场景下不需要强一致性，而是需要：

mongodb作为文档数据库在解决这个问题。

它将数据以document为单位存储，每个document是一个json格式的数据；
document组成collection，代表着一类数据。其中collection没有强schema定义，可以存储结构不完全一样的数据，又应用层来处理结构不一致。

优势

劣势

Aggregate模型（开发中的领域模型，代表着要处理的某种问题，和实际业务相关，比如管理用户可能会定义一个User结构的模型）比较确定，这种情况下存储在mongodb的document更直接简单，避免了关系型数据库的table和实际的模型的转换。
为了扩展以支持海量数据，关系型数据库的扩展比较复杂，需要应用层做更多的工作。
对ACID没有强要求，希望在一致性/可用性/持久性上做调优，比如牺牲一定的一致性获得更强的可用性。

分片是怎么做的？

TODO

对saas系统来说，数据都是以organization为单位，所以可以根据organizationId来做sharding。

pbm is used to backup and restore, the data is stored in s3.