聚合以及聚合根是领域驱动设计中的重要概念,根据定义,聚合是针对数据变化可以考虑成一个单元的一组相关的对象。聚合使用边界将内部和外部的对象划分开来。每个聚合有一个根。这个根是一个实体,并且它是外部可以访问的唯一的对象。根可以保持对任意聚合对象的引用,并且其他的对象可以持有任意其他的对象,但一个外部对象只能持有根对象的引用。如果边界内有其他的实体,那些实体的标识符是本地化的,只在聚合内有意义(参见《领域驱动设计-精简版》第42页)。从定义上看,貌似针对特定上下文的领域模型来讲,聚合的划分与设计并不那么困难,但事实却并非如此。在本文中,我将大致总结一下自己的经验,同时也欢迎关注领域驱动设计的朋友能够提出自己的见解。
几周前我与园友netfocus讨论过这个问题,在他的这篇博客中,简单地提及了为何我们需要在领域驱动设计中引入“聚合”的概念。我们围绕着《Effective Aggregate Design Part I: Modeling a Single Aggregate》一文中的一些观点对聚合的划分与设计展开讨论,文中对聚合的设计问题作了讨论,比如:如果将聚合设计得很大,则会带来一些诸如一致性和事务失效(transaction failure)的问题;不仅如此,大聚合会导致系统性能低下,即使采用延迟加载(Lazy Loading)也无法彻底解决性能问题,例如当更新某个聚合中实体集合中的某个实体时,会连同整个集合被同时加载到内存中,而事实上这是不必要的。之后,文中提出将大聚合拆分成多个小聚合,通过引入领域服务(Domain Service),并使用实体标识(Entity Identifier)来替代对象引用(reference)以避免大聚合带来的并发问题,因此可以得出结论,就是聚合不能设计得很大结构很复杂。然而应该如何合理地去设计聚合、划分聚合边界呢?这就是本文所要讨论的问题。
事实上,我对这篇文章的分析问题的方式不太认同,虽然最后的问题都归结到聚合的划分与设计上。聚合的划分与设计问题,我觉得不应该从技术的角度去分析引出,而应该从领域模型和通用语言的角度去概括,虽然文章中所阐述的问题都是现实存在的,但我觉得如果能够从模型的角度来分析问题,或许能够得到更好的结果。
聚合划分与设计其实与并发和事务性并不矛盾
首先需要了解的是,合理地划分和设计聚合,并不会产生任何并发和事务性问题。我们所讨论的文章中之所以第一个设计方案会出现并发和事务性问题,就是因为它的聚合设计本身就不合理。这其实在本文一开始就明确了这个问题:聚合是针对数据变化可以考虑成一个单元的一组相关的对象。因此,必须承认对于一个聚合,其中包含的所有对象必须“同生死,共存亡”,基于聚合的数据操作应该就是原子操作,基础结构机制需要保证以聚合为单位的数据一致性。换句话说,聚合在数据一致性方面的表现,应该与基础结构机制所保证的并发和事务的正确性是等价的。数据访问时出现的事务失效现象,其实是源于聚合的不合理划分。比如,在《Effective Aggregate Design》一文中的例子里,事实上Product并不一定要依赖于Release才能存在,因此,在Product的聚合中,就不应该包含对Release的引用,然而相反,Release是没法脱离Product而单独存在的,因为如果是这样的话,Release也就失去了本身的含义,所以,Release可以定义成一个聚合,而Product则是这个聚合中的一个实体。
至此,我们可以得知,聚合的划分和设计必须依赖对通用语言、领域概念和模型的正确把握。接下来再让我们看两个我们经常遇到的例子:销售订单和论坛主题。
两个例子:销售订单(Sales Order)/订单明细(Sales Line) vs. 论坛主题(Post)/回复(Reply)
很多网友会在这两个领域的建模上感到纠结,如果我们从数据库设计上考虑(以数据库驱动的开发方