Java Stream实现按月统计总和与唯一人数

本文详细介绍了如何使用Java Stream API高效处理复杂数据聚合需求,特别是针对多条件分组、数值求和以及计算唯一实体数量的场景。我们将通过`Collectors.groupingBy`结合`Collectors.teeing`(适用于JDK 12+)来解决按月统计总值和唯一人员数量的问题,并提供完整的代码示例和注意事项。

1. 理解问题与数据模型

在实际开发中,我们经常需要对数据进行复杂的统计分析。本教程将解决一个典型场景:给定一系列人员活动记录,我们需要按月份统计两个关键指标:

  1. 总值 (Total Sum):特定月份内所有相关活动的总数值。
  2. 唯一人员数量 (Person Count):特定月份内参与活动的唯一人员数量。

1.1 数据结构定义

首先,我们定义核心数据模型。Person类代表一个人员的活动记录,包含ID、事件类型、事件日期和相关数值。Statement枚举定义了不同的事件类型。

import java.math.BigDecimal;
import java.time.LocalDate;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set;
import java.util.Comparator;

import static java.util.stream.Collectors.*;

// 定义事件类型枚举
enum Statement {
    STATUS1, STATUS2, STATUS3, STATUS4
}

// Person记录类 (JDK 14+ Record)
record Person(String id,
              Statement event,
              LocalDate eventDate,
              int value) {}

// 最终结果DTO类
class DTO {
    private int month;
    private BigDecimal totalSum;
    private int totalPersons;

    // 构造函数
    public DTO(int month, BigDecimal totalSum, int totalPersons) {
        this.month = month;
        this.totalSum = totalSum;
        this.totalPersons = totalPersons;
    }

    // 默认构造函数(供Collectors.teeing内部使用)
    public DTO() {
        this.totalSum = BigDecimal.ZERO; // 初始化BigDecimal
    }

    // Getters and Setters
    public int getMonth() { return month; }
    public void setMonth(int month) { this.month = month; }
    public BigDecimal getTotalSum() { return totalSum; }
    public void setTotalSum(BigDecimal totalSum) { this.totalSum = totalSum; }
    public int getTotalPersons() { return totalPersons; }
    public void setTotalPersons(int totalPersons) { this.totalPersons = totalPersons; }

    @Override
    public String toString() {
        return "DTO{month=" + month + ", totalSum=" + totalSum + ", totalPersons=" + totalPersons + '}';
    }
}

1.2 示例数据

为了演示,我们使用以下示例数据。请注意,per1在1月份出现了两次,但我们期望在“Person Count”中只计算一次。

List personRecords = List.of(
    new Person("per1", Statement.STATUS1, LocalDate.of(2025, 1, 10), 1),
    new Person("per2", Statement.STATUS2, LocalDate.of(2025, 1, 10), 2),
    new Person("per3", Statement.STATUS3, 

LocalDate.of(2025,