PHP 中合并重复音乐条目并累加 REPEAT 值的高效处理方法

本文介绍如何在 php 中识别并合并数组中具有相同 artist 和 title 的音乐条目,将重复项的 repeat 字段累加,最终保留唯一记录。适用于播放列表去重与播放次数统计场景。

在构建音乐播放列表等业务场景中,数据库查询结果常包含语义重复的条目(如同一首歌多次出现),但前端或统计逻辑仅需一条记录,并携带其总播放/出现次数(即 REPEAT 字段)。此时,简单使用 array_unique() 无法满足需求——它只能基于完整值去重,而我们需要的是按指定字段(ARTIST + TITLE)分组聚合,并累加 REPEAT 值

以下是一个健壮、可读性强的解决方案:

✅ 核心思路

遍历原始数组,对每条记录检查目标字段(ARTIST 和 TITLE)是否已在结果数组中存在:

  • 若不存在 → 直接追加到结果数组;
  • 若已存在 → 找到对应索引,将其 REPEAT 值递增 1。

✅ 推荐实现函数(优化版)

function mergeDuplicateTracks(array $playlist): array
{
    $merged = [];

    foreach ($playlist as $track) {
        // 定义唯一标识键:由 ARTIST 和 TITLE 拼接而成(可扩展为 SHA256 哈希提升性能)
        $key = $track['ARTIST'] . '|' . $track['TITLE'];

        if (isset($merged[$key])) {
            $merged[$key]['REPEAT'] += $track['REPEAT']; // 支持原始 REPEAT > 1 的情况
        } else {
            // 保留原始 ID(取首次出现的 ID),也可改为最小/最大 ID 或忽略
            $merged[$key] = [
                'ID'     => $track['ID'],
                'ARTIST' => $track['ARTIST'],
                'TITLE'  => $track['TITLE'],
                'TIME'   => $track['TIME'],
                'REPEAT' => $track['REPEAT']
            ];
        }
    }

    // 重置数组键为连续数字索引(可选)
    return array_values($merged);
}

✅ 使用示例

$music_playlist = [
    ['ID' => 0, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 1, 'ARTIST' => 'SOMETHING2', 'TITLE' => 'SOMETHING2', 'TIME' => '02:40', 'REPEAT' => 1],
    ['ID' => 2, 'ARTIST' => 'SOMETHING3', 'TITLE' => 'SOMETHING3', 'TIME' => '03:20', 'REPEAT' => 1],
    ['ID' => 3, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 4, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 5, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 6, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
];

$result = mergeDuplicateTracks($music_playlist);
print_r($result);

输出结果:

立即学习“PHP免费学习笔记(深入)”;

Array
(
    [0] => Array
        (
            [ID] => 0
            [ARTIST] => SOMETHING1
            [TITLE] => SOMETHING1
            [TIME] => 04:00
            [REPEAT] => 5
        )
    [1] => Array
        (
            [ID] => 1
            [ARTIST] => SOMETHING2
            [TITLE] => SOMETHING2
            [TIME] => 02:40
            [REPEAT] => 1
        )
    [2] => Array
        (
            [ID] => 2
            [ARTIST] => SOMETHING3
            [TITLE] => SOMETHING3
            [TIME] => 03:20
            [REPEAT] => 1
        )
)

⚠️ 注意事项

  • 字段一致性:确保 ARTIST 和 TITLE 字段内容严格一致(注意空格、大小写、不可见字符)。建议入库前标准化(如 trim(strtoupper()))。
  • 性能考量:对于超大数据集(>10,000 条),推荐改用 array_reduce() 或预建哈希表($map[$key] = $index)避免嵌套循环,时间复杂度从 O(n²) 降至 O(n)。
  • ID 策略:当前实现保留首次出现的 ID;若需其他策略(如最新 ID),可改用 max($merged[$key]['ID'], $track['ID'])。
  • 扩展性:如需支持更多去重维度(如专辑、年份),只需扩展 $key 拼接逻辑即可。

该方法简洁、可靠,无需依赖外部库,可直接集成至 Laravel、Symfony 或原生 PHP 项目中,是处理播放列表聚合的通用实践方案。