PHP 中合并重复音乐条目并累加 REPEAT 值的高效处理方法_技术教程

本文介绍如何在 php 中识别并合并数组中具有相同 artist 和 title 的音乐条目，将重复项的 repeat 字段累加，最终保留唯一记录。适用于播放列表去重与播放次数统计场景。

在构建音乐播放列表等业务场景中，数据库查询结果常包含语义重复的条目（如同一首歌多次出现），但前端或统计逻辑仅需一条记录，并携带其总播放/出现次数（即 REPEAT 字段）。此时，简单使用 array_unique() 无法满足需求——它只能基于完整值去重，而我们需要的是按指定字段（ARTIST + TITLE）分组聚合，并累加 REPEAT 值。

以下是一个健壮、可读性强的解决方案：

✅ 核心思路

遍历原始数组，对每条记录检查目标字段（ARTIST 和 TITLE）是否已在结果数组中存在：

若不存在 → 直接追加到结果数组；
若已存在 → 找到对应索引，将其 REPEAT 值递增 1。

✅ 推荐实现函数（优化版）

function mergeDuplicateTracks(array $playlist): array
{
    $merged = [];

    foreach ($playlist as $track) {
        // 定义唯一标识键：由 ARTIST 和 TITLE 拼接而成（可扩展为 SHA256 哈希提升性能）
        $key = $track['ARTIST'] . '|' . $track['TITLE'];

        if (isset($merged[$key])) {
            $merged[$key]['REPEAT'] += $track['REPEAT']; // 支持原始 REPEAT > 1 的情况
        } else {
            // 保留原始 ID（取首次出现的 ID），也可改为最小/最大 ID 或忽略
            $merged[$key] = [
                'ID'     => $track['ID'],
                'ARTIST' => $track['ARTIST'],
                'TITLE'  => $track['TITLE'],
                'TIME'   => $track['TIME'],
                'REPEAT' => $track['REPEAT']
            ];
        }
    }

    // 重置数组键为连续数字索引（可选）
    return array_values($merged);
}

✅ 使用示例

$music_playlist = [
    ['ID' => 0, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 1, 'ARTIST' => 'SOMETHING2', 'TITLE' => 'SOMETHING2', 'TIME' => '02:40', 'REPEAT' => 1],
    ['ID' => 2, 'ARTIST' => 'SOMETHING3', 'TITLE' => 'SOMETHING3', 'TIME' => '03:20', 'REPEAT' => 1],
    ['ID' => 3, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 4, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 5, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
    ['ID' => 6, 'ARTIST' => 'SOMETHING1', 'TITLE' => 'SOMETHING1', 'TIME' => '04:00', 'REPEAT' => 1],
];

$result = mergeDuplicateTracks($music_playlist);
print_r($result);

输出结果：

立即学习“PHP免费学习笔记（深入）”；

Array
(
    [0] => Array
        (
            [ID] => 0
            [ARTIST] => SOMETHING1
            [TITLE] => SOMETHING1
            [TIME] => 04:00
            [REPEAT] => 5
        )
    [1] => Array
        (
            [ID] => 1
            [ARTIST] => SOMETHING2
            [TITLE] => SOMETHING2
            [TIME] => 02:40
            [REPEAT] => 1
        )
    [2] => Array
        (
            [ID] => 2
            [ARTIST] => SOMETHING3
            [TITLE] => SOMETHING3
            [TIME] => 03:20
            [REPEAT] => 1
        )
)

⚠️ 注意事项

字段一致性：确保 ARTIST 和 TITLE 字段内容严格一致（注意空格、大小写、不可见字符）。建议入库前标准化（如 trim(strtoupper())）。
性能考量：对于超大数据集（>10,000 条），推荐改用 array_reduce() 或预建哈希表（$map[$key] = $index）避免嵌套循环，时间复杂度从 O(n²) 降至 O(n)。
ID 策略：当前实现保留首次出现的 ID；若需其他策略（如最新 ID），可改用 max($merged[$key]['ID'], $track['ID'])。
扩展性：如需支持更多去重维度（如专辑、年份），只需扩展 $key 拼接逻辑即可。