如何从 MongoDB 中提取子文档数组并扁平化为顶层对象列表

本文介绍使用 mongodb 聚合管道(`$unwind` + `$replaceroot`)将嵌套在字段(如 `bills`)中的子文档数组提取为扁平化的对象数组,彻底移除外层包装字段,适用于 mongoose 和原生 node.js mongodb 驱动。

当你通过 .find() 查询 MongoDB 文档时,若目标数据位于嵌套字段(例如 bills: [{...}, {...}])中,直接使用 projection: { bills: 1 } 仅能返回带 bills 键的包装结构:

[{ "bills": [ {"_id":"...", "title":"Month1"}, ... ] }]

而实际业务常需纯子文档数组(即去掉 bills 外层键),形如:

[{ "_id":"...", "title":"Month1" }, { "_id":"...", "title":"Month2" }]

此时应弃用 find(),改用 聚合查询(Aggregation Pipeline),核心是两个阶段:

  1. $unwind:将 bills 数组展开为多条独立文档(每条含一个子文档);
  2. $replaceRoot:将每个子文档提升为根文档,彻底剥离 bills 字段层级。

✅ 正确实现(Mongoose 示例)

import { ObjectId } from 'mongodb';
// 或使用 mongoose.Types.ObjectId(若用 Mongoose)

const billsList = await record.aggregate([
  { $match: { _id: new ObjectId(billId) } },
  { $unwind: '$bills' },
  { $replaceRoot: { newRoot: '$bills' } }
]).toArray();
? 注意:$unwind 会为数组中每个元素生成一条输出文档;若 bills 为空或缺失,该文档将被过滤掉。如需保留空数组场景,可添加 { preserveNullAndEmptyArrays: true } 参数。

✅ 原生 MongoDB 驱动写法(Node.js)

const billsList = await collection.aggregate([
  { $match: { _id: new ObjectId(billId) } },
  { $unwind: '$bills' },
  { $replaceRoot: { newRoot: '$bills' } }
]).toArray();

⚠️ 注意事项

  • 性能考量:聚合操作比简单 find() 开销略高,但对单文档内嵌数组扁平化属轻量级操作,无需担忧;
  • 索引优化:确保 _id 字段已建索引(默认存在),$match 阶段可高效定位文档;
  • 空数组处理:若 bills: [],默认 $unwind 会丢弃该文档。需保留时写为:
    { $unwind: { path: '$bills', preserveNullAndEmptyArrays: true } }
  • 字段重命名/过滤:后续可链式添加 $project 进一步筛选字段,例如只保留 _id 和 title:
    { $project: { _id: 1, title: 1 } }

✅ 总结

方法 是否推荐 原因
find() + projection 无法解构嵌套字段,仅能投影整个 bills 数组字段
aggregate() + $unwind + $replaceRoot 精准、标准、可扩展,是 MongoDB 官方推荐的嵌套数组扁平化方案

掌握这一模式,即可灵活处理任意层级的嵌套子文档提取需求——无论是 users.addresses、orders.items,还是本文的 bills,逻辑完全一致。