如何使用Golang解析CSV文件_Golangencoding CSV文件处理演示

Go 语言 encoding/csv 包提供简洁高效的 CSV 解析与生成能力,支持 UTF-8 编码、RFC 4180 标准引号转义、自定义分隔符及注释行处理,读写时需注意 Flush、错误处理与编码一致性。

Go 语言内置的 encoding/csv 包提供了简洁、高效、安全的 CSV 解析与生成能力,无需第三方依赖。关键在于正确处理分隔符、引号、换行、编码(如 UTF-8)和错误边界。

读取 CSV 文件(按行解析)

使用 csv.NewReader 包装一个 io.Reader(例如 os.File),然后调用 Read()ReadAll()

  • Read() 每次返回一行([]string),适合大文件流式处理,避免内存占用过高
  • ReadAll() 一次性读取全部内容到内存,适合小文件或需随机访问的场景
  • 注意:CSV 文件必须是 UTF-8 编码;若含 BOM,建议先跳过(bytes.TrimPrefix(buf, []byte("\xef\xbb\xbf"))

处理带引号、逗号、换行的字段

encoding/csv 默认支持 RFC 4180 标准,能自动解析被双引号包裹的字段(如 "Smith, John"

"multi
line"
)。只需确保:

  • 字段分隔符为逗号(可自定义,见下条)
  • 引号为双引号 ",且内部双引号需写成两个:"He said ""Hi""."
  • 每行结尾换行符可以是 \n\r\n,包会自动识别

自定义分隔符与选项

通过设置 csv.Readercsv.Writer 的字段可灵活适配非标准 CSV:

  • reader.Comma = '\t' → 解析 TSV(制表符分隔)
  • reader.Comment = '#' → 跳过以 # 开头的注释行
  • reader.FieldsPerRecord = 5 → 强制每行必须有 5 列,否则报错
  • writer.UseCRLF = true → 输出 Windows 风格换行(\r\n

写入 CSV 文件(生成数据)

csv.NewWriter 包装 io.Writer(如 *os.File),再调用 Write()WriteAll()

  • Write([]string{"a", "b,c", "d"}) 会自动转义为 a,"b,c",d
  • 记得在写完后调用 writer.Flush(),否则缓冲区内容可能未落盘
  • 若需写入 UTF-8 中文,确保输出目标支持(如终端、Excel 需手动指定 UTF-8 编码打开)

基本上就这些。标准库足够覆盖绝大多数 CSV 场景,不复杂但容易忽略细节——比如忘记 Flush、没处理错误、或误把 GBK 文件当 UTF-8 读。