Golang如何使用bufio.Scanner按行读取文件_Golang Scanner文件按行读取技巧

bufio.Scanner 是 Go 语言按行读取文件的高效方式,1. 使用 os.Open 打开文件后创建 scanner,通过 scanner.Scan() 循环读取每行并用 scanner.Text() 获取内容,需检查 scanner.Err() 确保无读取错误;2. 可将每行文本追加到字符串切片保存,适用于配置或日志分析;3. 支持通过 scanner.Split() 自定义分隔符,但默认按行分割已满足常规需求;4. 采用流式读取,内存占用低,适合处理大文件,建议边读边处理以提升效率。

在Go语言中,bufio.Scanner 是处理文件按行读取最常用且高效的方式之一。它不仅使用简单,还能自动处理换行符和缓冲,适合读取文本文件中的每一行内容。

1. 基本用法:打开文件并逐行读取

使用 os.Open 打开文件,结合 bufio.NewScanner 创建扫描器,然后通过 scanner.Scan() 循环读取每一行。

示例代码:

package main

import ( "bufio" "fmt" "log" "os" )

func main() { file, err := os.Open("example.txt") if err != nil { log.Fatal(err) } defer file.Close()

scanner := bufio.NewScanner(file)
for scanner.Scan() {
    fmt.Println(scanner.Text()) // 输出每一行内容
}

if err := scanner.Err(); err != nil {
    log.Fatal(err)
}

}

说明:
- scanner.Text() 返回当前行的字符串(不包含换行符)。
- 循环结束后建议检查 scanner.Err(),以确保读取过程中没有发生错误。

2. 读取到字符串切片:保存所有行

如果需要将文件所有行保存下来进行后续处理,可以将每行内容追加到一个字符串切片中。

var lines []string
scanner := bufio.NewScanner(file)
for scanner.Scan() {
    lines = append(lines, scanner.Text())
}

这种方式适用于配置文件、日志分析等场景,便于后续遍历或搜索。

3. 自定义分隔符:不只是按行读取

默认情况下,Scanner 按换行符分割数据,但你可以通过 scanner.Split() 修改分隔方式。例如,按空格或自定义规则拆分。

不过对于“按行读取”来说,默认的 bufio.ScanLines 已经满足需求,无需额外设置。

4. 处理大文件:内存友好

Scanner 是流式读取,不会一次性加载整个文件,因此即使处理几百MB的日志文件也不会占用过多内存。

提示:
- 不要一次性把大文件全读进内存切片,除非确实需要。
- 可以边读边处理,比如查找关键词、统计行数、过滤内容等。

基本上就这些。使用 bufio.Scanner 按行读取文件是 Go 中最简洁、安全且高效的方法,适合绝大多数文本处理任务。