Python中换行字符_Python字符串中的换行字符处理技巧_技术教程

Python中换行符在内存中统一为\n，但文件读写时受平台和newline参数影响：Windows文本模式自动转\r\n，Linux/macOS保持\n；splitlines()比split('\n')更安全，能处理各种换行符。

Python中换行符到底是`\n`还是`\r\n`

取决于你运行的系统和字符串来源。Python在内存中统一用\n表示换行，但写入文件或与外部交互时，会受newline参数和平台影响。Windows默认文本模式下print()或f.write()会自动把\n转成\r\n；Linux/macOS保持\n不变。

常见误判场景：

从Windows记事本复制含\r\n的文本到Python字符串里，实际是两个字符：'\r\n'，不是单个'\n'
用open(..., 'r').read()读取Windows生成的文件，若没指定newline=''，Python仍按通用换行模式处理（自动识别\r\n/\r/\n并统一转为\n）
repr(s)能帮你确认真实字符：repr('a\nb') → "'a\\nb'"，repr('a\r\nb') → "'a\\r\\nb'"

用`splitlines()`比`split('\n')`更安全

str.splitlines()专为换行设计，能正确处理\n、\r\n、\r、\v、\f等所有Unicode行边界，且默认不保留换行符；而split('\n')只切\n，遇到\r\n会留下末尾的\r。

text = "line1\r\nline2\nline3"
print(text.split('\n'))      # ['line1\r', 'line2', 'line3']
print(text.splitlines())   # ['line1', 'line2', 'line3']

额外注意点：

splitlines(keepends=True)可保留换行符，适合需要原样分段再拼接的场景
它对空行也有效："a\n\nb".splitlines() → ['a', '', 'b']
不依赖系统os.linesep，跨平台行为一致

写文件时控制换行符用`newline`参数

这是最容易被忽略的关键参数。直接写f.write('a\nb')时，如果文件以文本模式打开（默认），Python会根据系统自动转换换行符。要强制输出\n，必须显式指定newline=''：

with open('out.txt', 'w', newline='') as f:
    f.write('line1\nline2')  # 确保写入的是 \n，不是 \r\n

对比：

open('f.txt', 'w')：Windows下写'\n' → 文件存'\r\n'
open('f.txt', 'w', newline='')：无论什么系统，写什么就存什么
open('f.txt', 'wb')（二进制模式）：同样绕过换行转换，但需传bytes，如b'line1\nline2'

读文件时newline=None（默认）启用通用换行支持；设为''则关闭转换，原样返回所有换行符。

正则匹配换行时别漏掉`re.DOTALL`

.默认不匹配\n，所以re.search('a.b', 'a\nb')匹配失败。多数人第一反应是改用[\s\S]，但更规范的做法是加re.DOTALL标志：

import re
text = "start\nmiddle\nend"
re.search(r'start.*end', text)           # None（默认不跨行）
re.search(r'start.*end', text, re.DOTALL)  # Match object

其他相关点：