Python中文乱码怎么办

Python中文乱码本质是编码不一致,统一用UTF-8并显式声明和指定即可解决:源文件加# -- coding: utf-8 --,文件读写明确encoding参数,终端和IDE设为UTF-8,必要时用sys.stdout.reconfigure。

Python中文乱码本质是编码不一致:源文件、终端、IDE、文件读写等环节的编码设置没对齐。只要统一用UTF-8,并显式声明和指定,基本就能解决。

源代码文件开头加编码声明

Python 2必须加,Python 3默认UTF-8但建议仍加上,避免编辑器误判:

# -*- coding: utf-8 -*-

这行要放在文件最顶部(可紧跟在Shebang之后,如#!/usr/bin/env python3下面)。

读写文件时明确指定encoding参数

不用依赖系统默认编码,每次open都带上encoding='utf-8'

  • with open('data.txt', 'r', encoding='utf-8') as f:
  • with open('out.txt', 'w', encoding='utf-8') as f:

如果读取的是GBK编码的旧文件(比如Windows记事本默认保存的),就改用encoding='gbk',但建议转成UTF-8再处理。

检查终端/控制台是否支持UTF-8

Linux/macOS一般没问题;Windows命令提示符(cmd)默认是GBK,容易出乱码:

  • 临时方案:运行chcp 65001切换到UTF-8模式
  • 推荐方案:改用Windows Terminal或VS Code内置终端,它们默认支持UTF-8
  • PyCharm等IDE:在Settings → Editor → File Encodings里把Global、Project、Default encoding全设为UTF-8

打印中文时遇到异常?试试sys.stdout.reconfigure

某些环境(尤其是Windows + Python 3.7+)中,print()可能因stdout编码不匹配报错或乱码:

可以加一段兼容处理:

import sys
if sys.stdout.encoding != 'utf-8':
  sys.stdout.reconfigure(encoding='utf-8')

放在脚本开头即可,不影响正常环境。

基本上就这些。核心就一条:别让编码“猜”,全部显式写清楚——文件怎么存的,就怎么读;终端用什么编码,就配什么输出。不复杂,但容易忽略。