Python 3默认UTF-8编码,但文件实际为GBK等编码时需在第一或第二行添加# coding: utf-8声明,否则报SyntaxError;该注释告知解释器以UTF-8解码文件,不可有空行隔开,现代编辑器建议设为UTF-8保存。
Python 3 默认使用 UTF-8 编码,所以大多数情况下无需额外设置。但如果你在源文件中写了中文、日文等非 ASCII 字符,又遇到 SyntaxError: Non-UTF-8 code starting with... 报错,说明 Python 解释器没按 UTF-8 读取你的文件——这时需要显式声明编码。
在 Python 文件开头加编码声明
在 .py 文件的**第一行或第二行**(必须是前两行之一)写上:
# -*- coding: utf-8 -*-或者更简洁的写法(同样有效):
# coding: utf-8注意:这行只是告诉解释器“请用 UTF-8 解析本文件”,不是执行语句,所以前面加 # 是注释语法,且不能有空行隔开(否则可能失效)。
为什么有时必须加?
虽然 Python 3 默认用 UTF-8,但某些编辑器(如旧版 Notepad、部分 Windows 环境下的 IDE)可能默认保存为 GBK、GBK2312 或其它本地编码。如果文件实际是 GBK 编码却含中文,而你没声明编码,Python 就会尝试用 UTF-8 解码——字节对不上,就报错。
- Linux/macOS 终端下通常没问题(终端和编辑器多默认 UTF-8)
- Windows 上用记事本保存的 .py 文件,容易默认为 ANSI(即 GBK),最容易出这个问题
- VS Code、PyCharm 等现代编辑器一般会显示并允许切换文件编码,建议设为 UTF-8 并保存
验证是否生效
写个简单测试:
# coding: utf-8print("你好,世界")
能正常运行输出,说明编码声明起作用了。如果删掉声明后报错,就印证了问题根源。
额外提醒
- Shebang 行(如
#!/usr/bin/env python3)算第一行,编码声明可以放在第二行 - 不要写成
# -*- coding: utf8 -*-(少了个短横或写错拼写),必须是utf-8 - Python 3.15+ 开始支持
# coding: utf-8-sig来跳过 BOM,但普通场景用utf-8就够了
基本上就这些。日常开发中养成习惯:新建 .py 文件时,第一行或第二行加上 # coding: utf-8,一劳永逸。

码文件,不可有空行隔开,现代编辑器建议设为UTF-8保存。






