mysql怎么设置编码_mysql字符集与编码设置方法详解

MySQL中的字符集和编码设置对数据存储、读取以及跨平台兼容性至关重要。如果设置不当,容易出现乱码问题,尤其是在处理中文等非英文字符时。下面详细介绍MySQL中如何正确设置字符集与编码。

查看当前字符集设置

在调整之前,先确认当前MySQL的字符集配置:

SHOW VARIABLES LIKE 'character_set_%';
SHOW VARIABLES LIKE 'collation_%';
重点关注以下变量:
  • character_set_client:客户端发送语句使用的字符集
  • character_set_connection:连接层使用的字符集
  • character_set_database:当前数据库默认字符集
  • character_set_server:服务器默认字符集
  • character_set_results:查询结果返回的字符集

设置服务器级别字符集

最根本的方法是在MySQL配置文件中统一设置默认字符集。配置文件通常为:
  • Linux: /etc/my.cnf/etc/mysql/my.cnf
  • Windows: my.ini
在[mysqld]段落中添加以下内容:
[mysqld]
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
保存后重启MySQL服务生效。 注意:推荐使用utf8mb4而非utf8,因为MySQL的utf8是伪UTF-8,最多支持3字节,无法存储emoji等4字节字符;而utf8mb4才是真正的UTF-8实现。

创建数据库和表时指定字符集

在创建数据库时显式指定字符集:
CREATE DATABASE mydb 
CHARACTER SET utf8mb4 
COLLATE utf8mb4_unicode_ci;
建表时也可以单独设置:
CREATE TABLE users (
  id INT PRIMARY KEY,
  name VARCHAR(100)
) ENGINE=InnoDB 
CHARACTER SET utf8mb4 
COLLATE utf8mb4_unicode_ci;
如果不指定,则继承数据库或服务器的默认设置。

修改已有对象的字符集

若需更改现有数据库或表的字符集,可用ALTER命令:
ALTER DATABASE mydb 
CHARACTER SET utf8mb4 
COLLATE utf8mb4_unicode_ci;
ALTER TABLE users 
CONVERT TO CHARACTER SET utf8mb4 
COLLATE utf8mb4_unicode_ci;
此操作会重新构建表结构并转换数据,建议在低峰期执行,并提前备份。

连接时设置字符集

应用程序连接MySQL时也应声明正确的字符集。例如:
  • PHP(PDO)
    $pdo = new PDO($dsn, $user, $pass, [
        PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8mb4"
    ]);
  • Java(JDBC)**:
    jdbc:mysql://localhost:3306/mydb?characterEncoding=utf8mb4
  • 命令行客户端**:
    登录时加上默认字符集:
    mysql -u root -p --default-character-set=utf8mb4

验证设置是否生效

完成配置后再次运行:
SHOW VARIABLES LIKE 'character_set_%';
确保关键变量均为utf8mb4。同时插入一条包含中文或emoji的数据测试显示效果。 基本上就这些。只要从配置文件、数据库、表、连接四个层面统一使用utf8mb4,就能有效避免乱码问题。