当前位置: 首页 > article >正文

建库字符集选择`utf8mb4` + `utf8mb4_unicode_ci` 组合

在 MySQL 中创建 UTF-8 编码的数据库时,请直接使用 **`utf8mb4`** 字符集(而非旧版的 `utf8`),这是 MySQL 中真正的 UTF-8 实现。以下是具体操作和注意事项:

---

### 一、创建数据库(2种方式)
#### 1. 基础版(自动选择默认校对规则)
```sql
CREATE DATABASE your_database_name 
  CHARACTER SET utf8mb4 
  COLLATE utf8mb4_unicode_ci;
```

#### 2. 精简版(MySQL 8.0+ 默认使用 `utf8mb4`)
```sql
CREATE DATABASE your_database_name;
```

---

### 二、为什么必须选 `utf8mb4`?
- ✅ **完全支持 Unicode**:包含 Emoji 表情符号(如 😊)、生僻汉字、特殊符号等(`utf8` 仅支持 3 字节字符,无法存储 4 字节字符)。
- ✅ **兼容性**:现代 MySQL 版本(5.5.3+)均支持,且是当前标准方案。

---

### 三、校对规则选择(`COLLATE`)
- **`utf8mb4_unicode_ci`**:基于 Unicode 标准排序,准确性高(推荐)。
- **`utf8mb4_general_ci`**:旧式简单排序,速度快但准确性略低(已逐渐淘汰)。

---

### 四、后续使用注意事项
1. **创建表时显式指定字符集**(避免继承服务器默认配置):
   ```sql
   CREATE TABLE your_table (
     id INT PRIMARY KEY,
     content VARCHAR(255)
   ) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
   ```

2. **连接字符串配置**(确保应用层与数据库编码一致):
   - JDBC 示例:`jdbc:mysql://host/db?useUnicode=true&characterEncoding=UTF-8`
   - 其他语言同理,需明确指定 UTF-8 编码。

---

### 五、验证设置是否生效
```sql
-- 查看数据库编码
SELECT SCHEMA_NAME, DEFAULT_CHARACTER_SET_NAME, DEFAULT_COLLATION_NAME
FROM INFORMATION_SCHEMA.SCHEMATA
WHERE SCHEMA_NAME = 'your_database_name';

-- 查看表编码
SHOW CREATE TABLE your_table;
```

---

**总结**:直接使用 `utf8mb4` + `utf8mb4_unicode_ci` 组合,确保全面兼容 Unicode 并避免未来编码问题。


http://www.kler.cn/a/599447.html

相关文章:

  • 解决 IntelliJ IDEA 方法断点导致程序无法运行的问题
  • python面试高频考点(深度学习大模型方向)
  • 【AndroidRTC-10】webrtc是如何确定双端的编解码类型?
  • C/C++蓝桥杯算法真题打卡(Day10)
  • RAG优化:python从零实现时间管理大师Self-RAG
  • 剑指 Offer II 117. 相似的字符串
  • 网络华为HCIA+HCIP 网络编程自动化
  • C语言字符函数,字符串函数以及内存函数
  • 【漫话机器学习系列】158.均匀分布(Uniform Distribution)
  • Android Compose框架的值动画(animateTo、animateDpAsState)(二十二)
  • macOS 安装 Miniconda
  • 新能源智慧灯杆的主要功能有哪些?
  • Extend module 01:Keyboard
  • STM32学习笔记之常用外设接口(原理篇)
  • 8.BST的缺陷解决方案:平衡树*****
  • 什么是索引?为什么要使用B树作为索引数据结构?
  • 股指期权最后交易日是哪一天?
  • Flask(一)概述与快速入门
  • 蓝桥杯备考:学会使用方向向量
  • Pyserial库使用