Java中String的length与Oracle数据库中VARCHAR2实际存储长度不一致的问题
目录
一、根本原因
二、解决方案
一、根本原因
Oracle数据库新增数据的时候报如下错误:
先给大家看个小案例,这样更好去理解,下面是一段测试代码:
这里面我分别列举了三种字符串,中文,英文和数字以及两种不同的编码方式(GBK和UTF-8),打印结果如下:
可以很直观的看出来Java中的String对象的length()方法返回字符串的字符数量,而不是字节数。
其次在不同的字符编码中,字符所占用的字节数是不同的。下面是GBK和UTF-8编码下,中文、英文和数字字符所占用的字节数:
1. GBK编码
中文字符:通常占 2个字节。
英文字符(ASCII范围内):占用1个字节。
数字字符(0-9):占用1个字节。
2.UTF-8编码
中文字符:通常占用3个字节(对于大多数中文字符)。
英文字符(ASCII范围内):占用1个字节。
数字字符(0-9):占用1个字节。
所以,Oracle中的VARCHAR2可以存储的汉字数量取决于我们数据库使用的编码方式。
执行如下语句可以查询我们数据库的编码方式:
select userenv('language') from dual;
举个例子:
GBK编码:如果我们数据库使用的是GBK编码,那么每个汉字占用2个字节。在这种情况下,VARCHAR2(100)最多能存储50个汉字。
UTF-8编码:如果数据库使用的是UTF-8编码,那么每个汉字占用3个字节。在这种情况下,VARCHAR2(100)最多能存储33个汉字。
注:Oracle数据库length方法获取的也是字符串的字符数量,如下图所示:
二、解决方案
其实只要在插入之前给字符串进行一下判断就行,比如我们数据库用的是GBK的编码方式,格式为VARCHAR(1),那么实例代码参考如下:
if(str.getBytes("gbk").length < 1){
}