当前位置: 首页 > article >正文

【MySQL】数据类型【mysql当中各自经典的数据类型的学习和使用】

目录

  • 数据类型
    • 1数据类型分类
    • 2.数值类型
      • 2.1tinyint类型
      • 2.2bit类型
      • 2.3小数类型
        • 2.3.1float
        • 2.3.2decimal
    • 3.字符串类型
      • 3.1char
      • 3.2varchar
      • 3.3char和varchar的对比
    • 4.日期和时间类型
    • 5.enum和set
      • 5.1对enum和set进行插入
      • 5.2对enum和set进行查询

数据类型

数据类型本身就是mysql当中天然的一种约束

1数据类型分类

数据类型一共分为数值类型、文本,二进制类型、时间日期类型、String类型

image-20240910123848090

2.数值类型

image-20240910124644176

2.1tinyint类型

数值越界测试:

要讲述tintint类型,我们肯定要建一个表,在里面弄一个字段,字段类型是tinyint类型、

create table t1(
num tinyint
)

要注意,如果在声明的字段的数据类型的时候,没有表明是unsigned(无符号),那默认就是有符号的。由于tinyint只占一个字节,因此有符号的话,存储范围就是 -128~127

建表完毕如下图

image-20240910133008556

我们知道该表的tinyint的存储范围是-128~127,现在我们往里面插入一些数据

insert into t1 values(-128),(127),(0);

image-20240910133330480

插入范围内的数据会报错,那我们插入范围外的呢?

insert into t1 values(-129),(128);

image-20240910133444703

如图所示,mysql会直接报错,说超出范围了、

我们再来看看无符号unsigned 的tinyint。

create table if not exists t2(
num tinyint unsigned
)

同样插入几个数据,我们发现在0~255的数据都可以插入进去,刚好对应unsigned tinyint的范围。

image-20240910135035175

如果插入超出范围的数据,一样也会被拦截的。这是因为在mysql中,数据类型本身也是一种约束约束指的是约束使用者,倒闭使用者在插入数据的时候要考虑数据的合法性。并且哪怕数据不合法,mysql也会拦截。】

如果是其他语言,大数据放到小范围里可能会发生数据的截断,但是在mysql当中不行,因为如果一个表格当中,有部分数据是被截断过的,那用户还能信任这个表格吗,当然是不行的,因此mysql当中的表,一定是数据合法才能插入。

对于其他数据类型也可以样子实验,这里就不实验。

2.2bit类型

bit[(M)] : 位字段类型。M表示每个值的位数,范围从1到64。如果M被忽略,默认为1

实例:

我们创建一个表,online表示是否在线

create table t3(
    -> id int, 
    -> online bit(1) comment '在线状态'
    -> );

此时我们的字段online是bit类型,是位字段类型,只有一个比特位,应该只能插入0和1两种数据。

实际上也确实,我们插入下图所示的2给字段online,mysql会直接进行拦截。

image-20240910180242531

我们插入四个数据

insert into t3(id, online) values(123, 0), (124, 0);
insert into t3(id, online) values(125, 1), (126, 1);

然后选择展示所有数据,我们会发现online字段的数据我们是没办法看见的。

image-20240910180842575

为什么呢?
因为bit类型 是位类型,是通过ASCII码值来显示,但是此时的表我们可以认为,ASCII码值是不可见的。因此我们看不见online字段的数据。

要查看的话要输入下面这条指令:

select id, hex(online) from t3;

将online字段的数据以10进制显示出来

image-20240910181321935

为了验证bit类型在显示的时候是按照对应的ASCII码值去显示的。

我们修改一个online字段,修改一下online字段的位数

alter table t3 modify online bit(10) comment '用户在线状态';

然后再插入一些数据

insert into t3(id, online) values(127, 6), (128, 11);
insert into t3(id, online) values(129, 'a')

然后再查表

image-20240910195304169

我们发现原来存不进去的大于1的数据都能存进去了,因为10个位,可以以二进制的形式存下0~2的10次方之内的数。

并且我们插入’a’,实际上就是以存储了’a’的ASCII码值,显示的时候以ASCII码值显示,因此是a,怎么证明?

我们再插入一个’a’的ASCII码值就可以证明

insert into t3(id, online) values(129, 97)

image-20240910195547579

2.3小数类型

2.3.1float
float[(m, d)] [unsigned] : M指定显示长度,d指定小数位数,占用空间4个字节

实例:创建一个字段 数据类型是float(4.2)

小数:float(4,2)表示的范围是-99.99 ~ 99.99,MySQL在保存值时会进行四舍五入,并且没有标明是unsigned,因此是有符号float

如下图所示,插入了三个数据。

image-20240911004004503

并且插入由于长度是是4,因此下图的情况不行

image-20240911004332527

但是并不是超出长度就会被mysql拦截,因为MySQL在保存值时会进行四舍五入

比如下图

image-20240911005144328

查表的数据,发现确实如此。

image-20240911005204545

**注意:**float的无符号类型和前面学的int类型是有一些不一样的,比如范围的变动,对于float unsigned来说,范围大小只会变小。

**实例:**创建一个表t5,有一个字段salary是无符号float(4,2)类型,范围是0~99.99,其他的东西不会变

image-20240911010105534

插入一些不同的数据

image-20240911010423201

注意:浮点数类型是一定会存在精度损失现象的,无论是小数部分还是整数部分,在进行数据的存入的时候,数据的精度都有可能会丢失。

我们来验证一下,首先将原来的字段修改一下类型的长度和精度,使用默认的float。

image-20240911011426445

我们再插入几个数据,看看表内的数据是否有精度损失的现象。

image-20240911012153013

再试一个

image-20240911012311296

2.3.2decimal
decimal(m, d) [unsigned] : 定点数m指定长度,d表示小数点的位数

学习float的时候,我们知道会有精度丢失的情况出现,使用decimal就可以避免。

实例:

create table t6(
    -> id int,
    -> f1 float(10,8),
    -> f2 decimal(4, 2)
    -> );

我们对decimal类型做和float同样的越界测试。

结果如下:

image-20240911132603730

  • decimal(4,2) 表示的范围是 -99.99 ~ 99.99

  • decimal(4,2) unsigned 表示的范围 0 ~ 99.99

我们发现和float的规则是一样的。变为无符号后的规则也是一样的。但是decimal有自己的优势,decimal的精度更高

验证:

先将字段属性改一下alter table t6 modify f2 decimal(10,8);

再插入数据:

insert into t6(id, f1, f2) values(5, 23.12345612, 23.12345612);

image-20240911133455980

总结:

  1. float的精度大概是7位
  2. decimal整数最大位数m为65。支持小数最大位数d是30。如果d被省略,默认为0.如果m被省略,默认是10
  3. 如果希望小数的精度高,推荐使用decimal

3.字符串类型

3.1char

char(L): 固定长度字符串,L是可以存储的长度,单位为字符,最大长度值可以为255

要注意这里的L的单位是字符,如果L是2,代表能存储两个字符,和字符所占据的字节无关,如果这个字符是汉字,就能存储2个汉字,如果是英文,就能存储两个字母。尽管每个汉字在mysql的utf8规则中占3个字节,英文字母占1字节

我们来做一下测试:
先创建一个表t7,里面有两个字段,分别是id,和name。name的类型是char(2)

image-20240916204713975

然后我们向里面插入数据:

我们发现,无论是中温暖还是英文,只要是插入了3个字符的情况,就会报错。

image-20240916205007655

image-20240916204902602

插入成功的数据如下:

image-20240916205050191

说明:

char(2) 表示可以存放两个字符,可以是字母或汉字,但是不能超过2个, 最多只能是255

如果在建表的时候,定义的字符长度超过了255,mysql直接不让建表。

image-20240916205214663

3.2varchar

varchar(L): 可变长度字符串,L表示字符长度,最大长度65535个字节

做个测试:

image-20240916210433706

其实使用起来和char类型是没有什么区别的。

那varchar和char到底在什么地方不一样呢?其实就是在它的名字上,varchar是可变长字符串——也就是你要多少字节我就给你多少,在字符数合法的情况下。

说明:

关于varchar(len),len到底是多大,这个len值,和表的编码密切相关:

varchar字节长度可以指定为0到65535之间的值,但是有1 - 3 个字节用于记录数据大小,所以说有效字节数是65532。

当我们的表的编码是utf8时,varchar(n)的参数n最大值是65532/3=21844[因为utf中,一个字符占用3个字节]

如果编码是gbk,varchar(n)的参数n最大是65532/2=32766(因为gbk中,一个字符占用2字节)。

下图这个情况是因为mysql一行的字节数有限制,id这个字段的int类型,也要占一定字节数,因此最多只能是21842

image-20240916212528392

如果只是单纯的varchar类型我们最多只能插入21844,而不是21845,因为有1 - 3 个字节用于记录数据大小,所以说有效字节数是65532。

3.3char和varchar的对比

image-20240916213350693

那如何决定用char还是varchar?

  1. 如果数据确定长度都一样,就使用定长(char),比如:身份证,手机号,md5

  2. 如果数据长度有变化,就使用变长(varchar), 比如:名字,地址,但是你要保证最长的能存的进去。

  3. 定长的磁盘空间比较浪费,但是效率高。

  4. 变长的磁盘空间比较节省,但是效率低。

  5. 定长的意义是,直接开辟好对应的空间

  6. 变长的意义是,在不超过自定义范围的情况下,用多少,开辟多少。

4.日期和时间类型

常用的日期有如下三个:

  • date :日期 yyyy-mm-dd ,占用三字节
  • datetime 时间日期格式 yyyy-mm-dd HH:ii:ss表示范围从 1000 到 9999 ,占用八字节
  • timestamp :时间戳,从1970年开始的 yyyy-mm-dd HH:ii:ss 格式和 datetime 完全一致,占用四字节

timestamp和datatime的区别就是timestamp会实时变化

实例:

先建一个表

image-20240917002354041

这里t3有一个额外属性,是因为它是类型是timestamp,时间戳要根据时间实时变动

我们插入一个数据

insert into t9(t1, t2) values('2000-10-01', '1999-10-01 08:00:00');

image-20240917003823895

我们发现,尽管我们只插入了两个数据,但是t3会自动插入数据。这个数据就是我进行插入操作的时间。

如果我再对该表的数据进行一次操作,那么t3的时间也会对应的改变。

image-20240917005100282

因此,只要我们对这个表进行任何操作,这个timestamp类型的字段都会自动更新时间。

timestamp类型的字段的经典应用场景就是评论区的评论时间【评论的时间是根据发布评论的时间定的】

datetime类型的字段通常用在不怎么需要改变的时间【比如身份证的有效时间段】

5.enum和set

enum和set

  • enum:枚举,“单选”类型;

enum(‘选项1’,‘选项2’,‘选项3’,…);

该设定只是提供了若干个选项的值,最终一个单元格中,实际只存储了其中一个值;而且出于效率考虑,这些值实际存储的是“数字”,因为这些选项的每个选项值依次对应如下数字:1,2,3,…最多65535个;当我们添加枚举值时,也可以添加对应的数字编号。

  • set:集合,“多选”类型;

set(‘选项值1’,‘选项值2’,‘选项值3’, …);

该设定只是提供了若干个选项的值,最终一个单元格中,设计可存储了其中任意多个值;而且出于效率考虑,这些值实际存储的是“数字”,因为这些选项的每个选项值依次对应如下数字:1,2,4,8,16,32,…最多64个

说明:不建议在添加枚举值,集合值的时候采用数字的方式,因为不利于阅读。

实例:

有一个调查表votes,需要调查人的喜好, 比如从(游泳,篮球,足球等)中去选择(可以多选),性别为(男,女)[单选]

create table if not exists votes(
    -> username varchar(30),
    -> gender enum('男','女'),
    -> hobby set('打代码', '打羽毛球', '打篮球', '踢足球', '游泳')
    -> );

image-20240917100959544

5.1对enum和set进行插入

  • 对enum类型进行测试:

我们插入数据

image-20240917103638749

有一个特殊的插入:

image-20240917103855896

对于枚举类型来说,存储的元素是有下标的,这个下标从1开始

image-20240917103921169

  • 对集合类型进行测试

对于集合元素来说,插入的元素一定要是set定义时有的,比如set只有打羽毛球和打篮球,但是插入如果不输入完整是插入不了的,如下图:

image-20240917104140703

并且set和enum的区别就是,set可以多选。

image-20240917104920720

并且你输入的元素顺序,和最终插入的顺序是没有关系的,只要你输入的是set中的元素,最后插入的时候,是按照定义时的set的顺序来插入的

image-20240917105055515

这里还有一个需要讲清楚的:

hobby这个字段我们没有进行约束,默认是可以为空的,0代表的是’ ’

NULL 和 ’ '的区别就是:

假设有一个账户

NULL是根本没有账户

’ '是有账户,但是账户里什么都没有

image-20240917105647604

对于集合类型的字段,我们也可以用数字的方式进行数据的插入:

要注意,这个和enum的下标式插入不一样。

集合类型如果用数字插入的话是"比特位插入法"。

image-20240917110227555

为什么我们说是比特位插入法呢?我们来看一张图片:

image-20240917110702357

因此我们来验证一下输入7是否是前三个元素存在

image-20240917110808002

可以看到确实如此,要输入五个元素都存在的话,就输入31就行了。

因此枚举用数字插入就是下标,集合用数字插入就是比特位插入

5.2对enum和set进行查询

  • 对enum类型进行查询

由于enum只能单选,所以查询时还是好查询的,既可以通过字符去查,也可以通过数字去查

image-20240917121912640

  • 对set类型进行查询

由于set是存在多选的情况,并且其数字查询不是下标查询,是看的比特位。

因此相对麻烦,我们来测试一下。

image-20240917122913882

上图,我们查询了hobby集合中是否有人的爱好是打羽毛球,输出了三个。

但是这样子好像有点小小的问题,那就是有些人的爱好是多样性的,可能打羽毛球只是众多爱好的其中之一,但是这里没有查询到这类人群。

如果我们只用字符或者数字的方式去查看的话,可以说是很麻烦的。只能精确的按照每一种情况去进行查询。

image-20240917123424818

如果我们想查询爱好中有羽毛球的这个需求的话,我们需要借助集合查询函数——find_ in_ set

find_in_set(sub,str_list) :如果 sub 在 str_list 中,则返回下标;如果不在,返回0;str_list: 用逗号分隔的字符串。

在mysql中函数是可以直接使用的。

image-20240917124326939

可以发现,就是查询一个元素是否存在在一个集合内,如果存在就返回这个元素在这个集合当中的下标,下标是从1开始。

既然知道了find_in_set函数如何使用,我们再来试试应用到上面的场景里

输入下面这条指令就可以查询有羽毛球这个爱好的所有人

select * from votes where find_in_set('打羽毛球', hobby);

image-20240917124831410

如果想查询的是存在打羽毛球和打代码这两个爱好的人呢?

就要多加一个and

select * from votes where find_in_set('打羽毛球', hobby) and find_in_set('打代码',hobby);

image-20240917125152337

这样查询到的就是存在这两个爱好的所有人。

如果要查询更多就再加and就行了。

注意:我们要灵活运用字符查询、数字查询、和函数查询


http://www.kler.cn/a/318185.html

相关文章:

  • JAVA开发入门学习七- 数组
  • SpringBoot简单使用Stomp
  • 用C#(.NET8)开发一个NTP(SNTP)服务
  • nest 学习3
  • Leetcode 3393. Count Paths With the Given XOR Value
  • C++---------随机库,standfor库
  • Leetcode 136 只出现一次的数字
  • EfficientFormer实战:使用EfficientFormerV2实现图像分类任务(一)
  • WPF 的TreeView的TreeViewItem下动态生成TreeViewItem
  • 合宙LuatOS应用,与时间相关那些事
  • k8s中pod的创建过程和阶段状态
  • Allegro视频去除走线的小方块
  • Milvus - 四种一致性级别与应用场景解析
  • 可靠传输是什么?是基于UDP实现的吗
  • JUC并发编程_四大函数式接口和 Stream 流式计算
  • 适用于 Windows 的 7 大数据恢复工具,可靠的数据恢复工具可有效地恢复丢失的文件
  • 后端开发工程师转行大模型领域:全面学习路线指南,非常详细收藏我这一篇就够了
  • 【大语言模型_1】VLLM部署Qwen模型
  • 【速成Redis】04 Redis 概念扫盲:事务、持久化、主从复制、哨兵模式
  • 2-102基于matlab的蒙特卡洛仿真
  • C语言——文件操作
  • [数据结构]动态顺序表的实现与应用
  • 第二证券:“产业+科技” 中国并购重组市场持续升温
  • 【微服务即时通讯系统】——etcd一致性键值存储系统,etcd的介绍,etcd的安装,etcd使用和功能测试
  • Scikit-learn 识别手写数字
  • Qt:NULL与nullptr的区别(手写nullptr)