当前位置: 首页 > article >正文

36【Unicode(UTF-16)】

说简单点就是现在的字符太多了(各种字体表情包等等),UTF-8已经满足不了需求了,所以引入了Unicode(UTF-16),目的就是为了表达更多的字符

Unicode对于单个字符采用4个字节来表示,但是双字符不一定是8个字节
例子:

你:{96,79,0,0}
你你:{96,79,96,79,0,0}
a:{97,0,0,0}
aa:{97,0,97,0,0,0}


0,0可以理解为结束符,一般在表达中文和英文的时候,字节数=字符数*2 + 2 ,加上的2就是结束符0,0,我们也主要只会涉及到英文和中文的编码转换,熟悉这个规则就好


这其实也是给很多人解答一个疑惑,为什么写出的文本包含一个字符的是4个字节(当然也有可能是2个字节,直接把0,0这个结束符给省略了),2个字符却是6字节了


http://www.kler.cn/a/526595.html

相关文章:

  • 线程池以及在QT中的接口使用
  • maven、npm、pip、yum官方镜像修改文档
  • Nuxt:利用public-ip这个npm包来获取公网IP
  • python编程环境安装保姆级教程--python-3.7.2pycharm2021.2.3社区版
  • 分布式系统架构怎么搭建?
  • 【Redis】 String 类型的介绍和常用命令
  • 如何解除TikTok地区限制:实用方法解析
  • 【PyTorch】6.张量运算函数:一键开启!PyTorch 张量函数的宝藏工厂
  • 【思维导图】java
  • unity免费资源2025-1-26
  • solidity基础 -- 可视范围
  • Blazor-@inject
  • [前端开发]记录国内快速cdn库,用于在线引入JavaScript第三方库
  • ubuntu20.04.6下运行VLC-Qt例子simple-player
  • ChatGPT-4o和ChatGPT-4o mini的差异点
  • Vue.js组件开发深度指南:从零到可复用的艺术
  • Linux内核中container_of宏深度刨析
  • 算法题(52):翻转二叉树
  • @Inject @Qualifier @Named
  • LangChain教程 - RAG - PDF解析
  • Three.js 后期处理(Post-Processing)详解
  • 【AI】Deepseek本地部署探索,尝试联网搜索
  • react中如何获取dom元素
  • 【2024年华为OD机试】(B卷,100分)- 热点网站统计(Java JS PythonC/C++)
  • 使用DeepSeek API生成Markdown文件
  • 使用Ollama和Open WebUI快速玩转大模型:简单快捷的尝试各种llm大模型,比如DeepSeek r1