字符编码和字符集

字符编码和字符集

news/2024/11/14 11:59:33/文章来源:https://blog.csdn.net/weixin_42259470/article/details/143638229

1. 字符编码和字符集

1.1. 字符编码

编码：字符 –>字节
解码：字节 –>字符
字符编码Character Encoding : 就是一套自然语言的字符与二进制数之间的对应规则。

1.2. 字符集

字符集 Charset：是一个系统支持的所有字符的集合，包括各国家文字、标点符号、图形符号、数字等。

计算机要准确的存储和识别各种字符集符号，需要进行字符编码，一套字符集必然至少有一套字符编码。常见字符集有ASCII字符集、GBK字符集、Unicode字符集等。

ASCII字符集 (1 字节) ：

ASCII用于显示现代英语，主要包括控制字符（回车键、退格、换行键等）和可显示字符（英文大小写字符、阿拉伯数字和西文符号）。

基本的ASCII字符集，使用7位（bits）表示一个字符，共128字符。ASCII的扩展字符集使用8位（bits）表示一个字符，共256字符，方便支持欧洲常用字符。

GBxxx字符集 (2 字节) ：

GB2312：简体中文码表。一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，这样大约可以组合了包含7000多个简体汉字，此外数学符号、罗马希腊的字母、日文的假名们都编进去了，连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码，这就是常说的"全角"字符，而原来在127号以下的那些就叫"半角"字符了。

GBK：最常用的中文码表。是在GB2312标准基础上的扩展规范，使用了双字节编码方案，共收录了21003个汉字，完全兼容GB2312标准，同时支持繁体汉字以及日韩汉字等。

GB18030：最新的中文码表。收录汉字70244个，采用多字节编码，每个字可以由1个、2个或4个字节组成。支持中国国内少数民族的文字，同时支持繁体汉字以及日韩汉字等。

Unicode字符集(1--4 字节) ：

它最多使用4个字节的数字来表达每个字母、符号，或者文字。有三种编码方案，UTF-8、UTF-16和UTF-32。最为常用的UTF-8编码。

UTF-8编码：可以用来表示Unicode标准中任何字符，它是电子邮件、网页及其他存储或传送文字的应用中，优先采用的编码。它使用一至四个字节为每个字符编码，编码规则：

128个US-ASCII字符，只需一个字节编码。
拉丁文等字符，需要二个字节编码。
大部分常用字（含中文），使用三个字节编码。
其他极少使用的Unicode辅助字符，使用四字节编码。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.xdnf.cn/news/9350.html

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈，一经查实，立即删除！

相关文章

Kafka面试题解答（二）

Kafka面试题解答（二）

1.怎么尽可能保证 Kafka 的可靠性 kafka是可能会出现数据丢失问题的，Leader维护了一个动态的in-sync replica set（ISR），意为和 Leader保持同步的FollowerLeader集合(leader：0，isr:0,1,2)。如果Follower长…

阅读更多...

Chromium127编译指南 Linux篇 - 获取Chromium源码(四)

Chromium127编译指南 Linux篇 - 获取Chromium源码(四)

引言在前一节中，我们成功配置了 depot_tools 并验证了开发环境的基本可用性。接下来，我们将着手于拉取和初始设置 Chromium 的源码，这是进行 Chromium 开发的首要步骤。通过有效的源码管理和版本控制，我们能更高效、流畅地进行开…

阅读更多...

LINUX离线安装Milvus

LINUX离线安装Milvus

一.下载安装包离线安装Docker需要你提前下载Docker的安装包，并将其传输到目标机器上进行安装。以下是一个基于Linux系统的离线安装Docker的简要步骤和示例： 从有网络的机器上下载Docker安装包。将下载的安装包拷贝到离线的服务器上。在离线的服务…

阅读更多...

【HGT】文献精讲：Heterogeneous Graph Transformer

【HGT】文献精讲：Heterogeneous Graph Transformer

【HGT】文献精讲：Heterogeneous Graph Transformer 标题： Heterogeneous Graph Transformer （异构图Transformer） 作者团队： 加利福尼亚大学Yizhou Sun 摘要： 近年来，图神经网络（GN…

阅读更多...

书客、柏曼、爱德华护眼台灯护眼效果怎么样？真实测评告诉你真相

书客、柏曼、爱德华护眼台灯护眼效果怎么样？真实测评告诉你真相

现在的孩子学习压力很大，在学校课程已经塞满了大半天，课后的作业更是不少，空闲时间还需要去课后补习班的数不胜数。用眼的次数非常的高，眼睛很容易感到疲惫，这时候我们的护眼台灯大有作用，好的护眼台灯可以…

阅读更多...

(一)＜江科大STM32＞——软件环境搭建+新建工程步骤

(一)＜江科大STM32＞——软件环境搭建+新建工程步骤

一、软件环境搭建 （1）安装 Keil5 MDK 文件路径：江科大stm32入门教程资料/Keil5 MDK/MDK524a.EXE，安装即可，路径不能有中文。 （2）安装器件支持包文件路径：江科大stm32入门教程资料…

阅读更多...

Springboot 整合 Java DL4J 打造文本摘要生成系统

Springboot 整合 Java DL4J 打造文本摘要生成系统

🧑 博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/literature?__c1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，…

阅读更多...

外排序之文件归并排序实现

外排序之文件归并排序实现

1. 外排序外排序（External sorting）是指能够处理极⼤量数据的排序算法。通常来说，外排序处理的数据不能⼀次装⼊内存，只能放在读写较慢的外存储器(通常是硬盘)上。外排序通常采⽤的是⼀种“排序-归并”的策略。在排序阶段&…

阅读更多...

校园官网练习---web

校园官网练习---web

HTML： <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>西安工商学院</title><…

阅读更多...

JAVA-08-继承

JAVA-08-继承

继承父类：被继承的类子类：继承父类的类，可以访问父类的公有和保护成员。 extends:使用 extends 关键字来表示一个类继承另一个类。方法重写:子类可以重写父类的方法，以提供特定的实现。重写的方法必须与父类中的方法具有相…

阅读更多...

Trimble X12三维激光扫描仪正在改变游戏规则【上海沪敖3D】

Trimble X12三维激光扫描仪正在改变游戏规则【上海沪敖3D】

Trimble X12 三维激光扫描仪凭借清晰、纯净的点云数据和亚毫米级的精度正在改变游戏规则。今天的案例我们将与您分享，X12是如何帮助专业测量咨询公司OR3D完成的一个模拟受损平转桥运动的项目。由于习惯于以微米为单位工作，专业测量机构OR3D是一家要求…

阅读更多...

SpringBoot框架下的资产管理创新

SpringBoot框架下的资产管理创新

4系统概要设计 4.1概述系统设计原则以技术先进、系统实用、结构合理、产品主流、低成本、低维护量作为基本建设原则，规划系统的整体构架. 先进性： 在产品设计上，整个系统软硬件设备的设计符合高新技术的潮流，媒体数字化、压缩、…

阅读更多...

统信UOS开发环境支持Perl

统信UOS开发环境支持Perl

UOS凭借广泛的编程语言支持，为开发者构建了一个高效灵活的开发环境，无需担心环境兼容性问题。文章目录一、环境部署1. Perl开发环境安装2. Perl开发环境配置环境变量配置模块管理器编辑器集成调试工具二、代码示例文件处理Web开发三、常见问题1. 依赖管理问题2. 性能问题3.…

阅读更多...

qt QClipboard详解

qt QClipboard详解

1、概述 QClipboard是Qt框架中的一个类，它提供了对窗口系统剪贴板的访问能力。剪贴板是一个临时存储区域，通常用于在应用程序之间传递文本、图像和其他数据。QClipboard通过统一的接口来操作剪贴板内容，使得开发者能够方便地实现剪切、复制和…

阅读更多...

机器学习在时间序列预测中的应用与实现——以电力负荷预测为例（附代码）

机器学习在时间序列预测中的应用与实现——以电力负荷预测为例（附代码）

📝个人主页🌹：一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言随着数据采集技术的发展，时间序列数据在各个领域中的应用越来越广泛。时间序列预测旨在基于过去的时间数据来…

阅读更多...

强大的吾店云建站平台介绍

强大的吾店云建站平台介绍

经过多年在WordPress建站领域的摸索和探索，能轻松创建和管理各种类型网站的平台 – 吾店云建站平台诞生了。应该说这是一个艰苦卓绝的过程，在中国创建一个能轻松创建和使用WordPress网站的平台并不容易，最主要是网络环境和托管软件的限制。…

阅读更多...

猿创征文｜Inscode桌面IDE：打造高效开发新体验

猿创征文｜Inscode桌面IDE：打造高效开发新体验

猿创征文｜Inscode桌面IDE：打造高效开发新体验引言在当今快速发展的软件开发领域，一个高效、易用的集成开发环境（IDE）是每个开发者必不可少的工具。Inscode 桌面 IDE 作为一款新兴的开发工具，凭借其强大…

阅读更多...

Java多线程并发安全问题

Java多线程并发安全问题

多线程并发安全问题概念当多个线程并发操作同一临界资源,由于线程切换时机不确定,导致操作临界资源的顺序出现混乱严重时可能导致系统瘫痪. 临界资源:操作该资源的全过程同时只能被单个线程完成. 例当beans为1时，若两个线程同时调用getBean方法，t…

阅读更多...

电脑管家实时监控软件下载 | 六款知名又实用的电脑监控软件推荐！（珍藏篇）

电脑管家实时监控软件下载 | 六款知名又实用的电脑监控软件推荐！（珍藏篇）

在当今的商业环境，企业对于员工在工作期间的行为监控需求越来越强烈。尤其是在网络化和信息化程度不断提高的今天，电脑管家实时监控软件是企业管理员工工作行为、提高工作效率、防止信息泄露的重要工具。本文，将为您推荐六款知名又实用的电…

阅读更多...

机器学习—训练细节

机器学习—训练细节

首先回忆如何训练一个逻辑回归模型，建立一个Logistic回归模型是：你将指定如何计算输出给定输入特征x和参数w和b，在逻辑回归函数预测f(x)g，它是应用于w*xb的Z状结肠函数，所以如果znp.dot(w,x)b，f_x1/(1np.ex…

阅读更多...

最新文章