【MySQL系列】区分大小写与支持表情字符的考量

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。
img

  • 推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老
  • 导航
    • 檀越剑指大厂系列:全面总结 java 核心技术,jvm,并发编程 redis,kafka,Spring,微服务等
    • 常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,typora 等
    • 数据库系列:详细总结了常用数据库 mysql 技术点,以及工作中遇到的 mysql 问题等
    • 新空间代码工作室:提供各种软件服务,承接各种毕业设计,毕业论文等
    • 懒人运维系列:总结好用的命令,解放双手不香吗?能用一个命令完成绝不用两个操作
    • 数据结构与算法系列:总结数据结构和算法,不同类型针对性训练,提升编程思维,剑指大厂

非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。💝💝💝 ✨✨ 欢迎订阅本专栏 ✨✨

博客目录

    • 1. 理解排序规则
    • 2. utf8mb4 字符集
    • 3. 排序规则的选择
      • 3.1 utf8mb4_bin
      • 3.2 utf8mb4_0900_as_cs
    • 4. 应用排序规则
      • 4.1 使用 utf8mb4_bin
      • 4.2 使用 utf8mb4_0900_as_cs
    • 5. 性能考虑

在当今的互联网时代,数据的存储和处理变得越来越复杂。尤其是随着全球化的发展和社交媒体的兴起,数据库不仅要处理传统的文本数据,还需要处理包含表情符号等特殊字符的数据。此外,对于大小写敏感性的需求也日益增加。
在这里插入图片描述

1. 理解排序规则

排序规则(Collation)是数据库中用于确定字符数据如何比较和排序的规则。在 MySQL 中,排序规则与字符集(Character Set)紧密相关。字符集定义了数据库可以存储的字符集合,而排序规则则定义了这些字符如何被比较和排序。

2. utf8mb4 字符集

utf8mb4 是一种广泛使用的字符集,它是 utf8 的超集,能够存储任何 Unicode 字符,包括表情符号。utf8mb4 使用四个字节来存储每个字符,这使得它能够覆盖所有的 Unicode 字符,而不仅仅是基本的多语言平面(BMP)。

3. 排序规则的选择

在选择排序规则时,我们需要考虑两个主要因素:是否区分大小写和是否支持表情字符。以下是两种支持 utf8mb4 并满足这些条件的排序规则:

3.1 utf8mb4_bin

utf8mb4_bin 是一个二进制排序规则,它完全区分大小写,并且可以处理所有 utf8mb4 字符。这种排序规则适用于需要精确二进制比较的场景,例如在某些搜索和比较操作中,需要区分大小写和特殊字符。

3.2 utf8mb4_0900_as_cs

utf8mb4_0900_as_cs 是基于 Unicode 9.0 的排序规则,它支持区分大小写和表情符号。这种排序规则可能比 utf8mb4_bin 更复杂,因为它涉及到更多的语言和文化规则。适用于需要遵循特定语言或地区排序习惯的场景。

4. 应用排序规则

在 MySQL 中,可以通过 ALTER TABLE 语句来改变表的排序规则。以下是两种排序规则的应用示例:

4.1 使用 utf8mb4_bin

ALTER TABLE `test` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_bin;

这条语句将 test_table 表的字符集转换为 utf8mb4,并设置排序规则为 utf8mb4_bin。这样,表中的数据将按照二进制方式进行排序,区分大小写和特殊字符。

4.2 使用 utf8mb4_0900_as_cs

ALTER TABLE `test_table` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_as_cs;

这条语句将 test_table 表的字符集转换为 utf8mb4,并设置排序规则为 utf8mb4_0900_as_cs。这样,表中的数据将按照 Unicode 9.0 的规则进行排序,区分大小写和特殊字符。
在这里插入图片描述

5. 性能考虑

在选择排序规则时,除了功能性需求外,还需要考虑性能。二进制排序规则(如 utf8mb4_bin)通常在性能上更优,因为它们不需要复杂的比较逻辑。然而,如果应用场景需要遵循特定的文化或语言排序规则,那么基于 Unicode 的排序规则(如 utf8mb4_0900_as_cs)可能是更好的选择。

觉得有用的话点个赞 👍🏻 呗。
❤️❤️❤️本人水平有限,如有纰漏,欢迎各位大佬评论批评指正!😄😄😄

💘💘💘如果觉得这篇文对你有帮助的话,也请给个点赞、收藏下吧,非常感谢!👍 👍 👍

🔥🔥🔥Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧!🌙🌙🌙

img

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/6995.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【科普】简述机器学习和深度学习及其相关的算法

文章目录 机器学习1. 基本概念2. 机器学习的分类3. 机器学习的常用方法4. 应用领域5. 挑战与未来6. 未来趋势 机器学习算法 深度学习1.深度学习的基本概念2.深度学习的主要架构3.深度学习的应用4.深度学习的挑战 深度学习算法 机器学习 机器学习是人工智能的一个重要分支&…

232转485模块测试

概述 常用的PLC一般会有两个左右的232口,以及两个左右的485口,CAN口等,但是PLC一般控制的设备可能会有很多,会超出通讯口的数量,此时我们一般会采用一个口接多个设备,这种情况下要注意干扰等因素&#xff0…

STM32外设之SPI的介绍

### STM32外设之SPI的介绍 SPI(Serial Peripheral Interface)是一种高速的,全双工,同步的通信总线,主要用于EEPROM、FLASH、实时时钟、AD转换器等外设的通信。SPI通信只需要四根线,节约了芯片的管脚&#x…

LLM——10个大型语言模型(LLM)常见面试题以及答案解析

今天我们来总结以下大型语言模型面试中常问的问题 1、哪种技术有助于减轻基于提示的学习中的偏见? A.微调 Fine-tuning B.数据增强 Data augmentation C.提示校准 Prompt calibration D.梯度裁剪 Gradient clipping 答案:C 提示校准包括调整提示,尽量减少产生…

干货 大模型LLM-微调经验分享总结_chatglm-6b alpaca-chinese数据集微调

导读 本文总结了作者在ChatGLM-6B模型微调的经验,并汇总了目前开源项目&数据。 写在前面 大型语言模型横行,之前非常焦虑,现在全面拥抱。目前也有很多开源项目进行大模型微调等,笔者也做了一阵子大模型了,特此来…

aspose如何获取PPT放映页“切换”的“持续时间”值

文章目录 项目场景问题描述问题1:从官方文档和资料查阅发现并没有对切换的持续时间进行处理的方法问题2:aspose的依赖包中,所有的关键对象都进行了混淆处理 解决方案1、找到ppt切换的持续时间对应的混淆对象中的字段2、获取ppt切换的持续时间…

获取vue.config.js里代理的路径

vue.config.js 主要用于配置 Vue CLI 的构建和开发服务器选项,不能直接拿到里面的值,如果是自己重新写的config,引入到页面就可以拿到 下面说,我的解决办法,如果有更好的,一定要给我说啊 在public目录下创…

设计者模式之策略模式

前言 在软件构建过程中,某些对象使用的算法可能多种多样,经常改变,如果将这些算法都写在对象中,将会使对象变得异常复杂;而且有时候支持不频繁使用的算法也是一个性能负担。 如何在运行时根据需要透明地更改对象的算…

分布式事务-SpringBoot集成Seata

1.本地事务和分布式事务概念 事务四大特性 原子性:事务不可再分一致性:数据改变前后,总量必须一致隔离性:事务之间相互隔离,互不干扰持久性:事务一旦提交,数据就会持久化到磁盘,不…

深入探讨钉钉与金蝶云星空的数据集成技术

钉钉报销数据集成到金蝶云星空的技术案例分享 在企业日常运营中,行政报销流程的高效管理至关重要。为了实现这一目标,我们采用了轻易云数据集成平台,将钉钉的行政报销数据无缝对接到金蝶云星空的付款单系统。本次案例将重点介绍如何通过API接…

【MATLAB源码-第200期】基于matlab的鸡群优化算法(CSO)机器人栅格路径规划,输出做短路径图和适应度曲线。

操作环境: MATLAB 2022a 1、算法描述 鸡群优化算法(Chicken Swarm Optimization,简称CSO)是一种启发式搜索算法,它的设计灵感来源于鸡群的社会行为。这种算法由Xian-bing Meng等人于2014年提出,旨在解决…

优阅达携手 Aiven 亮相新加坡科技周,推动企业多云数据管理与开源技术创新

助力企业在任何云上提高数据管理效率,开发个性化的创新技术解决方案。 10 月中旬, 2024 年新加坡科技周在 Marina Bay Sands 盛大举行,吸引了超过 25,000 名科技领袖、500 多家参展商和 600 多位演讲者,共同展示了全球前沿的技术…

【AIGC】国内AI工具复现GPTs效果详解

博客主页: [小ᶻZ࿆] 本文专栏: AIGC | GPTs应用实例 文章目录 💯前言💯本文所要复现的GPTs介绍💯GPTs指令作为提示词在ChatGPT实现类似效果💯国内AI工具复现GPTs效果可能出现的问题解决方法解决后的效果 &#x1…

Unreal5从入门到精通之如何在指定的显示器上运行UE程序

前言 我们有一个设备,是一个带双显示器的机柜,主显示器是一个小竖屏,可以触屏操作,大显示器是一个普通的横屏显示器。我们用这个机柜的原因就是可以摆脱鼠标和键盘,直接使用触屏操作,又可以在大屏观看,非常适合用于教学。 然后我们为这款机柜做了很多个VR项目,包括Uni…

解决linux mint22安装VMware虚拟机报错

涉及版本范围 linux内核6.8x-6.9.x vmware版本17.5.2 解决办法 wget https://github.com/nan0desu/vmware-host-modules/archive/refs/heads/tmp/workstation-17.5.2-k6.9.1.zip unzip workstation-17.5.2-k6.9.1.zip cd vmware-host-modules-tmp-workstation-17.5.2-k6.9.1…

vue echarts左右间距调整 左右空白

咱就说这样的左右间距丑不丑。。 经过调整后,嗯,好看了很多。页面也协调多了! 直接上代码:添加以下配置数据: grid: {x: 50,y: 25,x2: 30,y2: 35 }, this.chart.setOption({width: 100%,xAxis: {show: false,type: ca…

基于梧桐数据库的实时数据分析解决方案

一、背景 在当今信息时代,数据的价值不言而喻。然而,处理海量数据并将其转化为有意义的洞察力是一项艰巨的任务。传统的数据处理方法已经无法满足我们日益增长的需求。为了满足这一挑战,实时数据处理系统应运而生。 ​ 实时数据处理系统是一…

一个git相关的cve:CVE-2024-32002

最近听说一个与自己相关的CVE, CVE-2024-32002 文章目录 前言Description二、PATCH总结 前言 cve git windows hook submodule 利用submodule和hook,实现对.git目录注入hook的目标。 影响windows和mac os下的大部分git版本。 提示:以下是本篇文章正文内…

电商API:开启电商新时代的关键钥匙

一、电商API:定义与发展 电商API,即应用程序编程接口,是连接不同软件系统的桥梁,在电商领域中发挥着至关重要的作用。电商API的发展历程可以追溯到20世纪90年代,当时电子商务刚刚兴起,企业开始意识到通过A…

科技成果跃然“屏”上,虚拟展厅引领科技展示新风尚

一、沉浸式互动体验增强吸引力 虚拟科技展厅利用虚拟现实等先进技术,为科技成果打造了一个沉浸式的展示空间。用户可以通过手机、平板、电脑等设备,身临其境地浏览科技成果,感受其独特魅力。与传统的线下展厅相比,虚拟展厅不受物…