QR码(Quick Response Code) 是二维码的一种,在正方形二位矩阵内通过黑白标识编码二进制位从而编码数据,最早发明用于日本汽车制造业追踪零部件。QR码现有40个标准版本,4个微型版本。QR码的数据编码方式有四种:
- 数字(Numeric):0-9
- 大写字母和数字(alphanumeric):0-9,A-Z,空格,$,%,*,+,-,.,/,:
- 二进制/字节:通过 ISO/IEC 8859-1 标准编码
- 日本汉字/假名:通过 Shift JISJIS X 0208 标准编码
QR码还有四种容错级别可以选择:
- L(Low):7%的字码可被修正
- M(Medium):15%的字码可被修正
- Q(Quartile):25%的字码可被修正
- H(High):30%的字码可被修正
参考:Hello World! - 知乎 (zhihu.com)
上图展示的是二维码的基本结构。
二维码基本上分为两个部分。其中function patterns主要是包含定位信息,而encoding region才主要包含数据信息(包括纠错码以及数据信息)。
Function Patterns
定位信息里面好像不包含容错码???
QUIET ZONE
这是一个空白区域。标准中规定QR码(Ver1-40)四周应有宽4个单位、微型QR码四周应该有宽2个单位的区域颜色等效与QR码中白色点,其中不能有图样或者任何标记,以保证QR码清晰可识别。
FINDER PARTTERN
定位标识其实是“回”字形,位于二维码的左上、左下、右上角(只有三个)。用于协助扫面软件定位QR码并变换坐标系。定位标识可以让QR码在任意角度被扫描,这是一维条形码做不到的。(如果二维码是其他形状的话,那还需要这么多的定位符码??这些定位符的存在导致二维码编码信息利用率很低,图案看起来也很复杂。需要认真想想这个定位以及变换坐标系是怎么实现的)。
SEPARATOR
分隔符是一单位宽的白色点带,位于每个定位标识和编码区域之间用于区分二者。
TIMING PATTERN
定时标识是一单位宽的黑白交替点带,有黑色起始和结束。用于指示密度和确定坐标系。
ALIGNMENT PATTERN
校正标识只存在于Version2及以上的QR码。校正标识用于进一步校正坐标系。校正标识的数量取决于版本。
Encoding pattern
FORMAT INFORMATION
格式信息里面存储容错级别和数据掩码,还包含额外的自身BCH容错码。
VERSION INFORMATION
版本信息里面存储版本信息
DATA AND ERROR CORRECTION CODEWORDS
数据及容错字码里面存储编码方式,实际编码数量和数据的RS容错码。
上图展示的就是Version 1的二维码的图像。
将数据变成QR码的流程:
1.数据分析(data analysis):分析输入数据,根据数据决定要使用的QR版本。容错级别和编码模式。低版本的QR码无法编码过长的数据,含有非数字字母字符的数据要使用扩展字符编码模式。
2.编码数据(data encoding):根据选择的编码模式,将输入的字符串转换成比特流,插入模式标识码(mode indicator)和终止标识符(terminator),把比特流切分成8比特字节,加入填充字节来满足标准的数据字码数的要求(数据编码这块的规则需要细看)。
3.计算容错码(error correction coding):对步骤二产生的比特流计算容错码,附在比特流之后。高版本的编码方式可能需要将数据流分成块(block)再分别进行容错码计算。
4.组织数据(structure final message): 根据结构图把步骤三得到的有容错的数据流切分。准备填充。
5.填充(module placement in matrix):把数据和功能性图样根据标准填充到矩阵中。
6.应用数据掩码(data masking):应用标准中的八个数据掩码来变换编码区域的数据,选择最优的掩码应用。
7.填充格式和版本信息(format and version information):计算格式和版本信息填入矩阵,完成QR码。
QR支持一下编码:
Numeric mode (数字编码):从0到9。如果需要编码的数字的个数不是3的倍数,那么,最后剩下的1位或2位会被转成4或7bits,则其他的每3位数字会被变成10,12,14bits,编成多长还要看二维码的尺寸。(如下标table3所示)(为什么按照这种格式来,变成几Bits跟什么有关)。
Alphanumeric mode(字符编码):包括0-9,大写的A到z(没有小写),以及符号$ % * + - . / :包括空格。这些字符会映射成一个字符索引表。如下所示:(其中的SP是空格,然后char是字符,Value 是其索引值)编码过程就是把字符两两分组,然后转成下表的45进制,然后转成11bits的二进制。如果最后有一个落单的,那就转成6bits。而编码模式和字符的个数需要根据不同的Version尺寸编成9,11,13个二进制(如下表所示)
Byte mode(字节编码):可以是0-255的ISO-8859-1字符。有些二维码的扫描器可以自动检测是否是UTF-8的编码。
Kanji mode(日文编码):这是日文编码,也是双字节编码。同样也可以用于中文编码。日文编码和汉字编码会减去一个值。如:在0X8140 to 0X9FFC中的字符会减去8140,在0XE040到0XEBBF中的字符要减去0XC140,然后把结果前两个16进制位拿出来乘以0XC0,然后再加上后两个16进制位,最后转成13bit的编码。如下图示例:
下面两张表中,
- Table 2 是各个编码格式的“编号”,这个东西要写在Format Information(格式信息)中。注:中文是1101
- Table 3 表示了,不同版本(尺寸)的二维码,对于,数字,字符,字节和Kanji模式下,对于单个编码的2进制的位数。(在二维码的规格说明书中,有各种各样的编码规范表,后面还会提到)
下面介绍编码实例:
示例一:数字编码
在Version1的尺寸下,纠错码级别为H,编码:0
1.把上述数字分为三组:012 345 67
2.把他们转成二进制:012转成0000001100(10位bits码);345转成0; 67 转成(7位bits)
3.把这三个二进制码串起来:0000001100 0
4.把数字的个数转成二进制(version-1-H是10bits):8个数字的二进制是0000001000
5.把数字编码标志(格式信息)0001和第四步的编码加到前面:0001 0000001000 000000001
实例二:字符编码
在version 1的尺寸下,纠错码级别为H,编码AC-42
1.从字符表中找到AC-42这五个字条的索引(10,12,41,4,2)
2.两两分组:(10,12)(41,4)(2)
3.把每一组转成11bits的二进制(这一步不太明白):
(10,12) 10*45+12=462转成00(11位bits)
(41,4) 41*45+4=1849 转成
(2)等于2 转成000010(落单的转成6bits)
4. 把这些二进制连接起来:00
5. 把字符的个数转成二进制(version1-H位9bits):5个字符, 5转成000000101
6. 在头上加上编码标识符(格式信息)0010和第五步的个数编码:0010 000000101 00 000010
结束符和补齐符
假如我们有个HELLO WORLD 的字符串要编码。根据上面示例二,我们可以这样进行:
按8 bits重排
如果所有的编码加起来不是8的倍数我们还要在后面加上足够的0,比如上面一共有78个bits,所以我们还要加上2个0,然后按8bits分好组:
00 0 00001011 0 0 0 0 01000000
补齐码
最后,如果还没有达到我们最大的bits数的限制,我们还要加一些补齐码(Padding Bytes),补齐码就是重复一下两个bytes: 00010001(这两个bytes都是8位bits的,这两个二进制码转成十进制是236 和 17 原因???)关于每个Version的每一种纠错级别的最大bits限制,可以参看QR Code Spec的第28页到32页的Table-7一表。
假设我们需要编码的是Version 1的Q纠错级,那么,其最大需要104个bits,而我们上面只有80个bits,所以,还需要补24个bits,也就是需要3个Padding Bytes,我们就添加三个,于是得到下面的编码:
00 0 00001011 0 0 0 0 0 00010001
上面的编码就是数据码了,叫做Data Codewords,每个8bits 叫做codeword,我们 还要对这些数据加上纠错码信息。
纠错码
有了纠错机制,才使得二维码有了残缺也可以扫码解析出来,才使得二维码中心位置可以供某些商家加上对解析不必要的图标。
二维码一共有四种纠错级别:
二维码对数据加上纠错码的过程,首先要对数据码进行分组,即分成不同的块(block)。参考下表所展示的分组要求:
对于表中最后两列的内容:
表中最下面关于(c,k,r)的解释:
注:
c,k,r的关系公式:
纠错码容量小于纠错码个数的一半
以上图4.1中的version 5+H纠错机制为例:图中 红色方框说明共需要4个块(上下行各一组,每组2个块)。
第一组的属性:
具体示例如下表所示,且由于使用二进制会使得表格过大,故转为范围在 0~255 的十进制。其中组 1 的每个块,都有 11 个数据码, 22 个纠错码;组 2 的每个块,都有 12 个数据码,22 个纠错码。
1
2
67 85 70 134 87 38 85 194 119 50 6
66 7 118 134 242 7 38 86 22 198 199
199 11 45 115 247 241 223 229 248 154 117 236 38 6 50 17 7 236 213 87 148 235
177 212 76 133 75 242 238 76 195 230 189 106 248 134 76 40 154 27 195 255 117 129
11
2
247 119 50 7 118 134 87 38 82 6 134 151
194 6 151 50 16 236 17 236 17 236 17 236
96 60 202 182 124 157 200 134 27 129 209 182 70 85 246 230 247 70 66 247 118 134
173 24 147 59 33 106 40 255 172 82 2 157 242 33 229 200 238 106 248 134 76 40
二维码的纠错码主要是通过里德-所罗门纠错算法(Reed-Solomon Error Correction)实现的
此时得到了数据,但还不能开始画图,因为二维码还需要将数据与纠错码的各个字节交替放置。
继续以上一章给出的实例为例,给出其穿插放置的过程。
上一章实例中的数据码如下表所示:
提取每一列数据:
- 第一列:67, 66, 247, 194;
- 第二列:85, 7, 119, 6;
- ……
- 第十一列:6, 199, 134, 17;
- 第十二列:151, 236
将上述十二列的数据拼在一起:67, 66, 247, 194, 85, 7, 119, 6,…, 6, 199, 134, 17, 151, 236。
纠错码如下表所示:
同样的方法,将 22 列数据放在一起:199, 177, 96, 173, 11, 212, 60, 24, …, 148, 117, 118, 76, 235, 129, 134, 40。
上述部分即为二维码的数据区(数据码和纠错码)
对于某些 Version 的二维码,得到上面的数据区结果长度依旧不足,需要加上最后的剩余位。比如对于 Version 5 + H 纠错等级的二维码,剩余位需要加 7bits,即加 7 个 0。参看 QR Code Spec 的 Table-1 一表即可查询不同 Version 的剩余位信息,如下图 5.1 所示
首先在二维码的三个角上绘制定位图案。定位图案与尺寸大小无关,一定是一个 7×7 的矩阵。如下图 6.1 所示:
对齐图案需要绘制。对齐图案与尺寸无关,一定是一个5*5的矩阵。如下所示:
对齐图案绘制的位置,可参看 QR Code Spec 的 Table-E.1 一表查询,部分内容如下图 6.3 所示:
(版本2及以上才会需要对齐图案)
下图是上述表格中version 8的一个例子,对于vershion8的二维码,行列值在6,24,42的几个点都会有对齐图案。
时许图案是两条连接三个定位图案的线,如下图所示:
支付宝的付款码如下:
格式信息如下所示:
格式信息在定位图案周围分布,由于定位图案个数固定位3个,且大小固定,故格式信息也是一个固定15bits的信息,每个bit的位置如下所示:(注:图中的dark module 固定永远出现)
15比特数中数据。按照5bits 的数据位+10bits纠错位的顺序排列:
数据位占5bits:其中2bits用于表示使用的纠错等级(error correction level),3bits用于表示使用的蒙版(mask)类别;
纠错位占10bits:主要通过BCH code计算。
为了减少扫描后图像识别的困难,最后还需要将 15bits 与 0010 做异或 XOR 操作。因为我们在原格式信息中可能存在太多的 0 值(如纠错级别为 00,蒙版 Mask 为 000),使得格式信息全部为白色,这将增加分析图像的困难。
纠错等级的编码如下所示:
格式信息的实例如下:
假设存在纠错等级为 M(对应 00),蒙版图案对应 000,5bits 的数据位为 00101,10bits 的纠错位为 00:
则生成了在异或操作之前的 bits 序列为:0000
与 0010 做异或 XOR 操作,即得到最终格式信息:1110
对于 Version 7 及其以上的二维码,需要加入版本信息
版本信息依附在定位图案周围,故大小固定为 18bits。水平竖直方向的填充方式如下图 6.12 所示:
18bits 的版本信息中,前 6bits 为版本号 (Version Number),后 12bits 为纠错码 (BCH Bits)。示例如下:
假设存在一个 Version 为 7 的二维码(对应 6bits 版本号为 000111),其纠错码为 0;
则版本信息图案中的应填充的数据为:0000100
(但凡是填充的数据,都包含纠错码)
然后就可以进行数据填充了。 填充的思想如下version3二维码所示,从二维码右下角开始,沿着红线进行填充,遇到非数据区域,则绕开或跳过。
然而这样难以理解,我们可以将其分为许多小模块,然后将许多小模块串连在一起,如下图 6.14 所示(截取自 QR Code Spec 的图 15):
小模块可以分为常规模块和非常规模块,每个模块的容量都为8.常规情况下,小模块都为宽度为2的竖直小矩阵,按照方向将8bits的码字填充在内。非常规情况下,模块会产生变形。
填充方式如上所示,图中深色区域(如 D1区域)填充数据码,白色区域(如E15区域)填充纠错码。遍历顺序依旧是从最右下角的D1区域开始,按照蛇形的方向D1→D2→…→D28→E1→E2→…→E16→剩余码)进行小模块的填充,并从右向左交替着上下移动。下面给出若干填充原则:
原则1:无论数据的填充方向是向上还是向下,常规模块(即8bits数据全在两列内)的排列顺序应该是从右向左(这个填充方向有问题吧,该是从左到右吧),如下所示:
原则2:每个码字的最高有效位(即第7个bits)应置于第一个可用位。对于向上填充的方向,最高有效位应该占据模块的右下角;向下填充的方向,最高有效位应该占据模块的右上方(排列方向就应该是从右往左啊)。
注:对于默写模块(如下图所示),如果前一个模块的右边模块的列内部结束,则该模块成为不规则模块,且与常规模块相比,原本填充方向向上时,最高位应该在右下角。此时变成左下角。
原则3:当一个模块的两列同时遇到对齐图案或时序图案的水平边界时,它将继续在图案的上方或者下方延续。
原则 4:当模块到达区域的上下边界(包括二维码的上下边界、格式信息、版本信息或分隔符)时,码字中任何剩余 bits 将填充在左边的下一列中,且填充方向反转;如下图中的两个模块遇到了二维码的上边界,则方向发生变化;
原则 5:当模块的右一列遇到对齐图案,或遇到被版本信息占据的区域时,数据位会沿着对齐图案或版本信息旁边的一列继续填充,并形成一个不规则模块。如果当前模块填充结束之前,下一个的两列都可用,则下一个码字的最高有效位应该放在单列中。
按照上述思路即可将二维码填充完毕。但是那些点并不均衡,如果出现了大面积的空白或黑块,扫描识别会十分困难,所以按照在前文 6.4 中格式信息的处理思路,对整个图像与蒙版进行蒙版操作(Masking),蒙版操作即为异或 XOR 操作。
二维码又 8 种蒙版可以使用,如下图 6.18 所示,公式也在图中说明。蒙版只会和数据区进行异或操作,不会影响与格式信息相关的功能区。
注:选择一个合适的蒙版也是有一定算法的.
蒙版图案如下图所示。
对应的产生公式与蒙版 ID 如下面的表格所示:
蒙版操作的过程与对比图如下图所示,图中最上层是没有经过蒙版操作的原始二维码,其中存在大量黑色区域,难以后续的分析识别。经过两种不同蒙版的处理,可以看到最后生成的二维码变的更加混乱,容易识别 。
蒙版操作之后,得到的二维码即为最终我们平常看到的结果。
到此这篇uchar code是什么意思(uc代码是什么意思)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/rfx/14299.html