一种整数数据压缩存储的算法实现

112 阅读 0 评论 74 点赞

我是靠谱客的博主高贵水壶，这篇文章主要介绍一种整数数据压缩存储的算法实现，现在分享给大家，希望可以做个参考。

对于32位的机器，INT整形占四个字节，这意味着如果我们要保存一个INT类型数据需要占用4个字节空间，但实际的情况是4个字节的空间中并非所有的空间都保存了有效的数据位，比如整数1，在内存中以0x00000001表示，实际只有最低位表示了实际数据，通过实现一个整形的压缩算法可以有效的减少存储空间的使用。

1：在一个字节数据中只保存7bit有效数据，第8位作为一个INT数据是否表示完成的指示位（1表示未完成，0表示已经完成）。

2：通过判断字节的最高BIT位是否为0来获取一个INT型数据，这样我们可以通过1-5个字节数据来表示一个INT型。

3：数据转换通过去除每个字节的指示位，其它bit数据拼接构成INT数据。

一个例子：0x81 存在8个有效的数据位，由于算法中1个字节表示7BIT数据，我们只需要2个字节来表示该数据，转换后的数据表示为：1000 0001 0000 0001，第一个字节最高位为1，第二个字节最高位为0，表明存在2个字节表示该INT型，去除数据指示位，获取到数据000 0001 000 0001，转换为0X81.

复制代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
typedef struct TRANS_S TRANS_T;
struct TRANS_S
{
    int len;
    unsigned char buff[0];
};

int getTransLen(unsigned int value)
{
    if(0 <= value && value<= 0x7F)
    {
        return 1;
    }
    if(0x80 <= value && value <= 0x3FFF)
    {
        return 2;
    }
    if(0x4000 <= value && value <= 0x1FFFFF)
    {
        return 3;
    }
    if(0x200000 <= value && value<= 0x0FFFFFFF)
    {
        return 4;
    }
    return 5;
}

void intTrans(unsigned int value, TRANS_T** ppBuff)
{
    int len = -1;
    int temp = 0;
    TRANS_T* pBuff = NULL;
    
    len = getTransLen(value);
    pBuff = (TRANS_T*)malloc(sizeof(TRANS_T) + len);
    pBuff->len = len;
    temp = value;

    for (int i=0;i<len;i++)
    {
        pBuff->buff[i] = temp&0x7F;
        pBuff->buff[i] |= 0x80;
        temp >>= 7;
    }

    pBuff->buff[0] &= 0x7F;

    *ppBuff = pBuff;

    return;
}