Huffman coding length

306 阅读 0 评论 202 点赞

我是靠谱客的博主动听音响，这篇文章主要介绍Huffman coding length，现在分享给大家，希望可以做个参考。

数据结构实验之二叉树六：哈夫曼编码
Time Limit: 1000ms Memory limit: 65536K 有疑问？点这里^_^
题目描述
字符的编码方式有多种，除了大家熟悉的ASCII编码，哈夫曼编码(Huffman Coding)也是一种编码方式，它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码，称之为最优编码。哈夫曼编码常被用于数据文件压缩中，其压缩率通常在20%～90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

输入
输入数据有多组，每组数据一行，表示要编码的字符串。
输出
对应字符的ASCII编码长度la，huffman编码长度lh和la/lh的值(保留一位小数)，数据之间以空格间隔。
示例输入
AAAAABCD
THE_CAT_IN_THE_HAT
示例输出
64 13 4.9

144 51 2.8

本题思想与合并果子神似.字母种类------->果子种类, 每种字母的出现的次数------>移动每种果子所花费力气,用Huffman编码字符串的长度----->将所有果子合并在一起的最小力气

所以Huffman编码只是一种思想.

1每次抽取2个最小的合并,删除这两个值,

2并将两个最小值的和加入到原来的集合.

重复1,2直至集合只有一个元素.

# include <stdio.h>
# include <stdlib.h>
# include <string.h>
typedef struct node
{
    int data;
    struct node*next;
} Node;

void Add(Node*head,int key);
int get_huffman_code_length(Node*head,int kind);
int main()
{
    int i;
    int la;//ASCII code length
    int lh;//Huffman code length
    int kind;
    char str[10000];
    int frequency[128];
    Node*head;
    head = (Node*)malloc(sizeof(Node));
    while((scanf("%s",str))!=EOF)
    {
        head->next = NULL;
        kind = 0;//字母种类
        la = strlen(str) * 8;
        memset(frequency,0,sizeof(frequency));
        for(i=0;str[i]!='';i++) //统计每种出现字符的个数
        {
            frequency[ str[i] ]++;
        }
        for(i=0;i<128;i++)
        {
            if(frequency[i])
            {
                Add(head,frequency[i]);
                kind++;
            }
        }
        lh = get_huffman_code_length(head,kind);
        printf("%d %d %.1fn",la,lh,(float)la/lh);
    }
    return 0;
}

void Add(Node*head,int key)
{
    Node*p,*q,*r;
    p = (Node*)malloc(sizeof(Node));
    p->data = key;
    p->next = NULL;
    q = head;
    r = head->next;
    while( r && r->data < key )//从小到大建链表
    {
        q = r;
        r = r->next;
    }
    q->next = p;
    p->next = r;
}

int get_huffman_code_length(Node*head,int kind)
{
    int sumlength = 0;//记录用huffman 编码的字符串长度
    Node*p,*q,*r;
    int i=0;
    int sum;
    for(i=1;i<kind;i++) // kind - 1 次合并
    {
        p = head->next;
        q = p->next;
        sum = p->data + q->data;//两个最小节点值的和
        sumlength = sumlength + sum;
        //删除两个最小节点
        head->next = q->next;
        free(p);
        free(q);
        //将两个最小节点值的和加入链表中
        Add(head,sum);
    }
    //释放头结点之后的节点,此时只有一个
    p = head->next;
    free(p);
    return sumlength;
}