啃书文学网

手机浏览器扫描二维码访问

第441章 香农的信息熵(第1页)

一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“数学大帝(.shg.tw)”!

一张高清电视分辨率的照片,如果没有经过压缩,要占用600万个字节的计算机内存(6MB,1个字节是8个比特)。

可是如果这张照片照的是一面单色的墙的话,它所含的信息量就很小,只要用三个字节就可以描写整张照片(3个字节描写红绿蓝三种颜色的深浅)。

所以单色墙的照片的文件大小,可以从600万个字节压缩到3个字节,大大减少了占用计算机内存的空间和传输照片所需的时间。

但一般一张照片的信息量要比三个字节大很多,那么如何量化照片所含的信息量?照片的压缩最多能有多少倍?

香农是量化信息的第一人。

有趣的是,他量化信息的公式早就出现在了玻尔兹曼的墓碑上。

当然玻尔兹曼得到这个公式,不是为了研究信息,而是为了研究热力学中的混乱度(所以玻尔兹曼的公式和香农的公式差了一个负号)。

热力学的一个中心概念——温度,就是混乱度随着能量的增加而增加的速率。我们的世界真是处处相通。

南加州大学(UniversityofSouthernCalifornia)电子工程系教授巴特·磕死磕(BartKosko)说:“爱因斯坦相对论之革命性在于它颠覆了之前的牛顿力学,而香农信息论之革命性在于它前无古人。”

香农当年创建信息论的时候是为了探讨信息的本质和通信的理论极限问题,比如什么是信息,怎样从数学上定义衡量信息,数据压缩和数据传输可达到的极限在哪里,等等。

但信息论的应用远不止于通信领域。在香农之后,信息论被当作一套通用的数学工具,在很多信息科学领域都有应用。

比如信息论可以用来做统计分析,可以用来开发人工智能,可以用来优化投资策略等。

先从一个貌似不相干的西方曾经流行的游戏“二十个问题”说起。游戏是这样的:俺心里想一样东西,你可以问俺二十个问题,然后猜俺心里想的东西。你的问题必须是“是不是”这种形式的。比如,这个东西是不是可以放进冰箱里?这个东西是不是活的?这个东西是不是能吃?诸如此类。对于你问的每一个问题,俺必须如实地回答“是”或者“不是”。你在二十个问题之内猜到了我想的东西就算赢。

这个游戏的关键是在于如何有效地问你的问题。如果你问“明天是不是下雨”,那你肯定脑子进水了,可以不用往下看了。如果你第一个问题问的是“这东西是不是iPhone6”,这样的问法显然也效率不高,因为俺一旦说“NO”,你只从大量的可能性中排除了一种可能,还是要面对剩下巨大的猜测空间。

这个游戏可以大致等价于这样一个数字游戏。假设M是个大于1的正整数,俺俩在玩游戏之前就商议确定好。俺在1到M之间任意想一个整数,你的任务是用最少的“是不是”形式的问题问出这个数是多少。

对于这个数字版的“二十个问题”游戏,聪明的宝宝都会发现类似这样的结论:M的数值越大,需要的问题越多。但爱钻研的同学可能会想到另一个问题:对于一个给定的问问题策略,所需问题的“多”或“少”又是用什么来衡量的呢?比方说,M=8,而你的问法是依次问如下问题:“这个数是不是1”,“这个数是不是2”,“这个数是不是3”,一直到“这个数是不是7”(如果问完“这个数是不是7”你觉得还需要问“这个数是不是8”的话,那请你去看韩剧吧)。在这种情况下,如果俺想的数字是1,你只需要一个问题就可以知道答案;而如果俺想的数字是8,你必须在问完7个问题之后才能知道答案。换句话说,即使问问题的策略确定,因为俺心里那个神秘数字的不确定性,你所需要的问题数目也是不确定的。因此我们需要把这个数字版“二十个问题”游戏更准确地描述出来,或者说,把在什么意义上“最少”定义出来。

让俺先喘口气,喝口水,扯点概率论,回头再看这个问题。

咱们也别讲究数学的严谨了吧,直接讲这个叫随机变量的东东。

随机变量描述的是一个随机实验可能出现的结果以及每种可能结果的可能性,也就是概率。先看一个例子。

例[老千掷硬币]:假设某老千每次投掷硬币的结果有13可能性出正面,23的可能性出反面。那么掷一次硬币就是一个随机实验,掷硬币的结果就是一个随机变量,我们这里记作大写的X。如果把正面记作1,反面记作0,那么这个随机变量X可以通过一个函数P(x)来描述:函数的变量(小写的)x的取值范围是集合{0,1},这个集合此后记作S;函数在0和1的取值分别为:P(1)=13,P(0)=23。

从这个例子可以看出,一个随机变量X无非是通过在某个集合S上定义的一个函数P(x)来描述的,而这个函数不能取负值,而且必须在对其变量x求和的时候结果为1(在老千掷硬币的例子中即:P(0)+P(1)=1)。这个函数通常被称为随机变量X的概率分布。

当然,同样是掷硬币,可以定义出很多不同的随机变量(即不同的概率分布函数P(x))来。普通人掷硬币对应的随机变量基本就是P(0)=P(1)=12。赌神掷硬币对应的随机变量可能是P(0)=1,P(1)=0。

生活中的随机变量比比皆是。比如,在掷骰子的时候,骰子掷出的结果这个随机变量对应于一个定义在S={1,2,...,6}上的概率分布函数P(x),通常认为P(1)=P(2)=...=P(6)=16。再比如明天会不会下雨(天气预报不准的啦),会有几个人给俺这篇吐血之作点赞或转发(不晓得多少人更喜欢韩剧的啦)这些不确定的事情里都可以定义出随机变量来。记得不知道哪一位伟人曾经说过,“随机变量是到处都有的。对于我们的脑袋,不是缺少随机变量,而是缺少发现。”

在前面说的那个数字版“二十个问题”游戏中,俺心里想的神秘数字对你来说也是一个随机变量,它的概率分布P(x)是定义在S={1,2,...,M}上的函数。如果我选数字是“完全随机的”,那么,这个函数就是P(1)=P(2)=...=P(M)=1M。这种分布通常被称为均匀分布。当然,取决于俺按什么偏好选数字,这个函数也可以取其他形式:如果俺就是喜欢2,也许俺会以更高的概率取2。

假设有个随机变量X,它的取值范围S={1,2,…,M},它的概率分布函数是某个定义在S上的函数P(x)。那么这个随机变量的均值(更文化点的说法叫数学期望值)就是这样一个东东:

1*P(1)+2*P(2)+3*P(3)+…+M*P(M).

在上面老千掷硬币的例子中,随机变量X的均值就是1*(13)+0*(23)=13。简单吧。

很多同学可能都有直觉的认识,能感觉到如果把产生这个随机变量X的随机实验做很多次,把得到的数字取平均,那么这个平均数差不多就是X的均值。这个概念,叫做大数定理,跟俺要讲的熵有着本质的联系,俺这里不敢唐突,稍后会带同学们仔细品味。

很多时候俺们关心的不止一个随机变量,而是很多随机变量。比如,俺们同时关心两个随机变量X和Y,X的取值范围是{1,2},Y的取值范围是{1,2,3}。那么俺们可以把这两个随机变量看作一个随机变量对,写作(X,Y),而把它的取值范围理解为所有可能的(X,Y)取值的组合,也就是{(1,1),(1,2),(1,3),(2,1),(2,2),(2,3)}。把这个集合叫作S,那么这对随机变量就是通过一个定义在S上的概率分布函数P(x,y)来描述的。当这个随机变量对的分布满足P(x,y)=P(x)P(y)的时候,俺们就称这两个随机变量是相互独立的。

P(0,0)=P(0)P(0)=(23)(23)=49

P(0,1)=P(0)P(1)=(23)(13)=29

P(1,0)=P(1)P(0)=(13)(23)=29

贴身侍卫  陆鸣血脉重生  [主咒回]社恐的我无所不能  凤神临世  我的重返2008  商界大佬想追我  荒坟夜啼  女领导的兵王司机  楚扬苏芷洛小说  限时婚约:前夫请签字  女神临世素手倾天  全能金手指  爹地,大佬妈咪掉马了  德赫瑞姆的领主  暮色倾尽好晨光  恐怖复苏:开局激活酆都大帝模板  一品夫人:农家医女  我的火影忍者果然有问题  绝品保镖美总裁  豪门绝宠之峥少溺爱狂妻  

热门小说推荐
重生公主要作妖

重生公主要作妖

前世,她把心全副给予夫君身上,可到头来只是他的一场骗局,害得她身死,甚至是家灭。还好上天给她一个重生的机会,让她重生成了同样悲惨的公主身上。她怒了。这一世,她要替原主和自己好好活,让那些亏欠自己的渣男渣女绿茶婊都见鬼去吧!不过那个傲娇腹黑的战神将军怎么回事?不是和我不对付吗?怎么老是无事献殷勤啊!某将军脸一黑,只是混个眼熟,交流一下感情,顺便做点有意思的事!某公主一声发作滚开!...

夏小汐墨夜霆全文免费阅读

夏小汐墨夜霆全文免费阅读

被亲妹妹算计,抢走家族荣誉还不算,连青梅竹马的未婚夫也被抢走!夏小汐发誓,要报仇!伙同男闺蜜制造复仇计划,咦?结婚证上这是谁?一不留神嫁给男闺蜜的舅舅墨夜霆!墨夜霆是谁?那个富可敌国权势滔天的男人!据说还是个GAY!管他呢,先虐了渣渣再说。可是,虐完渣以后呢?离婚该提上日程了,可他对她却日日宠,夜夜宠,化身宠妻狂魔。十天有八天起不来床的夏小汐,欲哭无泪,不是说他是GAY吗?GAY你大爷!...

玄幻:开局被九位圣女逼婚

玄幻:开局被九位圣女逼婚

穿越到修仙世界,陈平安被天道气运加身,路边随处可见的破石头,在他手中化身灵石,捡到一把菜刀都是绝世神器,一滩泥巴都能炼成仙丹。出门一趟,就被数十位圣女强迫娶她们为妻。被圣女强迫怎么办?在线等,急急急!!!...

大考状元:开局抽取主角光环

大考状元:开局抽取主角光环

书海阁小说网免费提供作者欲买桂花同载酒的经典小说大考状元开局抽取主角光环最新章节全文阅读服务本站更新及时无弹窗广告欢迎光临wwwshgtw观看小说高考前夕,秦枫偶然获得主角光环系统,只要执行系统任务,就能无限抽取不同属性的主角光环。学霸光环逆天智商,预定高考状元!功夫光环骨骼惊奇,练武奇才,精通武学!男友力光环女友面前,永不吃瘪!神医光环银针渡人,医术无双!兵王光环战力爆表,身后十万战士!钞能力光环身价万亿,家里有矿!暴击光环一拳击飞国际杀手,吊打仙尊魔帝!不死光环不死不灭,逍遥长生!无敌光环我无敌,你随意!当秦...

宇宙第一醋神

宇宙第一醋神

混娱乐圈的都知道,萧风瑜是个乐观开朗大咧咧什么都不计较的人主持人在户外访谈问有什么事儿会让你大发雷霆吗?萧风瑜笑的矜持大方怎么会,我入行十年了,还有什么大风大浪是我没见过的?主持人正要夸奖风瑜心胸开阔,见多识广,却见她的笑容逐渐褪去。大家回头一看。只见拍摄区外,前来探班的影后何芸涵正低头跟年轻的美女歌姬说着什么。当镜头再次对准萧风瑜的时候。萧风瑜淡淡的说不好意思,我要大发雷霆了。主持人围观群众本文4月11日开V,请大家支持正版叶子的接档文强撩当苏敏还是小白兔,跟在...

大话秦朝之神级军团系统

大话秦朝之神级军团系统

书海阁小说网免费提供作者肿瘤医生的经典小说大话秦朝之神级军团系统最新章节全文阅读服务本站更新及时无弹窗广告欢迎光临wwwshgtw观看小说主角苏辰为了20万的彩礼,被疯博士坑,带着神级军团系统穿越到了秦末风云变幻的年代。始皇是他堂伯,公子扶苏是他堂哥,他爹是长宁侯,他妈是襄武郡主,而他年纪轻轻就是大将军蒙恬麾下的副将军,他是泱泱大秦根正苗红的小侯爷。开局苏辰就拥有了200年的功力。征召各种顶级兵种,打造秦末天下最强军团,改写公子扶苏的命运,战匈奴,平天下,征伐六国联军,书写大秦新盛世。一代神话,秦王苏辰。...

每日热搜小说推荐