秦宗慈
称球问题是一类饶有趣味的数学问题,历来引起人们的兴趣,讨论也很多。其中12个球的问题是最为经典的。而实际上,12个球的问题早已研究透彻。下面用信息和熵的概念讨论这个问题并给出一种简单易行的分析方法。
为了引入概念,我们先考虑这样一个简单的问题:有10只球,从中任意取1只,要求猜测其颜色,(1)已知10球颜色是5白5黑;(2)已知10球是2白8黑;(3)已知10球是9白1黑;(4)已知10球全是白的。
第一种情况最难猜,因为白黑数量相等,无论猜哪一种颜色都只有50% 的把握。第二种情况好一些,猜是黑色可有80% 的胜算。第三种情况最好猜,任何一个人大约都会猜是白球,这差不多总是对的,因为有90% 的概率。至于第四种情况,没有不确定性。我们说第一种情况球的颜色的不确定性最大。如果获得了足够的信息,可以确定其结果,就消除了不确定性,或者说不确定性是0.称不确定性为熵。因此熵是可以度量的,而且熵的度量与信息的度量是一致的。
设事件A 发生的概率是 P(A),如果此事件已经发生,称获得了I=-log(P(A))=log(1/P(A))的信息量,这里对数可以以任何大于0不等于1的实数为底。为例便于计算,下面取自然对数,即以e 为底。
如果一个试验有若干个不同的结果A1,A2,……,An ,其发生概率分别是 P(Ai),则其平均信息量是 ∑P(Ai)I(Ai)=∑P(Ai)(-ln(Ai))=∑P(Ai)I(Ai)=∑P(Ai)(ln(1/Ai)),称之为熵,记做H(A)。
前面的题目中,熵分别是:
(1)H=0.5×ln2+0.5×ln2=ln2=0.69315
(2)H=0.2×ln5+0.8×ln1.25=0.50040
(3)H=0.9×ln1.11111+0.1×ln10=0.32508
(4)H=1×ln12=0
这如果所获得有用信息的信息量小于熵的数量,问题就不可能得到解决。如果所获得的信息量不小于熵,则问题有可能得到解决。
下面简单分析两个称球问题。
问题1 有12只球,编号1——12,它们外形相同,除其中1只略轻(称作坏球)外,其余重量相等。要求用一架天平称量3次,找出这只坏球。
一开始,12个球都有相等的可能,故熵 h0=12×(ln12)12=ln12=2.48491。
如果有个数相等的三组球,其中仅有1只稍轻,用天平称一次,可以由三组确定哪一组含有轻球,故称一次得到的信息是I=ln3 。三次得到的信息量是 3×ln3=ln27>ln12 。故问题有可能解决。实际上这个问题是能够解决的,具体解法较多,例如下面表示的解法。
|
第一次称量 |
第二次称量 |
第三次称量 |
结论 : 坏球为 |
|
1,2,3,4<5,6,7,8 |
1,2<3,4 |
1<2 |
1 |
|
1>2 |
2 |
|
1,2>3,4 |
3<4 |
3 |
|
3>4 |
4 |
|
1,2,3,4>5,6,7,8 |
5,6<7,8 |
5<6 |
5 |
|
|
5>6 |
6 |
|
5,6>7,8 |
7<8 |
7 |
|
|
7>8 |
8 |
|
1,2,3,4=5,6,7,8 |
9,10<11,12 |
9<10 |
9 |
|
|
9>10 |
10 |
|
9,10>11,12 |
11<12 |
11 |
|
|
11>12 |
12 |
我们不难发现,如果球的个数达到27,也可以类似解决。