…不是所有可计数的事物都重要,也不是所有重要的事物都能被计数 — 威廉·布鲁斯·卡梅隆(摘自《非正式社会学:社会学思维的随意导论》,1963年)
盒计数(Box-counting)是我们用来估计对象、图像或集合的分形维数的一种经验技术。它基于一个简单的想法——用越来越小的盒子覆盖对象,然后计算每个相应规模下覆盖对象所需的盒子数量。以这种方式获得的测量被称为“盒计数维数”或“闵可夫斯基维数”。
如果一个对象本质上是分形的,意味着它在不同的尺度下具有相似的结构或模式。在使用盒计数方法时,这种分形特性表现为测量盒的大小(即每个盒子的尺寸)与需要覆盖整个对象的盒子数量之间存在一种特定的数学关系——幂律关系。
幂律关系是指一个量(在这里是被占据盒子的数量)与另一个量(测量盒的大小)之间的关系可以通过一个幂函数来描述。具体地,如果我们将测量盒的大小记为s,需要的盒子数量记为N,那么幂律关系可以表示为
在讨论我们如何将大小和计数之间的关系转换为单一的维数测量之前,看一看使用熟悉对象的具体例子可能会有所帮助。
盒计数的过程包括用逐渐变小的盒子覆盖图像,并记录每个规模下被占据的盒子数量。为了发展我们对维数测量究竟意味着什么的直觉,我们将从对“线”进行盒计数开始。
上图显示了用边长分别为1,1/2,1/4和1/8的盒子覆盖蓝线的过程。下面是结果计数,其中N(s)代表边长为s的盒子的计数:
当我们将这个过程应用到众所周知的分形之一——谢尔宾斯基垫片(Sierpinski gasket)时,情况就变得有趣了。
谢尔宾斯基垫片(也称为谢尔宾斯基三角形或谢尔宾斯基筛)可以通过许多不同的方式构造。以波兰数学家瓦茨瓦夫·谢尔宾斯基命名,它通常被定义为迭代函数系统的极限形状或吸引子。上图展示了该形状的自相似结构。
每次测量盒的边长减半,计数就增加3倍。显然,这不符合一维或二维对象的规则。让我们看看我们是如何理解这一点的。
上述每个案例中的关系都是由幂律特征化的——一个量按比例变化至另一个量的幂(即,指数)。在这些简单的情况下,可以直接得出指数。对于计数N,边长s,和维数d,我们观察到通常情况下:
给出了一个分析表达式,用于在已知缩放关系的情况下计算对象的维数。事实上,我们得到的称为相似维数(similarity dimension)——每当有一个由N个不重叠的自身副本组成的自相似形状,每个副本都按收缩因子s缩放时,就可以计算相似维数。
对于谢尔宾斯基垫片,它的维数d = Log(3)/Log(2) ≈ 1.58496。直观上,这是有意义的,因为它占据的空间比线维)少。
当缩放属性未知时,我们可以通过制作盒子大小与各自计数的对数-对数图来检查是否存在幂律。如果确实存在幂律,会发现点落在代表最佳拟合线或回归线的直线上。数据与回归线之间的“拟合度”通常使用R平方值(R²)来测量,范围从0到1(1表示完美拟合)。一般来说,对于什么是“好”的R²值没有绝对的阈值——这在很大程度上取决于研究领域、正在进行的特定分析以及数据的性质。
假设尺寸与计数的绘制点接近回归线,那么该线的斜率的绝对值可以解释为我们正在测量的对象的维数d。这是因为,正如我们在推导方程1时所看到的,对幂律关系取对数会将其转换成线性方程:
盒计数的典型例子来源于贝努瓦·曼德布洛特在1967年发表的开创性论文《英国海岸线有多长?统计自相似性与分数维度》。
在他的研究过程中,曼德布洛特偶然发现了一篇由刘易斯·弗莱·理查森(1881–1953),一位致力于研究战争原因的和平主义者所写的论文。理查森认为地理因素肯定是一个因素,他注意到西班牙与葡萄牙之间的边界线公里,但按葡萄牙的说法是1214公里——差异23%!虽然一个较小的国家可能有理由夸大其相对于较大邻国的大小,但这种差异并不罕见。
理查森意识到的是,随着他的测量尺度的减小,边界长度增加。这是有道理的,因为较小的尺子可以测量较小的特征;大尺子遗漏的入口和浅湾,在使用小尺子时会被计算在内。这是一个在许多尺度上发生的现象。这种属性与我们熟悉的欧几里得对象不同,后者的测量结果不论测量尺度大小如何都保持不变。
尽管曼德布洛特在他的论文中没有直接使用盒计数,但他确实基于理查森在1961年死后发表的基于长度的测量数据得出了他的结果。曼德布洛特的一个重大洞见是,观察到的缩放现象可以用维度的概念来描述,并且这样的测量对于了解形状的相对“粗糙度”有重要意义。
使用理查森的工作,曼德布洛特估计了大不列颠西海岸的维数为d ≈ 1.25。上图显示了将盒计数过程应用于大不列颠时的样子。
下图显示了我基于Wolfram Research数据仓库的地图数据为整个国家的海岸线生成的对数-对数图。
它给出了一个盒计数维数d ≈ 1.2458。这个结果与曼德布洛特对西海岸单独估计的结果明显一致。注意,在上图中,一些点略微高于或低于回归线。当测量自然现象时,这是可以预期的,因为它们倾向于大致自相似,而不是严格自相似。(事实上,这个拟合的效果非常好,R² ≈0.9991)
相比之下,南非的海岸线相对平滑,其维数d ≈ 1.05,而挪威由于其众多峡湾和海湾,其维数为超级曲折的d ≈ 1.52。下图显示了它们各自海岸线的一部分的卫星视图。
在自然界中,这项技术被用来探索河流网络、根系、培养皿菌落、地质构造、生物结构、植被模式、土壤结构、大气现象和天文结构等。
在工业界,这项技术被用于材料科学,分析材料的微观结构。评估它们的结构复杂性有助于理解它们的机械和物理性质。它也被用于工业质量控制和检查。对于粗糙度、孔隙度或材料中的不规则性的结果表征,对于半导体生产和表面涂层等制造过程至关重要。
科赫曲线以瑞典数学家尼尔斯·法比安·赫尔格·冯·科赫命名,他在发明这种形状时,曾研究连续的、不可微的曲线。这条曲线年的论文时对他的思考产生了影。
Copyright © 2022 杏彩体育官网入口网址·(中国)手机客户端登录 版权所有 苏ICP备2021054995号-3杏彩体育手机客户端登录