news 2026/4/18 10:21:19

2004-Image thresholding using Tsallis entropy

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2004-Image thresholding using Tsallis entropy

注:博主并非旨在对针对文章中提及论文的实验设计、数据及结果进行逐一还原,而是针对其核心方法论或关键创新点,通过自行设计的实验流程进行验证与探索。若是完整的论文复现,会进行提前说明。

1 论文简介

《Image thresholding using Tsallis entropy》是由 M. Portes de Albuquerque、 I.A. Esquef、 A.R. Gesualdi Mello 和 M. Portes de Albuquerque 于 2004 年发表在期刊《Pattern Recognition Letters》上的一篇论文。该论文针对图像分割中的自动阈值选择这一经典问题,首次将源于非广延统计力学的Tsallis 熵概念应用于图像阈值分割。传统的基于Shannon 熵(即 Boltzmann-Gibbs-Shannon 统计)的阈值方法(如 Kapur 方法)本质上是可加的,适用于像素间相互作用短程、记忆短的系统。然而,许多图像(如具有长程相关性、纹理结构或噪声的影像)包含非加性的信息内容。为此,论文借鉴 Tsallis 熵,通过引入一个实数参数qqq来表征系统的非广延性程度,并基于此构建了一个新的阈值目标函数。

2 算法原理

假设一幅数字图像具有kkk个灰度级,其归一化直方图可视为一个概率分布pi=p1,p2,…,pkp_i = p_1, p_2, \ldots, p_kpi=p1,p2,,pk,其中0≤pi≤10 \leq p_i \leq 10pi1∑i=1kpi=1\sum_{i=1}^k p_i = 1i=1kpi=1

步骤一:定义前景与背景的概率分布

选择一个灰度级ttt作为候选阈值。图像被分为两类:前景(或目标,Class A,灰度级111ttt),背景(Class B,灰度级t+1t+1t+1kkk),这两个类别的概率分布分别为:
pA:p1PA,p2PA,…,ptPA p_A: \frac{p_1}{P^A}, \frac{p_2}{P^A}, \ldots, \frac{p_t}{P^A}pA:PAp1,PAp2,,PApt
pB:pt+1PB,pt+2PB,…,pkPB p_B: \frac{p_{t+1}}{P^B}, \frac{p_{t+2}}{P^B}, \ldots, \frac{p_k}{P^B}pB:PBpt+1,PBpt+2,,PBpk
其中,PA=∑i=1tpiP^A = \sum_{i=1}^{t} p_iPA=i=1tpiPB=∑i=t+1kpiP^B = \sum_{i=t+1}^{k} p_iPB=i=t+1kpi,分别是前景和背景的累积概率。

步骤二:计算前景与背景的 Tsallis 熵

根据 Tsallis 熵的定义:
Sq=1−∑i=1k(pi)qq−1 S_q = \frac{1 - \sum_{i=1}^k (p_i)^q}{q - 1}Sq=q11i=1k(pi)q
分别计算前景和背景分布的熵值:
SqA(t)=1−∑i=1t(piPA)qq−1 S_q^A(t) = \frac{1 - \sum_{i=1}^{t} \left( \frac{p_i}{P^A} \right)^q}{q - 1}SqA(t)=q11i=1t(PApi)q
SqB(t)=1−∑i=t+1k(piPB)qq−1 S_q^B(t) = \frac{1 - \sum_{i=t+1}^{k} \left( \frac{p_i}{P^B} \right)^q}{q - 1}SqB(t)=q11i=t+1k(PBpi)q
这里,qqq是非广延性参数,是一个实数。当q→1q \to 1q1时, Tsallis 熵收敛为 Shannon 熵。

步骤三:构建基于伪可加性规则的总目标函数

对于统计独立的系统 A 和 B, Tsallis 熵遵循伪可加性规则:
Sq(A+B)=Sq(A)+Sq(B)+(1−q)⋅Sq(A)⋅Sq(B) S_q(A + B) = S_q(A) + S_q(B) + (1-q) \cdot S_q(A) \cdot S_q(B)Sq(A+B)=Sq(A)+Sq(B)+(1q)Sq(A)Sq(B)
因此,以阈值ttt分割后,图像的总 Tsallis 熵Sq(t)S_q(t)Sq(t)定义为:
Sq(t)=SqA(t)+SqB(t)+(1−q)⋅SqA(t)⋅SqB(t) S_q(t) = S_q^A(t) + S_q^B(t) + (1-q) \cdot S_q^A(t) \cdot S_q^B(t)Sq(t)=SqA(t)+SqB(t)+(1q)SqA(t)SqB(t)

步骤四:优化阈值

最优阈值toptt_{opt}topt是使上述总 Tsallis 熵Sq(t)S_q(t)Sq(t)最大化的那个灰度级ttt
topt=arg⁡max⁡t[SqA(t)+SqB(t)+(1−q)⋅SqA(t)⋅SqB(t)] t_{opt} = \arg\max_t \left[ S_q^A(t) + S_q^B(t) + (1-q) \cdot S_q^A(t) \cdot S_q^B(t) \right]topt=argtmax[SqA(t)+SqB(t)+(1q)SqA(t)SqB(t)]
算法遍历所有可能的灰度级ttt,计算对应的Sq(t)S_q(t)Sq(t),并找到其最大值对应的ttt,即为最终分割阈值。参数qqq的值需要根据图像特性(如噪声类型、像素间相关性)进行调整,以获得最佳分割效果。

3 实验结果


4 参考文献

[1] De Albuquerque M P, Esquef I A, Mello A R G. Image thresholding using Tsallis entropy[J]. Pattern Recognition Letters, 2004, 25(9): 1059-1065.

5 MATLAB 代码

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 8:15:44

从零开始训练 LLM 需要多长时间?

原文:towardsdatascience.com/how-long-does-it-take-to-train-the-llm-from-scratch-a1adb194c624?sourcecollection_archive---------1-----------------------#2024-10-28 估算训练 X 亿个 LLM、Y 万亿个 tokens 以及 Z 个 GPU 计算所需时间的指南 https://med…

作者头像 李华
网站建设 2026/4/18 8:52:19

打造虚拟客服新体验:Linly-Talker在金融行业的应用

打造虚拟客服新体验:Linly-Talker在金融行业的应用 在银行网点逐渐减少、客户对服务响应速度要求日益提高的今天,金融机构正面临一场深刻的数字化变革。用户不再满足于按键式语音导航或冷冰冰的文字机器人,他们期待的是能“听懂”自己问题、“…

作者头像 李华
网站建设 2026/4/18 8:29:07

Linly-Talker支持GPU显存预分配,避免OOM错误

Linly-Talker支持GPU显存预分配,避免OOM错误 在当前AI驱动的数字人应用快速普及的背景下,从虚拟主播到智能客服,用户对实时性与稳定性的要求越来越高。一个看似流畅的对话系统,背后往往需要同时调度语言模型、语音识别、语音合成和…

作者头像 李华
网站建设 2026/4/10 22:57:38

集成LLM+TTS+ASR,Linly-Talker实现真正实时对话

集成LLMTTSASR,Linly-Talker实现真正实时对话 在虚拟主播直播带货、银行数字柜员在线答疑、AI教师一对一授课的今天,用户早已不再满足于“播放一段预录视频”式的交互体验。他们期待的是——对面这个“人”,能听懂我刚说的话,立刻…

作者头像 李华
网站建设 2026/4/18 8:48:16

设备容器健康检查超时设太短致误杀 后来才知道动态匹配启动延迟

💓 博客主页:塔能物联运维的CSDN主页目录我和物联网运维的相爱相杀史 一、第一次物联网运维的惨烈现场 二、物联网运维的三大魔咒 1. **设备失踪之谜** 2. **流量黑洞事件** 3. **信号怪谈** 三、运维界的“薛定谔”时刻 四、物联网运维的防坑指南 1. *…

作者头像 李华