news 2026/6/10 19:52:02

No.44 基于FPGA的8点DCT变换verilog实现,包含testbench

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
No.44 基于FPGA的8点DCT变换verilog实现,包含testbench

No.44 基于FPGA的8点DCT变换verilog实现,包含testbench,并对比matlab的计算结果(QII版),算法程序 DCT (Discrete Cosine Transform) 是一种基于余弦函数的一维或二维离散变换,常用于信号压缩、图像处理等领域。 一维8点DCT(离散余弦变换)是一种常用的信号处理技术,它在图像和音频压缩、数据压缩和加密等领域中广泛应用。 本文将个绍如何使用FPGA实现一维8点DCT变换。 DCT是一种变换,它将一组实值序列转换为一组实值序列。 离散余弦变换 (DCT)是一种将一组实值序列转换为一组实值序列的线性变换,它与傅里叶变换有关 1.软件版本 Quartusii18.0+ModelSim-Altera 6.6d Starter Edition 2.运行方法 使用Quartusi18.0版本打开FPGA工程,然后参考提供的操作录像视频跟着操作。 工程路径必须是英文路径。 具体操作观看提供的程序操作视频跟着操作。 视频播放使用windows media plaver播放。

在数字信号处理领域,DCT变换就像武侠小说里的"易容术",能把看似杂乱的数据转换成另一副面孔。今天咱们来玩点硬核的——用FPGA给数据"整容",实现8点DCT变换。先看效果:输入一组8个整数,FPGA咔咔一顿操作后,输出结果和Matlab计算误差小于0.1%。(实测数据:输入序列[100,90,80,70,60,50,40,30],FPGA输出与Matlab最大偏差0.08%)

核心代码里有个骚操作——定点数处理。Verilog可不认浮点数,咱们用放大招:

parameter FRAC_BITS = 12; //小数位保留12bit wire signed [31:0] coeff [0:7] = { 32'h0D48, 32'h0D48, 32'h0D48, 32'h0D48, 32'h0D48, 32'h0D48, 32'h0D48, 32'h0D48, //cos(pi/16)等系数 ... //其他DCT系数 };

这可不是瞎填的数,每个系数都是Matlab算出来的浮点数乘以2^12再取整。比如cos(π/16)≈0.980785,乘4096得到4014(十六进制0xFAC),但实际工程中要处理符号位和溢出问题。

计算单元有个反常识设计——避免使用循环语句。虽然Verilog有for循环,但FPGA综合后时序难控,我们直接展开:

//矩阵乘法暴力展开 always @(posedge clk) begin temp0 <= in_data[0]*coeff[0] + in_data[1]*coeff[1] + ... ; temp1 <= in_data[0]*coeff[8] + in_data[1]*coeff[9] + ... ; ... //其他7个输出计算 end

这种写法看起来笨,实测比循环结构节省20%逻辑单元。每个乘加操作配三级流水线,用寄存器暂存中间结果,主频能跑到150MHz。

Testbench里有个实用技巧——文件读写验证:

initial begin $readmemh("input_data.hex", input_ram); //读取十六进制测试数据 fp_out = $fopen("fpga_result.txt","w"); //打开结果文件 #2000; for(i=0; i<8; i=i+1) begin $fwrite(fp_out,"%h\n", dct_out[i]); //写入输出结果 end $fclose(fp_out); end

Matlab验证脚本里有个数据转换骚操作:

% FPGA输出转浮点 fpga_result = round(hexdata/(2^12)*1000)/1000; matlab_result = dct(input_data); error_rate = abs(fpga_result - matlab_result)./matlab_result;

这个缩放操作相当于把定点数转回浮点,保留三位小数。实测发现当输入数据范围在0-255时,12位小数位能保证精度足够。

踩坑记录:第一次仿真时输出全是乱码,查了三天发现是符号位处理反了。修正方案是在乘加运算后统一做符号扩展:

wire signed [63:0] mult_result = $signed(input) * $signed(coeff); //必须显式声明有符号乘 reg signed [31:0] sum_temp; //中间结果寄存器带符号位

工程注意事项:

  1. 工程路径千万不能用中文!Quartus会直接罢工(血泪教训:路径含"桌面"二字导致综合失败)
  2. 仿真前检查Coefficient文件路径,建议用绝对路径
  3. 输入数据范围建议控制在±1023,防止定点数溢出

这个设计在Cyclone IV上实测资源占用:

  • 逻辑单元:1203/11480
  • 存储器:256bits/423kbits
  • 功耗:87mW @100MHz

最后留个思考题:为什么DCT结果中第一个系数(DC分量)总是最大的?因为它是所有输入数据的平均值,对应余弦函数的零频率分量。就像班级平均分,最能代表整体水平。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 14:01:19

风光水火储能系统的调频之旅:Simulink仿真建模分析

风光水火储能系统&#xff0c;一次调频二次调频simulink 仿真建模分析在当今电力系统不断追求高效、稳定与可持续的大背景下&#xff0c;风光水火储能多能互补系统成为了研究热点。其中&#xff0c;调频控制是确保系统频率稳定的关键&#xff0c;一次调频和二次调频更是重中之重…

作者头像 李华
网站建设 2026/6/9 23:38:05

5G赋能·4K焕新:超高清直播系统的技术突破与场景革新

当前&#xff0c;直播技术已广泛渗透到各行各业&#xff0c;成为信息传播、场景互动的重要载体。但受限于带宽瓶颈、硬件设备性能等客观要素&#xff0c;4K移动视频直播尚未实现大规模普及。随着5G技术的成熟与商用落地&#xff0c;高带宽、低时延的网络特性为移动全景视频直播…

作者头像 李华
网站建设 2026/6/10 11:42:19

一套与业务同频的HR系统,如何支撑安徽本土生鲜巨头的“角马式”扩张

面对“角马式”快速扩张带来的人力资源管理挑战&#xff0c;生鲜传奇携手稳赢云&#xff0c;通过数字化系统实现了灵活考勤的精准管理、薪酬的日清日结激励以及用工风险的智能防控&#xff0c;将人力资源转变为驱动业务增长的战略引擎&#xff0c;有力支撑了其千店目标的稳步前…

作者头像 李华
网站建设 2026/6/10 11:43:33

Langchain-Chatchat支持OCR识别扫描版PDF:完整覆盖各类文档类型

Langchain-Chatchat支持OCR识别扫描版PDF&#xff1a;完整覆盖各类文档类型 在企业知识管理的实践中&#xff0c;一个常被忽视但极具挑战的问题正日益凸显&#xff1a;如何让那些“看得见却读不懂”的文档真正进入智能系统&#xff1f;比如一份20年前签署的纸质合同扫描件、一…

作者头像 李华
网站建设 2026/6/10 11:35:46

通达信偏差线偏差量、重心

{}重心:(2*CLOSEHIGHLOWOPEN)/5; BBI:(MA(CLOSE,3)MA(CLOSE,6)MA(CLOSE,12)MA(CLOSE,24))/4; 偏差量:重心-BBI; RSV:(偏差量-LLV(偏差量,9))/(HHV(偏差量,9)-LLV(偏差量,9))*100; K:SMA(RSV,3,1),COLORFF2B95,LINETHICK1; D:SMA(K,3,1),COLOR42B1E8,LINETHICK1; 100,POINTDOT,C…

作者头像 李华
网站建设 2026/6/10 11:39:21

设计模式[14]——命令模式一分钟彻底说透

设计模式[14]——命令模式&#xff08;Command&#xff09;一分钟彻底说透&#xff08;C版软件领域真实例子&#xff09; 一句话定义 将“请求”&#xff08;操作&#xff09;封装成一个独立的对象&#xff0c;从而让发送者和执行者完全解耦&#xff0c;支持撤销、重做、队列、…

作者头像 李华