- 罗雨婷;杨维明;武书博;徐泽;潘能源;
针对合成孔径雷达图像舰船目标检测算法在精度、计算效率和模型复杂度之间难以兼顾等问题,提出一种基于改进YOLOv8的SAR图像舰船目标检测算法。首先,在Head部分增加一个P2检测头,提高对小尺度目标的检测能力;其次,在C2f模块中引入增强的多尺度通道感知结构,以增强特征表达能力并优化多尺度目标检测效果;同时,在检测头前增加卷积注意力模块,提升模型对关键特征的关注度;此外,采用Ghost轻量化卷积以减少计算量,提高模型推理速度。在HRSID上的实验结果显示:相较于原始YOLOv8,改进后的算法在SAR图像舰船目标检测平均精度均值(mAP)上提升了2.8%、召回率(R)提升了4.2%,检测速度(FPS)提高了27.1 f/s、计算量GFLOPs降低了25.17%。与RCSA-YOLO相比,虽然计算量略微增加,但文中算法的mAP值高出4.7%,准确率也高于RCSA-YOLO;与其他算法相比,文中算法在保证较高检测精度的情况下大幅降低了模型参数量和计算量,提高了检测效率。实验结果表明,改进后的YOLOv8算法较好地兼顾了检测精度、检测效率和模型复杂度,对复杂背景下的SAR小尺度舰船检测具有较高的实用价值,可为海上监视与港口安防等实时应用提供支持。
2026年03期 v.49;No.698 1-7页 [查看摘要][在线阅读][下载 2668K] [下载次数:140 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 赵健;
为保留工业产品图像重要细节,提升整体视觉效果,推动工业产品质量管理智能化水平,文中提出AIGC视域下工业产品图像多尺度细节增强方法。构建AIGC视域下工业产品图像多尺度细节增强模型,依据Retinex理论多尺度分解原始工业产品图像,分为细节层和基础层。通过计算机视觉对多尺度工业产品图像分别进行图像畸变校正、色彩校正,将处理后的工业产品图像输入至生成对抗网络中,依据生成网络与判别网络对抗训练,最终实现工业产品图像多尺度细节增强。通过实验验证,该方法进行畸变图像校正具有高度稳定性,能够适应不同光强环境,最终实现多尺度细节增强结构相似性始终高于95%,能够保留图像原有重要结构特征,凸显工业产品细节信息,有助于工业产品质量管理。
2026年03期 v.49;No.698 8-12页 [查看摘要][在线阅读][下载 1579K] [下载次数:41 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 王翊;李志辉;许耀华;
鱼眼镜头因其超宽视野被广泛应用在安防、探测等领域,但鱼眼镜头因其短焦距设计而引发径向畸变,严重影响了鱼眼镜头的实际应用价值。为此,文中提出一种基于抛物面模型的参数修正鱼眼图像校正算法,有效改善了鱼眼图像的校正质量。首先,通过改进的逐行逐列扫描法进行有效区域提取,有效减少了扫描时间;其次,通过可参数修正的抛物面模型对鱼眼图像进行初次校正,根据校正效果修正模型参数,再次进行校正;最后,通过双线性插值算法对校正图像进行插值。仿真结果表明,通过与光心转移的透视投影算法和重定位的经度校正算法进行对比,在室外建筑、室内建筑以及风景等方面,文中算法校正效果更好,校正图像保留的有效信息更多,在安防、探测等领域具有实际应用价值。
2026年03期 v.49;No.698 13-18页 [查看摘要][在线阅读][下载 1843K] [下载次数:8 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 陈昊飞;狄长安;
为同时捕捉不同尺度的特征,精准区分前景手势和背景干扰,文中提出基于多尺度卷积神经网络的连续手语精准识别方法,旨在解决手势多样性带来的识别难题。利用主导手轨迹信息的手语语句分割算法,检测连续手语视频中的过渡动作,分割连续手语视频,得到多个复合视频段;多尺度卷积神经网络通过大小不同的卷积核,同时捕捉每个复合视频段不同尺度的特征,精准区分前景手势和背景干扰;利用多尺度空洞卷积池化金字塔模块融合各复合视频段的多尺度特征,充分利用手语动作的多尺度信息,增强网络对手势多样性的处理能力;采用Softmax分类器处理融合多尺度特征,得到各复合视频段的手语精准识别结果;按照时间先后顺序串联识别结果,得到最终的识别结果。实验结果证明,所提方法可精准识别连续手语,且在不同背景干扰情况下的连续手语识别的决定系数与1较为接近,即连续手语识别精度较高,可以有效解决连续手语识别中的难点。
2026年03期 v.49;No.698 19-22页 [查看摘要][在线阅读][下载 1550K] [下载次数:49 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 陈雨扬;龚津南;汪俊辉;
针对工业环境中工件表面附着尘屑,导致尺寸测量精度下降的问题,提出一种基于分割掩码的背光源工业图像去毛刺方法。为了提升图像细节信息的捕捉与整体结构的还原能力,避免传统形态学方法导致的过度平滑现象,文中首先设计了全局-局部特征提取模块(GLFEM)作为特征融合模块(FFM)的核心;其次,为了降低模型计算复杂度,增强特征表达能力,采用选择注意力部分卷积(SAPC)和综合统计注意力(ISA)机制对关键特征信息进行捕捉;最后,引入了Mask掩码自适应增强模块与改进损失函数,进一步提高了轮廓边缘毛刺的去除效果。实验结果表明,在针对螺纹的5个测量指标中,大径、中径、小径、螺距和螺纹角的平均误差分别为0.000 26 mm、0.004 92 mm、0.005 96 mm、0.000 11 mm和0.073°,与现有深度学习方法相比,所提方法在尺寸测量准确性方面具有显著优势。此外,所提方法不仅解决了精确尺寸测量问题,而且在保持测量精度的同时,其参数量和计算量与现有模型相当,实现了实时性和准确度的平衡,适合在资源受限的工业场景中部署。
2026年03期 v.49;No.698 23-30页 [查看摘要][在线阅读][下载 2052K] [下载次数:14 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 翁瀚尧;田慧会;
常规小波阈值算法在小波变换时阈值位置存在不平滑和不连续等问题,导致处理含噪图像细节丢失和增强效果不佳。为此,文中基于softsign(x)函数重构了一种自适应小波阈值函数,该函数可以有效缓解梯度消失问题,同时引入收缩因子并根据小波分解层数自适应调整,以准确区分有用信息和噪声,提升图像增强效果。通过仿真实验,对比了常规阈值函数和其他改进阈值函数,结果表明,所提的自适应小波阈值函数在去噪和增强图像细节方面效果显著,可以有效增强含噪图像的边缘和纹理信息,优于其他方法。
2026年03期 v.49;No.698 31-35页 [查看摘要][在线阅读][下载 4381K] [下载次数:31 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]
- 余航;蒙佳健;余绍德;孙秋瑞;
微调大语言模型中的语义不一致问题常常导致文本摘要的质量不尽如人意,针对该问题,文中提出一种调和对比学习和交叉熵的目标函数,旨在增强语义表征的准确性。同时,设计了一种多样性对比搜索解码方法,通过选择令牌重复率最低的生成文本来提升文本摘要的语义一致性。基于大语言模型GPT-2,利用30 000对脱敏的影像描述和诊断报告样本进行训练。通过词匹配、语义相关性、内容相似度和令牌重复率等指标进行评估,结果表明,文中提出的框架提升了文本摘要的准确性(BLEU为0.49、METEOR为0.26、ROUGE-L为0.52、CIDEr为1.43)和语义一致性(mTRR为0.12)。通过使用先进的语言模型和微调策略,借助多模态数据学习,语义不一致问题得到更好的控制。
2026年03期 v.49;No.698 145-150页 [查看摘要][在线阅读][下载 1418K] [下载次数:6 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 尹文博;潘钰红;吕雪菲;赵志明;刘挺;
针对常规归一化最小均方算法存在收敛速度与性能难以平衡以及未考虑稀疏系统特性的问题,文中提出一种用于稀疏系统辨识的优化零吸引变步长归一化最小均方(OZVSS-NLMS)算法。该算法采用通过最小化即将到来的系数均方偏差以获取最优步长的变步长策略,同时在系数迭代过程中引入一种带有测量噪声信息的优化零吸引函数,解决了常规固定步长算法收敛速度与性能无法平衡以及常规变步长算法在稀疏系统下性能受限的问题,同时改善了算法对测量噪声敏感的缺陷。仿真实验结果表明,与其他同类算法相比,所提算法在稀疏系统辨识场景下具有更好的稳态性能、更快的收敛速度,且对测量噪声更具鲁棒性,充分证明了该算法的有效性。
2026年03期 v.49;No.698 151-157页 [查看摘要][在线阅读][下载 1681K] [下载次数:13 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 段圣君;钟声扬;
为优化景区游客游览线路规划,缓解因局部区域游客密度过高导致满意度下降的问题,提出基于时空密度分析的景区游客分流方法。利用时间约束Petri网构建景区游客分流管理框架,通过实时获取游客流量数据,动态模拟游客在景区内的时空分布特征。在此基础上,结合多维度容量计算模型(包括空间环境容量、生态容量、经济容量和心理容量),量化景区各线路的时空密度指数,识别高负载区域(时空密度>1人/m~2)。进一步,通过计算线路综合负载率,建立游客分流优化模型,动态调整游览线路,引导游客向低密度区域合理分布。实验以北京某古代建筑景区为研究对象,结果表明:所提方法能够有效降低高密度线路的游客负载,分流后各线路时空密度均控制在0.5~1人/m~2的合理范围内,有效缓解了局部区域游客过度集中的问题,且游客满意度评分提升至8分以上,显著优于传统分流方法,为景区实现游客分布均衡、资源高效利用与游览体验优化的协同发展提供了有效支撑。
2026年03期 v.49;No.698 158-162页 [查看摘要][在线阅读][下载 1441K] [下载次数:12 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 绳先闯;张涛;姜峰;鲁永志;赵新杰;李子豪;
集成运算放大器作为声表面波传感系统的核心信号调理单元,其增益和带宽特性将直接影响系统性能。针对315 MHz延迟线型声表面波传感系统,为了突破现有集成运算放大器增益不足、带宽受限的技术瓶颈,文中提出一种基于CMOS工艺的高性能两级运算放大器改进设计方案,通过三阶反比例级联提升增益和带宽,并采用多级密勒补偿技术优化运放电路系统传递函数中的零极点位置,以增加相位裕度,并提升系统的稳定性。实验结果表明,所设计运放的直流增益为127.8 dB,单位增益带宽为906.7 MHz,功耗为20.2μW,其相位裕度可达108.7°,并在315 MHz工作频率处具有37 dB增益,可满足400 MHz频率以下声表面波延迟线型传感系统振荡环路的设计需求。该设计不仅为声学传感系统的集成化与高性能提供关键技术支撑,还可拓展应用于无线传感网络、生物医学检测和工业物联网终端等高频率及低功耗场景,具有显著的工程应用价值。
2026年03期 v.49;No.698 163-168页 [查看摘要][在线阅读][下载 1835K] [下载次数:7 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 刘超;贾明永;贺艳涛;李雪;
红外诱饵技术的不断发展增加了场景复杂度,对抗干扰算法设计提出了更高的要求。为了弥补人工定义规则的传统图像处理算法对复杂场景描述能力不足的劣势,文中引入智能图像识别算法,完成了基于改进YOLOv5的人工智能算法网络搭建、训练及测试。结合传统算法场景划分明确、可解释性强,以及智能算法对特征的挖掘、学习能力强的特点,基于置信度概念,在像素级、特征级、决策级进行算法融合,提出一种传统与智能融合的目标检测算法。通过3 072条图像序列仿真验证,融合算法相较传统算法的目标检测成功概率提升12.99%,证明了融合算法的有效性,对于提升红外空空导弹目标检测能力具有重要意义。
2026年03期 v.49;No.698 169-174页 [查看摘要][在线阅读][下载 1683K] [下载次数:24 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ] - 董思宇;罗林;李金龙;高晓蓉;
已有的超声三维重建方法中,频域基础成像具有效率高的优势,然而在成像分辨率和质量方面普遍低于时域基础成像。因此,文中提出一种利用一维相控阵扫描的角谱带宽扩展的傅里叶超声三维成像方法。通过角谱带宽扩展,有效避免了频谱重叠问题,进一步提升了三维成像的分辨率。应用快速傅里叶变换计算相干加权因子,以此降低成像中的伪影和噪声,得到更加精确和清晰的成像结果,准确地还原实际缺陷的尺寸形状。实验结果表明,所提方法获得了更接近真实缺陷轮廓的成像结果,在成像质量和分辨率方面优于现有的超声成像方法。该方法为频域三维成像更广泛地应用在工程无损检测领域提供了一种新思路,同时为未来工程领域中的精密检测提供了一种更加高效、准确的技术工具。
2026年03期 v.49;No.698 175-179页 [查看摘要][在线阅读][下载 1439K] [下载次数:7 ] |[网刊下载次数:0 ] |[引用频次:0 ] |[阅读次数:0 ]