关键词: YOLOv8 目标检测 特征增强 复杂海况 轻量化
摘要: [目的]YOLOv8算法凭借其高效的处理能力和优异的检测效果在目标检测领域广受认可,但在船舶目标检测中仍存在抗干扰能力不足、多尺度特征提取效果不佳及参数量偏大等问题,为此综合运用空间深度转换分组膨胀(SDGD)卷积、注意力同尺度特征交互(AIFI)、部分卷积(PConv)与坐标注意力机制(CA),提出一种特征增强的轻量级SAP-YOLOv8目标检测算法。[方法]首先,在普通卷积中融入空间深度转换卷积与膨胀卷积,构建SDGD模块,提升对海杂波干扰的抑制能力以及多尺度特征的提取能力;然后,引入RT-DETR中的AIFI模块,取代SPPF模块以增强复杂海况下的上下文建模能力;最后,为优化算法的计算效率,基于PConv与CA的原理,构建C3k2_PCCA模块以降低参数量和复杂度,同时提升算法在复杂海况下的轻量化性能和运行效率。[结果]在公开数据集HRSID上进行的实验结果表明SAP-YOLOv8算法与原始算法的参数量几乎相同,但精确率、召回率以及平均精度均值分别提高了1.5%、0.7%、1.6%,且检测效果明显优于其他经典算法。[结论]SAP-YOLOv8算法具有更高的检测精度和运行效率,且能够在复杂海况下表现出更强的鲁棒性和实用价值。
关键词: 小目标检测 多尺度特征融合 检测头 上下文信息
摘要: 针对无人机航拍图像中目标尺寸小、背景复杂等特点导致的目标漏检误检问题,以YOLOv12s为基础,提出了一种基于多尺度特征融合的小目标检测算法。构建了多尺度特征融合金字塔网络,通过高频自适应下采样模块HFAD保留B2检测层中小目标的细粒度特征,并引入大核特征增强模块LKFE以增强特征表示;利用协调坐标卷积CoordConv和定位质量估计LQE设计了位置校准检测头LC-Head,以增强空间感知能力,使检测框定位更准确;引入了上下文引导下采样模块CGD,以获取局部与全局上下文信息。在Visdrone2019数据集上的实验表明,所提算法相比基准算法在APtiny、APsmall和mAP50上分别取得了3.3%、5.5%和4.2%的提升,且TinyPerson数据集上的泛化性实验,也验证了本算法的有效性。
关键词: 矢量地图点数据 无损水印 几何攻击 存储顺序 泰森多边形
摘要: 针对矢量地图点数据的版权保护需求,本文提出一种基于存储特征的矢量地图点数据无损水印算法。首先,构建基于矢量地图坐标点的泰森多边形,每个点要素都对应唯一的泰森多边形;其次,根据存储顺序中相邻点要素对应泰森多边形周长的大小关系,确定点要素的存储方向;然后将相邻点要素对应泰森多边形的周长两两求和,再将所有和进行最小-最大值归一化,通过映射函数建立水印与归一化值之间的映射关系;最后,根据水印和对应点要素存储方向之间的关系,调整相邻点要素的存储顺序以嵌入水印。检测水印时,构建含水印矢量地图点数据的泰森多边形,根据相邻点要素的存储方向和映射关系提取水印。实验表明,该算法对平移、缩放和旋转具有良好的鲁棒性;由于水印嵌入过程中未对坐标值进行修改,实现了水印的无损嵌入,不影响高精度地图数据的使用,算法的实用性较强。
关键词: 大数据 测绘地理信息 分布式融合
摘要: 测绘地理信息技术快速发展,数据规模呈指数级增长,传统集中式处理方法在能力与精度方面面对严峻考验,本文围绕多源测绘地理信息数据融合处理这一重点问题,给出依据分布式架构的大数据处理方案,设立融合精度分析模型,凭借实验验证该方法在加强处理能力的情况下可以有效控制数据融合精度,为测绘地理信息大数据工程化应用给予技术参照。
关键词: 过道布置问题 变邻域人工旅鼠算法 环路布局 混合整数规划模型 柔性车间
摘要: 现有过道布置问题研究普遍将运输路径进行简化,导致布局方案难以应对柔性车间中复杂的物料交互。针对这一不足,基于产品制造过程中物料沿工艺路线以单向流动为主导的特性,提出了考虑非对称流量的单向环形路径约束过道布置问题。建立了最小化物料搬运成本与回溯成本的双目标混合整数规划模型,使用求解器GUROBI进行了精确求解。鉴于该问题的组合优化特性,设计了一种融合变邻域搜索的离散人工旅鼠算法,构建了问题特征驱动的四种旅鼠位置更新算子。并通过变邻域搜索、停滞感知的能量调控机制、随算法进程动态调节精英解比例的种群更新策略对原始算法进行改进。运用该算法求解5~49规模中23个算例,结果对比验证了所提算法的优越性。最后将所提问题应用于减速器车间,结果表明所得方案在降低物流成本的同时提升了布局紧凑性与物流有序性。
关键词: 超声成像 相干平面波复合成像 自适应加权方法 相干系数
摘要: 针对用于超声复合成像的传统自适应加权方法对相邻发射角度的局部信息利用不足导致的背景组织成像质量降低的问题,提出一种相邻极性差异系数加权方法。该方法通过统计相邻发射角度成像向量的极性差异情况构造加权系数,并对复合成像结果进行加权输出。仿真与体模实验结果表明,与相干系数和符号相干系数加权方法相比,所提方法的噪声对比度最高分别提高30.3%和80.3%,散斑信噪比最高分别提高75.2%和201.6%;与幅度平方相干加权方法相比,所提方法在成像质量相近的条件下显著降低了运算复杂度并提高了运算速度。
关键词: 多视图聚类 流形学习 联合优化
摘要: 海量数据常以多模态或多视图形式存储,多视图聚类旨在依据其隐含结构信息将数据划分为若干类簇。现有方法多采用欧氏距离度量相似性,忽略了数据点间的内在几何结构与视图间的高阶相关性,且图学习与聚类过程难以协同优化。本文提出一种基于Stiefel流形学习的多视图聚类算法,通过测量Stiefel流形上的相似距离学习各视图邻居图,并将多个邻居图嵌入低秩张量中以捕捉视图间高阶相关性;同时,自适应地研究各视图对一致图的不同贡献,并引入正交与非负约束,直接获得可解释性更强的聚类结果。邻居图学习、图融合以及标签学习的联合优化提升了聚类性能。六个基准数据集上与十四种优秀算法的对比实验结果验证了所提算法在聚类性能提升方面的有效性。
关键词: 扩散模型 文本生成图像 双交叉注意力 PSConv 正则化
摘要: 针对文本生成图像算法存在的跳跃连接跨层级语义不一致、特征捕捉能力弱以及生成图像细节信息缺失等问题,提出一种基于改进稳定扩散模型的文本生成图像算法(ISDM)。通过在跳跃连接中引入DCA模块,捕捉通道和空间维度的依赖关系,有效融合多尺度编码器特征,减少特征丢失;将U-Net的部分标准卷积替换为PSConv,通过周期性变化的卷积核设计,增强特征提取能力,提高生成图像的细节表达效果;在原损失函数的基础上添加正则化项,优化模型的内部特征表示,提高生成图像的质量。在MS COCO数据集上与DAE-GAN、Cogview2、Stable Diffusion和Corgi算法进行定性和定量分析及消融实验,实验结果表明:ISDM算法生成的图像具有更优的细节细腻度和生成质量;与基于扩散模型的Stable Diffusion和Corgi算法相比,FID平均降低17.57%,IS平均提高10.05%。
关键词: 技术封建主义 数字主权 政治经济学 数字治理
摘要: 西方学界以“技术封建主义”概念揭示平台资本通过数据占有、算法控制与规则垄断所形成的类封建权力关系,为理解数字主权的变迁提供了重要视角。在这一逻辑下,平台中介化重构权力运行的组织形态,数据要素化推动生产资料权属关系的再配置,算法嵌入化则实现规则制定权的技术化转译,三者共同构成数字主权被分割与重塑的现实机制。进一步来看,依附性取代契约性、等级化超越竞争性以及占有性压倒共享性,构成“技术封建主义”下数字主权裂变的生成机制。面向这一趋势,有必要以人民主权为价值根基重塑数字文明的发展导向,以中国式现代化为实践路径推进数字治理体系的整体重构,并以人类命运共同体理念拓展数字文明的全球治理视野,从而实现从技术批判走向数字文明治理的理论转向。
关键词: 鲜切花 神经网络 抓取位置检测 YOLOv11
摘要: 针对鲜切花上料机械臂自动上料过程中,鉴于鲜切花形态的不规则性,鲜切花抓取位置的检测算法计算量大、模型复杂度高,不便在计算量有限的设备上应用的问题,提出一种基于YOLOv11改进的鲜切花抓取位置检测的YOLOv11n-Flower算法模型。该模型算法添加了提升小目标检测的C3K2-DWRSeg模块,有效助力鲜切花抓取点的识别;引入轻量化下采样ADown模块,在降低模型算法的浮点运算量的同时,也极大提升检测精度;使用Slim-Neck模块代替原有的颈部网络,不但减少参数堆叠,还提升模型检测精度和加速模型的推理速度。并对改进前后的模型算法效果进行局部和整体仿真对比试验,试验结果表明,相比较于原模型,改进后的模型对鲜切花抓取位置的检测精确度P(Precision)提升1.2个百分点,召回率R(Recall)提升5.2个百分点,平均精度mAP@50和mAP@50:95分别提升2.6、3.8个百分点,同时,模型大小从5.42M降低到4.67M,浮点运算量FLOPs由6.3G降低到5.2G。该模型算法具有较高检测精度和鲁棒性,能满足在鲜切花实际加工中对鲜切花抓取位置的检测任务。