利用深度学习和注意力机制增强表型性状分析

发布时间:2024-03-29 16:57:32 栏目:精选知识

    导读 从图像数据中准确提取表型性状对于谷类作物研究至关重要,但由于穗和叶子之间的环境和物理相似性,温室中的穗检测具有挑战性。最近的努力包...

    从图像数据中准确提取表型性状对于谷类作物研究至关重要,但由于穗和叶子之间的环境和物理相似性,温室中的穗检测具有挑战性。最近的努力包括提高图像分辨率和特征维度,以及开发 SpikeSegNet 等神经网络来改进尖峰检测。然而,这些方法很难准确定位小尖峰,并且需要神经网络调整和新颖的检测模型的进一步进步来有效克服这些尖峰检测挑战。

    2024年1月,Plant Phenomics 发表了题为“ High-throughputSpikeDetectionin温室栽培谷物作物与注意机制基于深度学习模型”的研究文章。

    在这项研究中,实施并训练了三个深度神经网络 (DNN)——FRCNN、FRCNN-A 和 Swin Transformer,用于谷类作物的穗检测。使用 SGD 优化器对网络进行优化,模型之间的训练时间有所不同; FRCNN 需要 900 到 1200 个 epoch,FRCNN-A 需要 800 到 1000 个 epoch,Swin Transformer 需要 2500 到 3000 个 epoch。使用动态学习率策略来优化模型收敛,证明了模型在检测不同难度的尖峰方面的有效性,特别是在密集的叶群中。

    结果表明,在没有数据转换或增强的情况下,Swin Transformer 在准确性方面优于其他模型。增强了注意力模块的 FRCNN-A 模型比原始 FRCNN 有了显着改进,凸显了 FRCNN-A 架构进一步改进的潜力。注意力模块捕获感兴趣区域的分层上下文的能力因其在检测具有挑战性的尖峰模式方面的有效性而受到特别关注。

    对来自两个表型分析设施的九个数据集进行的训练表明,随着训练集中原始图像内容的增加,所有模型的准确性都得到提高。 Swin Transformer 在不同的训练集中表现出了最高的平均精度 (mAP),表明其提取特征和检测尖峰的卓越能力。然而,该研究还强调,虽然 Swin Transformer 提供了高精度,但 FRCNN-A 提供了更高效、更快速的训练替代方案,特别有利于具有相似特征的数据集。

    结果强调了模型对增强图像的适应性及其在特定 IPK 测试集上的性能的重要性,突出了这些先进架构在改善混合小麦品种穗检测方面的潜力。该研究得出的结论是,修改后的 FRCNN-A 减少了卷积层数量并添加了注意力模块,再加上计算密集型 Swin Transformer,代表了复杂光学场景中小规模物体检测的重大进步。这些创新有望提高表型分析任务的准确性和效率,尽管推理时间和准确性之间的权衡仍然是实时应用程序的考虑因素。

免责声明:本文由用户上传,如有侵权请联系删除!