该资源内容面向所有致力于生物多样性保护使用,禁止用于商业用户。
相关知识产权已获相关部门认证,非法使用必究。
野朋友标注分发系统:
该系统以AI万物识别通用模型YOLO-World作为核心底层技术,整合了
1、物种监测数据管理;
2、物种AI识别自训练;
3、数据众包和公民科学任务发布三大功能。
旨在协助生态保护机构连接公众力量,高效地进行野外物种数据标注与分类,提升生态保护工作的智能化能力。
YOLO-World-野朋友:
生物多样性是地球生命的基石,对于维持生态平衡具有重要意义。然而,由于人类活动的影响,许多野生动物面临着生存危机,野生动物种群数量不断减少,甚至有些物种濒临灭绝。因此,采取有效措施保护野生动物显得尤为重要。然而保护野生动物的基础便是对它们的分布、数量以及行为进行长期、准确的检测。
然而,野外环境极其恶劣,传统的野生动物监测方法面临着诸多挑战,如动物种类繁多、野外环境复杂且变幻莫测以及可用于训练监测模型的数据稀少。目前传统野生动物监测方法无论是在精度还是效率上都难以满足实际需求,成为了野生动物保护的首要难题。
对此,“野朋友计划”联合腾讯自研视觉基础模型“万物识别-YOLO-World”,构建面向野生动物的“万物识别”监测系统。YOLO-World作为高效率的开放词汇物体检测模型,具有强大的开放词汇定位与识别能力,不仅能够处理大量的物种类别,而且可以凭借其语义理解与零样本能力去检测从未见过的动物,这对野生动物监测,尤其是珍稀动物监测具有极大的意义;YOLO-World采用了大规模自然场景图像进行模型预训练,其涵盖了自然场景中各种条件下的图像数据,大规模自然图像为YOLO-World提供了较强的泛化能力和鲁棒性,使其复杂多变的野外环境也能稳定监测野生动物;经过大规模数据预训练后的YOLO-World,能够借助少量数据快速适应新场景的检测,降低了野外场景数据标注的成本,此外,YOLO-World凭借其开放词汇检测能力,能够进一步为采集到的数据实现数据标注,并进一步提升模型监测的精度。
YOLO-World技术架构介绍:
1. 视觉-语言建模的通用物体检测模型
YOLO-World构建了视觉-语言模型实现开放词汇物体检测,在YOLO检测器的基础上引入了预训练的文本编码器。给定输入的任意文本,文本编码器将其编码为文本向量。而YOLO检测器实现图像编码,检测出图像中所含有的物体,并预测相应的物体编码。YOLO-World通过物体编码与文本编码的相似度关系实现文本与物体的匹配。
视觉-语言建模能赋予YOLO-World开放词汇识别与零样本检测能力。YOLO-World能够对任意文本输入,在图像中定位出与之匹配的区域,文本既可以是物种类别,也可以是物种的属性或特征。在野外场景中,YOLO-World能直接应对大规模的物种识别与定位,更重要的是,YOLO-World的零样本检测能力使其能够去定位从未训练过的珍稀物种,并且利于新物种的发现与监测,极大提高了野生动物监测的准确性。
此外,YOLO-World结构简单,具有较高的推理速度与较低的运行成本,在野外严苛的环境可以有效降低设备的功耗,使得监测系统能够更加持久与稳定。
YOLO-World 技术架构
2. 大规模自然场景的预训练训练
与传统物体检测不同的是,YOLO-World采用了大规模自然场景的区域-文本数据进行训练,其涵盖了自然场景各种物体尤其是各种动物,训练数据具有较高的物种多样性,极大提高了YOLO-World在自然场景物体检测的泛化性,即便是野生动物,YOLO-World也能够应对自如。此外,YOLO-World的训练数据更涵盖了自然界各种环境与各种天气的图像数据,使其具有较高的鲁棒性,能够适应于自然界各种环境与天气,提高了在野外监测的鲁棒性与稳定性。
3. 低成本的微调训练与数据生产潜力
经过大规模预训练的YOLO-World仅需要少量数据便可以快速适应野外环境的物种检测,这极大程度降低了野生动物监测的数据成本。野外物种场景复杂,物种多样性丰富,实现准确的标注需要投入大量人力,传统的物体检测模型依赖大量数据去训练,而YOLO-World本身具有极强的零样本检测能力和场景泛化能力,因此,少量的数据便能够让YOLO-World快速适应环境,实现更加准确的野外动物检测。
YOLO-World不仅能够用于监测系统,而且可以拓展进一步去实现野生动物数据标注,其开放词汇检测能力能够帮助动物“野朋友”对采集的野外数据进行数据标注,经过简单的人工校验,这些数据便能作为训练数据训练更加准确的野生动物检测模型。
YOLO-World在数据标注上的优势:相比人工减少99%标注时间
YOLO-World的零样本识别能力:
少量数据训练,宽容度高,可拓展到识别更多未经训练的类别
YOLO-World学习能力强:
仅采用350张有标注图像进行提示训练,可以实现33.3%精度提升。
入住该后台可使用:录入公民科学项目信息,上传野外数据采集素材,发布标注任务等...
该资源内容面向所有致力于生物多样性保护使用,禁止用于商业用户。
相关知识产权已获相关部门认证,非法使用必究。