UCF Crime和Shanghaitech两个基准数据集
UCF Crime 和 ShanghaiTech 数据集在视频异常检测领域各有侧重。UCF Crime 更注重真实世界的复杂背景和多样化的异常事件,而 ShanghaiTech 则更关注城市监控场景中的异常行为及其像素级标注。两者共同为研究者提供了丰富的数据支持,推动了视频异常检测技术的发展。UCF Crime 数据集是一个用于监控视频中异常行为识别的大型数据集,包含1900个未经剪辑的长视频,总
UCF Crime和ShanghaiTech是两个在视频异常检测领域广泛使用的基准数据集,各自具有独特的特点和应用场景。
UCF Crime 数据集
-
数据规模与内容:
- UCF Crime 数据集包含1900个未经修剪的真实世界监控视频,总时长为128小时。
- 数据集中涵盖了13种现实世界的异常事件,包括虐待、逮捕、纵火、袭击、交通事故、入室盗窃、爆炸、斗殴、抢劫、枪击、偷窃、商店行窃和故意破坏。
-
数据集结构:
- 训练集包含810个异常视频和800个正常视频,测试集包含140个异常视频和150个正常视频。
- 提供视频级标注的训练集和帧级标注的测试集。
-
应用场景:
- 由于其复杂多样的背景和真实的异常事件,UCF Crime 数据集常用于评估模型在真实场景中的性能。
- 数据集中的异常事件对公共安全有重大影响,因此在视频异常检测研究中具有重要价值。
ShanghaiTech 数据集
-
数据规模与内容:
- ShanghaiTech 数据集包含437个高分辨率校园监控视频,覆盖了13个场景。
- 数据集中标注了130个异常事件,训练集由238个正常视频组成,测试集包含199个视频。
-
数据集结构:
- 背景复杂多样,光线条件和摄像机角度变化较大,适合用于弱监督设置下的视频异常检测研究。
- 数据集提供了像素级的异常事件标注,有助于模型学习在视频流中定位异常行为的关键帧。
-
应用场景:
- ShanghaiTech 数据集常用于城市监控场景中的异常行为检测,如街头、公园和商业区的异常行为(例如闯红灯、闲逛和非法停车)。
- 由于其场景的多样性和复杂性,该数据集也被用于评估模型在不同环境下的泛化能力。
总结
UCF Crime 和 ShanghaiTech 数据集在视频异常检测领域各有侧重。UCF Crime 更注重真实世界的复杂背景和多样化的异常事件,而 ShanghaiTech 则更关注城市监控场景中的异常行为及其像素级标注。两者共同为研究者提供了丰富的数据支持,推动了视频异常检测技术的发展。
UCF Crime 数据集是一个用于监控视频中异常行为识别的大型数据集,包含1900个未经剪辑的长视频,总时长为128小时。该数据集涵盖了13种真实的异常情况,这些异常情况对公共安全具有重大影响。以下是UCF Crime数据集中异常事件的详细分类和描述:
- 虐待:涉及对动物或人的虐待行为。
- 逮捕:警察或其他执法机构进行逮捕的行为。
- 纵火:故意点燃物品或建筑物的行为。
- 攻击:包括打斗、斗殴等暴力行为。
- 道路事故:交通事故或车辆事故。
- 入室盗窃:非法进入他人住宅进行盗窃的行为。
- 爆炸:爆炸事件,如炸弹爆炸。
- 战斗:大规模的战斗或冲突。
- 抢劫:使用暴力或威胁手段抢夺财物的行为。
- 射击:使用枪支或其他武器进行射击的行为。
- 偷窃:非法取走他人财物的行为。
- 入店行窃:在商店内进行盗窃的行为。
- 破坏:故意破坏公共或私人财产的行为。
ShanghaiTech 数据集中的异常行为具体包括哪些类型,以及这些类型的标注方法是如何实现的?
ShanghaiTech 数据集中的异常行为具体包括以下类型:
- 人群分散跑动:这是指在某些情况下,人群突然开始分散,形成不规则的移动模式。这种行为通常与紧急情况或突发事件有关。
- 单人跑动:这是指个别行人突然加速或改变方向,与周围人群的正常流动模式不同。
这些异常行为的标注方法如下:
- 像素级标注:数据集中对异常事件进行了详细的像素级标注,这意味着每个异常事件的每个像素都被明确标记为异常或正常。这种标注方法有助于精确地定位异常行为的发生位置。
- 帧级标注:除了像素级标注外,数据集还提供了帧级标注,即每个视频帧是否包含异常行为。这有助于在更宏观的层面上识别异常事件。
UCF Crime 和 ShanghaiTech 数据集在视频异常检测研究中的最新应用案例有哪些?
UCF Crime 和 ShanghaiTech 数据集在视频异常检测研究中的最新应用案例包括以下几项:
-
基于多重实例学习的视频异常检测方法:
- 该方法将视频异常检测视为弱监督问题,并采用多重实例学习(MIL)范式进行研究。通过充分利用视频中的复杂动态特性,如运动速度和目标物体的变化,可以显著提高视频异常检测的准确性和可信度。此外,引入了一种新的优化损失函数,由外部袋损失和内部袋损失组成,以有效区分异常和正常视频。实验结果表明,该方法在UCF-Crime、ShanghaiTech和UCSD Ped2数据集上达到了最先进的性能。
-
时空间交互移位模块(TISM):
- 该方法在UCF-Crime数据集上进行了实验,展示了其在处理真实世界监控视频中的13种异常行为(如虐待、逮捕、纵火、袭击、交通事故、入室盗窃、爆炸、打架、抢劫、射击、偷窃、商店行窃和破坏)方面的有效性。
-
基于变换器的多序列学习方法:
- 该方法在ShanghaiTech数据集上进行了实验,展示了其在弱监督设置下的性能。ShanghaiTech数据集包含437个校园监控视频,覆盖了13个场景和130个异常事件。该方法通过自训练和多序列学习的方式,提高了视频异常检测的准确性。
-
隐私感知的视频异常检测框架(TeD-SPAD):
- 该框架在UCF-Crime数据集上进行了实验,展示了其在处理大规模真实世界监控视频中的13种基于犯罪的异常(如逮捕、打架和店铺行窃)方面的有效性。
-
利用扩散模型进行无监督视频异常检测:
- 该研究在UCF-Crime和ShanghaiTech数据集上进行了实验,展示了其在无监督视频异常检测中的性能。UCF-Crime数据集包含128小时的视频,注释了13种不同的真实异常事件,如交通事故、偷窃和爆炸。
如何评估和比较UCF Crime 和 ShanghaiTech 数据集在不同视频异常检测模型上的性能差异?
评估和比较UCF Crime和ShanghaiTech数据集在不同视频异常检测模型上的性能差异需要考虑多个方面,包括数据集的特点、模型的性能指标以及实验设置等。以下是详细的分析:
-
数据集特点:
- UCF Crime:该数据集包含13类真实世界的异常事件,主要来自固定视角的监控视频,异常事件与上下文之间的耦合程度较低。这可能导致一些基于上下文信息的方法在该数据集上的效果不佳。
- ShanghaiTech:该数据集在复杂光照和摄像机角度下收集了270K帧正常视频,涵盖了多种场景和光照条件。这使得ShanghaiTech数据集在检测不同光照和视角下的异常事件时更具挑战性。
-
性能指标:
- AUC(Area Under the Curve) :这是评估视频异常检测模型性能的主要指标之一。较高的AUC值表示模型具有更好的区分能力。
- FAR(False Acceptance Rate) :用于评估模型的鲁棒性,即在正常视频中误报异常事件的概率。
-
模型性能比较:
- UCF Crime:在UCF Crime数据集上,不同方法的AUC值差异较大。例如,一种基于注意力网络模型的方法在该数据集上取得了83.76%的AUC。然而,也有研究指出,UCF Crime数据集中不同的异常事件表现出高度同质性,这可能限制了某些方法的效果。
- ShanghaiTech:在ShanghaiTech数据集上,一些方法的AUC值显著高于UCF Crime。例如,一种基于多实例学习(MIL)的方法在ShanghaiTech数据集上达到了91.24%的AUC。此外,另一种方法在ShanghaiTech数据集上的AUC达到了95.41%,明显优于UCF Crime的83.18%。
-
实验设置和方法:
- 特征编码器:在UCF Crime和ShanghaiTech数据集上,常用的特征编码器包括C3D和I3D。这些编码器能够提取视频中的时空特征,帮助模型更好地识别异常事件。
- 弱监督学习:弱监督学习方法在两个数据集上都表现出色。例如,一种基于提示增强的多实例学习方法在ShanghaiTech数据集上取得了优异的性能。
-
可视化结果:
- 在UCF Crime数据集上,异常激活图的可视化结果可以更好地展示模型的检测效果。这些可视化结果有助于理解模型在不同场景下的表现。
综上所述,UCF Crime和ShanghaiTech数据集在视频异常检测模型上的性能差异主要体现在数据集的特点、模型的AUC值以及实验设置等方面。ShanghaiTech数据集由于其复杂性和多样性,在某些方法上表现得更好,而UCF Crime数据集则更注重固定视角下的异常事件检测。
UCF Crime 和 ShanghaiTech 数据集的获取途径和使用许可条件是什么?
UCF Crime 和 ShanghaiTech 数据集的获取途径和使用许可条件如下:
UCF Crime 数据集
-
获取途径:
- UCF Crime 数据集可以通过 GitHub 上的项目进行获取。例如,有用户在 GitHub 上询问是否计划上传 UCF-Crime 数据集的 I3D 特征,并表示将稍后上传这些特征。
-
使用许可条件:
- 证据中没有明确提到具体的使用许可条件,但通常这类数据集的使用需要遵循开源协议或特定的使用条款。用户可以通过注册 GitHub 账户并联系项目的维护者来获取更多信息。
ShanghaiTech 数据集
-
获取途径:
- ShanghaiTech 数据集是由 ZHANG 等人提出的大型开源数据集。该数据集由 Part A 和 Part B 两部分组成,Part A 包含从互联网中随机收集的 482 张图片,其中 300 张用于训练,182 张用于测试。Part B 包含 716 张拍摄于上海繁华街道的图片,其中 400 张用于训练,316 张用于测试。
-
使用许可条件:
- 证据中没有明确提到具体的使用许可条件,但通常这类数据集的使用需要遵循开源协议或特定的使用条款。用户可以通过查阅相关论文或数据集的官方网站来获取更多信息。
更多推荐
所有评论(0)