UCF Crime和Shanghaitech两个基准数据集

百态老人

2366人浏览 · 2024-12-22 09:31:04

百态老人 · 2024-12-22 09:31:04 发布

UCF Crime和ShanghaiTech是两个在视频异常检测领域广泛使用的基准数据集，各自具有独特的特点和应用场景。

UCF Crime 数据集

数据规模与内容：
- UCF Crime 数据集包含1900个未经修剪的真实世界监控视频，总时长为128小时。
- 数据集中涵盖了13种现实世界的异常事件，包括虐待、逮捕、纵火、袭击、交通事故、入室盗窃、爆炸、斗殴、抢劫、枪击、偷窃、商店行窃和故意破坏。
数据集结构：
- 训练集包含810个异常视频和800个正常视频，测试集包含140个异常视频和150个正常视频。
- 提供视频级标注的训练集和帧级标注的测试集。
应用场景：
- 由于其复杂多样的背景和真实的异常事件，UCF Crime 数据集常用于评估模型在真实场景中的性能。
- 数据集中的异常事件对公共安全有重大影响，因此在视频异常检测研究中具有重要价值。

ShanghaiTech 数据集

数据规模与内容：
- ShanghaiTech 数据集包含437个高分辨率校园监控视频，覆盖了13个场景。
- 数据集中标注了130个异常事件，训练集由238个正常视频组成，测试集包含199个视频。
数据集结构：
- 背景复杂多样，光线条件和摄像机角度变化较大，适合用于弱监督设置下的视频异常检测研究。
- 数据集提供了像素级的异常事件标注，有助于模型学习在视频流中定位异常行为的关键帧。
应用场景：
- ShanghaiTech 数据集常用于城市监控场景中的异常行为检测，如街头、公园和商业区的异常行为（例如闯红灯、闲逛和非法停车）。
- 由于其场景的多样性和复杂性，该数据集也被用于评估模型在不同环境下的泛化能力。

总结

UCF Crime 和 ShanghaiTech 数据集在视频异常检测领域各有侧重。UCF Crime 更注重真实世界的复杂背景和多样化的异常事件，而 ShanghaiTech 则更关注城市监控场景中的异常行为及其像素级标注。两者共同为研究者提供了丰富的数据支持，推动了视频异常检测技术的发展。

UCF Crime 数据集是一个用于监控视频中异常行为识别的大型数据集，包含1900个未经剪辑的长视频，总时长为128小时。该数据集涵盖了13种真实的异常情况，这些异常情况对公共安全具有重大影响。以下是UCF Crime数据集中异常事件的详细分类和描述：

虐待：涉及对动物或人的虐待行为。
逮捕：警察或其他执法机构进行逮捕的行为。
纵火：故意点燃物品或建筑物的行为。
攻击：包括打斗、斗殴等暴力行为。
道路事故：交通事故或车辆事故。
入室盗窃：非法进入他人住宅进行盗窃的行为。
爆炸：爆炸事件，如炸弹爆炸。
战斗：大规模的战斗或冲突。
抢劫：使用暴力或威胁手段抢夺财物的行为。
射击：使用枪支或其他武器进行射击的行为。
偷窃：非法取走他人财物的行为。
入店行窃：在商店内进行盗窃的行为。
破坏：故意破坏公共或私人财产的行为。

ShanghaiTech 数据集中的异常行为具体包括哪些类型，以及这些类型的标注方法是如何实现的？

ShanghaiTech 数据集中的异常行为具体包括以下类型：

人群分散跑动：这是指在某些情况下，人群突然开始分散，形成不规则的移动模式。这种行为通常与紧急情况或突发事件有关。
单人跑动：这是指个别行人突然加速或改变方向，与周围人群的正常流动模式不同。

这些异常行为的标注方法如下：

像素级标注：数据集中对异常事件进行了详细的像素级标注，这意味着每个异常事件的每个像素都被明确标记为异常或正常。这种标注方法有助于精确地定位异常行为的发生位置。
帧级标注：除了像素级标注外，数据集还提供了帧级标注，即每个视频帧是否包含异常行为。这有助于在更宏观的层面上识别异常事件。

UCF Crime 和 ShanghaiTech 数据集在视频异常检测研究中的最新应用案例有哪些？

UCF Crime 和 ShanghaiTech 数据集在视频异常检测研究中的最新应用案例包括以下几项：

基于多重实例学习的视频异常检测方法：
- 该方法将视频异常检测视为弱监督问题，并采用多重实例学习（MIL）范式进行研究。通过充分利用视频中的复杂动态特性，如运动速度和目标物体的变化，可以显著提高视频异常检测的准确性和可信度。此外，引入了一种新的优化损失函数，由外部袋损失和内部袋损失组成，以有效区分异常和正常视频。实验结果表明，该方法在UCF-Crime、ShanghaiTech和UCSD Ped2数据集上达到了最先进的性能。
时空间交互移位模块（TISM）：
- 该方法在UCF-Crime数据集上进行了实验，展示了其在处理真实世界监控视频中的13种异常行为（如虐待、逮捕、纵火、袭击、交通事故、入室盗窃、爆炸、打架、抢劫、射击、偷窃、商店行窃和破坏）方面的有效性。
基于变换器的多序列学习方法：
- 该方法在ShanghaiTech数据集上进行了实验，展示了其在弱监督设置下的性能。ShanghaiTech数据集包含437个校园监控视频，覆盖了13个场景和130个异常事件。该方法通过自训练和多序列学习的方式，提高了视频异常检测的准确性。
隐私感知的视频异常检测框架（TeD-SPAD）：
- 该框架在UCF-Crime数据集上进行了实验，展示了其在处理大规模真实世界监控视频中的13种基于犯罪的异常（如逮捕、打架和店铺行窃）方面的有效性。
利用扩散模型进行无监督视频异常检测：
- 该研究在UCF-Crime和ShanghaiTech数据集上进行了实验，展示了其在无监督视频异常检测中的性能。UCF-Crime数据集包含128小时的视频，注释了13种不同的真实异常事件，如交通事故、偷窃和爆炸。

如何评估和比较UCF Crime 和 ShanghaiTech 数据集在不同视频异常检测模型上的性能差异？

评估和比较UCF Crime和ShanghaiTech数据集在不同视频异常检测模型上的性能差异需要考虑多个方面，包括数据集的特点、模型的性能指标以及实验设置等。以下是详细的分析：

数据集特点：
- UCF Crime：该数据集包含13类真实世界的异常事件，主要来自固定视角的监控视频，异常事件与上下文之间的耦合程度较低。这可能导致一些基于上下文信息的方法在该数据集上的效果不佳。
- ShanghaiTech：该数据集在复杂光照和摄像机角度下收集了270K帧正常视频，涵盖了多种场景和光照条件。这使得ShanghaiTech数据集在检测不同光照和视角下的异常事件时更具挑战性。
性能指标：
- AUC（Area Under the Curve） ：这是评估视频异常检测模型性能的主要指标之一。较高的AUC值表示模型具有更好的区分能力。
- FAR（False Acceptance Rate） ：用于评估模型的鲁棒性，即在正常视频中误报异常事件的概率。
模型性能比较：
- UCF Crime：在UCF Crime数据集上，不同方法的AUC值差异较大。例如，一种基于注意力网络模型的方法在该数据集上取得了83.76%的AUC。然而，也有研究指出，UCF Crime数据集中不同的异常事件表现出高度同质性，这可能限制了某些方法的效果。
- ShanghaiTech：在ShanghaiTech数据集上，一些方法的AUC值显著高于UCF Crime。例如，一种基于多实例学习（MIL）的方法在ShanghaiTech数据集上达到了91.24%的AUC。此外，另一种方法在ShanghaiTech数据集上的AUC达到了95.41%，明显优于UCF Crime的83.18%。
实验设置和方法：
- 特征编码器：在UCF Crime和ShanghaiTech数据集上，常用的特征编码器包括C3D和I3D。这些编码器能够提取视频中的时空特征，帮助模型更好地识别异常事件。
- 弱监督学习：弱监督学习方法在两个数据集上都表现出色。例如，一种基于提示增强的多实例学习方法在ShanghaiTech数据集上取得了优异的性能。
可视化结果：
- 在UCF Crime数据集上，异常激活图的可视化结果可以更好地展示模型的检测效果。这些可视化结果有助于理解模型在不同场景下的表现。

综上所述，UCF Crime和ShanghaiTech数据集在视频异常检测模型上的性能差异主要体现在数据集的特点、模型的AUC值以及实验设置等方面。ShanghaiTech数据集由于其复杂性和多样性，在某些方法上表现得更好，而UCF Crime数据集则更注重固定视角下的异常事件检测。

UCF Crime 和 ShanghaiTech 数据集的获取途径和使用许可条件是什么？

UCF Crime 和 ShanghaiTech 数据集的获取途径和使用许可条件如下：

UCF Crime 数据集

获取途径：
- UCF Crime 数据集可以通过 GitHub 上的项目进行获取。例如，有用户在 GitHub 上询问是否计划上传 UCF-Crime 数据集的 I3D 特征，并表示将稍后上传这些特征。
使用许可条件：
- 证据中没有明确提到具体的使用许可条件，但通常这类数据集的使用需要遵循开源协议或特定的使用条款。用户可以通过注册 GitHub 账户并联系项目的维护者来获取更多信息。

ShanghaiTech 数据集

获取途径：
- ShanghaiTech 数据集是由 ZHANG 等人提出的大型开源数据集。该数据集由 Part A 和 Part B 两部分组成，Part A 包含从互联网中随机收集的 482 张图片，其中 300 张用于训练，182 张用于测试。Part B 包含 716 张拍摄于上海繁华街道的图片，其中 400 张用于训练，316 张用于测试。
使用许可条件：
- 证据中没有明确提到具体的使用许可条件，但通常这类数据集的使用需要遵循开源协议或特定的使用条款。用户可以通过查阅相关论文或数据集的官方网站来获取更多信息。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git