卫星遥感影像深度学习数据集终极指南
在人工智能与遥感技术深度融合的今天,获取高质量的卫星影像数据集成为了每个研究者和工程师的必修课。无论你是想用深度学习检测森林火灾、追踪城市扩张,还是监测海洋污染,这篇文章都将成为你的"数据宝藏地图"。
🌍 写在前面
在人工智能与遥感技术深度融合的今天,获取高质量的卫星影像数据集成为了每个研究者和工程师的必修课。无论你是想用深度学习检测森林火灾、追踪城市扩张,还是监测海洋污染,这篇文章都将成为你的"数据宝藏地图"。
🗂️ 一、数据集"导航站"——你的第一站
在茫茫数据海洋中迷失方向?这些精选列表就是你的指南针:
综合导航资源
| 资源名称 | 特色 | 链接 |
|---|---|---|
| Earth Observation Database | IEEE官方维护,权威可靠 | 访问 |
| awesome-satellite-imagery-datasets | GitHub高星项目,持续更新 | 访问 |
| Awesome_Satellite_Benchmark_Datasets | 基准测试专用数据集 | 访问 |
| BED4RS | 遥感基准数据集合集 | 访问 |
🏢 四大数据集中心
-
Radiant MLHub 🌟
- 特点:既有数据集又有预训练模型
- 立即探索
-
AWS开放数据注册表 ☁️
- 特点:免费访问,PB级数据量
- 浏览目录
-
Microsoft Planetary Computer 🖥️
- 特点:云端计算平台+数据目录
- 开始使用
-
Google Earth Engine 🌐
- 特点:在线分析,无需下载
- 查看数据
🛰️ 二、Sentinel家族——免费的"数据金矿"
Sentinel-1:雷达的眼睛 👁️
为什么选它?
- ✅ 穿透云雾,全天候工作
- ✅ 适合洪水监测、船舶检测
- ✅ 完全免费开放
热门数据集:
| 数据集 | 应用场景 | GitHub链接 |
|---|---|---|
| mmflood | 🌊 洪水检测 | 代码 |
| Sentinel-1 for Science Amazonas | 🌳 森林损失监测 | 访问 |
Sentinel-2:多光谱的魔法 🎨
核心优势:
- 🔸 13个光谱波段(从可见光到短波红外)
- 🔸 10米最高分辨率
- 🔸 每5天全球覆盖一次
🌾 农业领域必备数据集
-
Sen4AgriNet - 农作物分类的"金标准"
-
TimeSen2Crop - 百万级标注样本
- 📦 100万+标注样本
- 🗓️ 时间序列数据
- 🔗 Zenodo下载
-
AgriSen-COG - 多国大规模数据集
- 🌍 跨国数据,包含异常检测
- 🔗 GitHub
🏙️ 城市与建筑检测
-
open-sentinel-map
- ✨ 基于OpenStreetMap标注
- 🎯 像素级语义标签
- 🔗 GitHub
-
UKFields - 英国农田边界
- 📊 230万+自动提取的田块边界
- 🗺️ 覆盖英格兰、威尔士、苏格兰、北爱尔兰
- 🔗 GitHub
☁️ 云检测专题
| 数据集 | 规模 | 特色 | 链接 |
|---|---|---|---|
| CloudSEN12Plus | 最大规模 | Sentinel-2云检测基准 | HuggingFace |
| sen12mscr | 多模态 | 云移除任务 | 官网 |
🚢 船舶与海洋监测
-
Ship-S2-AIS dataset - 丹麦海域船舶
- 📷 13k瓦片,29个Sentinel-2产品
- 🚢 货船、渔船、集装箱船
- 🔗 Zenodo
-
MARIDA - 海洋垃圾检测
- 🌊 专注海洋污染
- 🔗 官网
🔥 火灾与灾害
💡 能源领域
- GloSoFarID - 全球太阳能农场
- ☀️ 多光谱太阳能农场识别
- 🔗 GitHub
🌲 森林监测
- Greenearthnet - 植被预测
- 🌱 高分辨率植被预测数据集
- 🔗 GitHub
🆕 多模态与基础模型
- ChatEarthNet - 影像配文本
- 💬 结合ChatGPT生成的描述
- 🧠 赋能视觉-语言地理基础模型
- 🔗 GitHub
🌎 三、Landsat传奇——50年的数据宝藏
历史地位
Landsat计划是人类历史上最长的对地观测项目(始于1972年),为全球环境变化研究提供了无价的历史档案。
核心参数:
- 📐 8个光谱波段
- 📏 15-60米空间分辨率
- 🌍 185公里幅宽
- ⏱️ 16天重访周期
数据获取途径
| 平台 | 优势 | 访问链接 |
|---|---|---|
| Google Cloud | Landsat 8 COG格式 | 浏览 |
| AWS | 完整档案+工具链 | 注册表 |
特色数据集
-
LandsatSCD - 变化检测
- 📊 8468对影像,416×416像素
- 🔗 GitHub
-
The Landsat Irish Coastal Segmentation Dataset
- 🏖️ 爱尔兰海岸线分割
- 🔗 Zenodo
🏆 四、Kaggle竞赛数据集——实战演练场
🌳 Amazon Rainforest多标签分类
挑战:从Planet卫星影像识别亚马逊雨林的12种土地利用类型
学习资源:
- FastAI多标签分类教程
- amazon-classifier - 随机森林 vs CNN对比
🛣️ DSTL卫星影像语义分割
数据特点:
- 🛰️ WorldView-3卫星
- 📦 1km×1km区域,45张影像
- 🎨 RGB + 16波段多光谱
- 🏷️ 10个类别:建筑、道路、树木、农作物等
明星方案:
🚢 Airbus船舶检测
挑战背景:在光学卫星影像中检测和分割船舶
- 📊 大规模数据集(但存在质量争议)
- 🎯 实例分割任务
- 🔗 竞赛主页
优质方案:
- Airbus-Ship-Detection - ResNeXt50分类器 + U-Net分割
- 经验总结博客
✈️ 飞机检测系列
1. Ships in Google Earth - 旧金山湾区船舶
2. Planesnet - 飞机分类
3. CGI Planes - CGI飞机目标检测
- 🎮 500张计算机生成的卫星影像
- 📦 带边界框标注
- 🔗 数据集
🏊 游泳池与汽车检测
- 📊 3750张住宅区卫星影像
- 🏷️ 游泳池和汽车的标注数据
- 🔗 数据集
- 📝 RetinaNet教程
🌆 迪拜语义分割
数据特点:
- 📍 72张迪拜卫星影像
- 🎨 6个类别分割
- 🔗 数据集
优质项目:
🎯 五、专业领域数据集精选
🏗️ 建筑物检测
1. Microsoft Building Footprints - 全球建筑足迹
2. Google Open Buildings - 非洲建筑
3. Inria Building Dataset - 欧美城市
- 📏 0.3米分辨率
- 🌆 覆盖奥斯汀、芝加哥、维也纳等
- 🔗 官网
🔄 变化检测
1. LEVIR-CD - 建筑变化检测标杆
2. S2Looking - 侧视角建筑变化
3. xView2 (xBD) - 灾害损毁评估
🚢 船舶检测大全
| 数据集 | 传感器 | 特色 | 链接 |
|---|---|---|---|
| HRSC2016 | 光学 | 旋转边界框 | Kaggle |
| SSDD | SAR | SAR船舶检测 | GitHub |
| xView3 | SAR | 暗船检测(IUU捕鱼) | 官网 |
| LEVIR-Ship | 光学 | 中分辨率小船 | GitHub |
🌊 SAR专题数据集
为什么SAR重要?
- 🌙 全天时工作(不受光照影响)
- ☁️ 全天候成像(穿透云雾)
- 🌊 海洋监测的利器
核心数据集:
-
HRSID - 高分辨率SAR船舶
- 🎯 检测、语义分割、实例分割
- 🔗 GitHub
-
LS-SSDD - 大规模SAR船舶检测
- 📊 大型数据集
- 🔗 GitHub
-
AIR-PolSAR-Seg - 极化SAR地形分割
- 🗺️ 具有挑战性的地形数据
- 🔗 GitHub
🌲 森林与环境监测
森林数据集集合:
- 📚 OpenForest - 开放森林数据集目录
- 🌳 awesome-forests - 森林真值数据集精选
重点数据集:
🌾 农业应用数据集
作物分类:
-
CropNet - 气候变化感知的作物产量预测
- 💾 TB级多模态数据集
- 🔗 Anonymous链接
-
EuroCropsML - 欧洲作物小样本分类
- 🇪🇺 覆盖欧洲多国
- 🔗 GitHub
🔥 火灾监测
🏅 六、重量级基准数据集
SpaceNet系列 - 商业级挑战
SpaceNet是一系列高质量竞赛数据集:
| 挑战 | 任务 | 特点 |
|---|---|---|
| SpaceNet 1&2 | 建筑分割 | 多城市数据 |
| SpaceNet 3 | 道路分割 | 复杂路网 |
| SpaceNet 4 | 离轴建筑 | 非垂直视角 |
| SpaceNet 5 | 路网提取 | 图结构表示 |
| SpaceNet 6 | 多传感器 | SAR+光学 |
| SpaceNet 7 | 时序变化 | 城市发展监测 |
| SpaceNet 8 | 洪水检测 | 多类分割 |
xView家族 - DARPA出品
xView1 - 百万级目标检测
- 🎯 60个目标类别
- 📊 100万+目标标注
- 📐 0.3米分辨率
- 🔗 官网
xView2 - 建筑损毁评估
- 🏚️ 4级损毁标准
- 🎯 精确分割掩码
- 🔗 官网
xView3 - SAR暗船检测
- 🚢 IUU捕鱼监测
- 📡 Sentinel-1 SAR
- 🌍 4320万km²覆盖
- 🔗 官网
DOTA - 旋转目标检测标杆
数据规模:
- 📷 2806张大尺寸影像
- 🏷️ 188,282个实例标注
- 🔄 18个类别(含旋转边界框)
应用价值:
- ✅ 学术界广泛引用
- ✅ mmrotate预训练模型支持
- 🔗 官网
土地覆盖分类三剑客
UC Merced - 经典入门数据集
- 📦 21类,每类100张
- 📏 256×256像素,1英尺分辨率
- 🔗 官网
EuroSAT - Sentinel-2标准
- 🎨 RGB + 13波段版本
- 📊 10类,27,000样本
- 🏆 CNN准确率可达98.57%
- 🔗 GitHub
- 🤗 PyTorch数据集
Million-AID - 百万级数据集
- 🌍 51个场景类别
- 📚 层次化组织
- 🔗 官网
🚀 七、前沿:基础模型与多模态数据集
基础模型预训练数据集
1. SSL4EO-S12 - 自监督学习
- 🧠 专为地球观测设计
- 🔗 GitHub
2. GeoPile - 基础模型预训练
- 📦 编译自RSD46-WHU、MLRSNet等
- 🔗 GitHub
3. Satlas Pretrain - 大规模预训练
- 💾 Sentinel-2数据为主
- 🌐 全球覆盖
- 🔗 官网
4. EarthView from Satellogic
- 🛰️ Sentinel-1&2 + 1米RGB
- 🎯 面向基础模型
- 🔗 HuggingFace
视觉-语言多模态
ChatEarthNet - 影像配文本描述
- 💬 ChatGPT生成的图像描述
- 🛰️ Sentinel-2影像
- 🧠 赋能VLM地理基础模型
- 🔗 GitHub
VRSBench - 视觉语言基准
- 🌍 全球包容性数据集
- 🔗 官网
全球级大规模数据集
WorldStrat - 全球战略采样
- 🌍 10,000 km²独特位置
- 🎯 分层代表性(从农业到冰盖)
- 📏 1.5m/像素高分辨率
- 🔄 配套Sentinel-2时序数据(10m/像素)
- 🔗 GitHub
Five Billion Pixels - 50亿像素数据集
- 📏 4米高分二号影像
- 🇨🇳 覆盖中国
- 🎨 24个土地覆盖类别
- 🔗 官网
Fields of The World - 全球农田边界
- 🌾 农田边界实例分割
- 🌍 全球覆盖
- 🔗 官网
💡 八、实用工具与平台
Google Earth Engine (GEE)
为什么选择GEE?
- ☁️ 云端处理,无需下载PB级数据
- 🚀 支持大规模并行计算
- 🆓 科研教育免费
核心资源:
实用项目:
- ee-fastapi - GEE后端的洪水检测API
- wxee - GEE导出到xarray,支持PyTorch/TensorFlow
AWS & Microsoft平台
AWS优势:
- 📦 免费Landsat/Sentinel数据
- 🔧 配套分析工具
- 💻 EC2计算支持
Microsoft优势:
- 🖥️ Planetary Computer - Dask+JupyterHub
- 🌍 全球建筑足迹数据
- 🔗 源码
🎮 九、实战竞赛推荐
当前热门竞赛
| 竞赛 | 任务 | 奖金/影响力 | 链接 |
|---|---|---|---|
| FLAIR | 语义分割+域适应 | IGN官方 | Codalab |
| DrivenData系列 | 洪水/藻华/云检测 | 奖金池 | 官网 |
| xView挑战 | 多任务(渔船/建筑损毁) | 美国国防部 | 官网 |
DrivenData精选竞赛 🏆
1. Tick Tick Bloom - 藻华检测
- 🌊 检测和分类有害藻华
- 🛰️ 多源卫星数据
- 💰 有奖金池
- 🔗 竞赛链接
2. Detect Floodwater - 雷达洪水检测
- 📡 SAR影像洪水识别
- 🎯 语义分割任务
- 🔗 竞赛链接
3. Cloud Cover Detection - 云层识别
- ☁️ Sentinel-2云检测
- 🎨 像素级分类
- 🔗 竞赛链接
4. Overhead Geopose Challenge - 姿态估计
- 📐 从单视角斜视影像预测地心姿态
- 🌍 高精度定位
- 🔗 竞赛链接
5. Building Segmentation for Disaster Resilience
- 🏚️ 建筑分割支持灾害应对
- 🚨 实际应用价值高
- 🔗 竞赛链接
SpaceNet系列竞赛 🛰️
SpaceNet是业界最权威的遥感AI竞赛平台,已举办8届:
竞赛演进史:
| 届次 | 主题 | 亮点 | 数据集 |
|---|---|---|---|
| SpaceNet 1 | 建筑检测 | Rio de Janeiro | AWS |
| SpaceNet 2 | 建筑检测 | 多城市扩展 | AWS |
| SpaceNet 3 | 道路网络提取 | 矢量化道路 | AWS |
| SpaceNet 4 | 离轴建筑 | 非垂直拍摄 | AWS |
| SpaceNet 5 | 道路网络 | 图结构表示 | AWS |
| SpaceNet 6 | 多传感器建筑 | SAR+光学融合 | AWS |
| SpaceNet 7 | 时序城市变化 | 🔥最具挑战 | AWS |
| SpaceNet 8 | 洪水检测 | 多类别分割 | AWS |
SpaceNet 7 深度解析 🌟:
IEEE GRSS系列竞赛 🎓
Data Fusion Contest 2022 (DFC2022)
2025 DFC Track 1 - 全天候地表覆盖
- 📡 SAR数据专题
- ☁️ 不受天气影响
- 🛰️ 使用Umbra和Capella Space数据
- 🔗 OpenEarthMap-SAR
AI4EO挑战赛 🇪🇺
Enhanced Sentinel-2 Agriculture
- 🌾 耕地识别
- 🛰️ Sentinel-2时序数据
- 🔗 平台链接
学术界标杆竞赛
1. DOTA Object Detection Challenge
- 📊 大规模旋转目标检测
- ✈️ 飞机、船舶、车辆等
- 🎯 业界benchmark
- 🔗 官网
2. 高分挑战赛
- 🇨🇳 中国遥感数据竞赛
- 📥 可在gaofen-challenge.com下载
- 💻 2020基线代码
3. CaBuAr野火检测
- 🔥 加州燃烧区域划分
- 🎓 学术研究导向
- 🔗 HuggingFace
企业主导的实战挑战
Airbus系列
- 🚢 Ship Detection - 船舶检测
- ⛽ Oil Storage - 油罐识别
- ✈️ Aircraft Detection - 飞机识别
- 🌀 Wind Turbines - 风机分类
- 💰 有商业应用价值
- 🔗 Kaggle合集
🔬 十、专业应用场景数据集
🌡️ 气象与气候数据集
Digital Typhoon Dataset - 数字台风
- 🌀 长期时空数据
- 🎯 机器学习模型基准测试
- 🔗 GitHub
WeatherBench系列
- 🌍 全球天气预报基准
- 📊 多种分辨率
- 🔗 官网
🐟 渔业与海洋监测
NOAA Steller Sea Lion Count
- 🦭 从航空影像计数海狮
- 🎓 Kaggle经典竞赛
- 🔗 竞赛链接
- 💻 代码实现:
SeaDronesSee - 海上无人机数据集
- 🚁 海上搜救视觉基准
- 🎯 边界框检测、单目标追踪、多目标追踪
- 🔗 GitHub
LitterLines - 海洋垃圾检测
- 🌊 PlanetScope影像中的海洋垃圾
- 📝 带标注数据集
- 🔗 GitHub
🏭 工业设施监测
Oil and Gas Infrastructure Mapping (OGIM)
- ⛽ 油气基础设施位置
- 💨 甲烷排放源识别
- 🔗 Zenodo
Thermal Power Plants
- 🏭 火电厂排放监测
- 📊 包含位置和设施属性
- 💻 论文代码
SolarDK - 太阳能电池板
- ☀️ 高分辨率城市太阳能板
- 🏙️ 分类和定位
- 📖 论文
Overhead Wind Turbine Dataset
- 🌬️ 风力涡轮机检测
- 🛰️ 使用NAIP影像
- 🔗 Zenodo
🌾 精细农业数据集
CropNet - 气候变化感知作物预测
- 🌡️ 考虑气候变化因素
- 💾 TB级多模态数据
- 🔗 GitHub
TimeMatch - 跨区域作物适应
- 🇪🇺 欧洲四个地区
- 🔄 域适应研究
- 🔗 Zenodo
Space2Ground - 空天地协同
- 🛰️ Sentinel-1/2卫星数据
- 📸 街景图像
- 🌾 作物类型标注
- 🔗 GitHub
IRRISIGHT - 灌溉分类
- 💧 灌溉分类、土壤水分制图
- 📊 大规模多模态数据集
- 🔗 GitHub
🏔️ 地质与地形数据集
DEM (数字高程模型)资源:
- 🗻 SRTM - Shuttle Radar Topography Mission
- 🌍 Copernicus DEM - 云优化GeoTIFF格式
- 📚 Awesome-DEM
GDCLD - 滑坡检测
- 🏔️ 同震滑坡制图
- 🛰️ 多源高分辨率影像
- 🔗 Zenodo
🚗 交通与车辆数据集
VEDAI - 航空车辆检测
- 🚙 车辆边界框标注
- 🔗 官网
COWC - 车辆检测与计数
VME - 中东车辆检测
- 🇦🇪 中东及其他地区
- 🛰️ 卫星影像基准
- 🔗 GitHub
Urban Vehicle Segmentation (UV6K)
- 🏙️ 城市车辆分割
- 📊 6000+标注
- 🔗 Zenodo
✈️ 飞机检测专题
RarePlanes - 真实+合成飞机
- 🎮 真实+合成影像
- ✈️ 详细飞机属性
- 🆓 AWS开放数据
- 📝 论文
- 🔗 AWS Registry
优秀项目:
- yoltv4 - YOLOv4实现
- rareplanes-yolov5 - YOLOv5 + 亚像素特征
SAR Aircraft Detection
- 📡 SAR飞机检测
- 🎯 7835个飞机目标
- 📏 224×224切片
- 🔗 GitHub
🏊 特殊目标检测
Swimming Pool Detection
- 🏊 游泳池和汽车
- 🏘️ 3750张住宅区卫星影像
- 🔗 Kaggle
APKLOT - 停车场分割
- 🅿️ 航空停车位分割
- 🔗 GitHub
Roofline Extraction - 屋顶线提取
- 🏠 3D建筑重建
- 🔗 GitHub
🧠 十一、深度学习框架集成数据集
PyTorch生态
TorchGeo 🔥 - 地理空间深度学习库
- 🎯 专为遥感设计的PyTorch扩展
- 📦 内置多个经典数据集
- 🔗 官网
内置数据集示例:
from torchgeo.datasets import EuroSAT, NAIP, Landsat8
# 加载EuroSAT
eurosat = EuroSAT(root='data/', download=True)
# 加载Sentinel-2
from torchgeo.datasets import Sentinel2
sentinel = Sentinel2(paths='path/to/sentinel2')
支持的数据集:
- ✅ EuroSAT (RGB & 13波段)
- ✅ Sentinel-2
- ✅ Landsat 8
- ✅ NAIP
- ✅ xView2
- ✅ 还有30+个数据集
TensorFlow生态
TensorFlow Datasets 集成:
import tensorflow_datasets as tfds
# 加载EuroSAT
dataset = tfds.load('eurosat', split='train')
# 加载UC Merced
ucmerced = tfds.load('uc_merced', split='train')
Fast.ai友好数据集
经典案例:
- 🌳 Amazon Rainforest - 多标签分类
- 🛣️ Massachusetts Roads - 道路分割
- 🏙️ Camvid分割迁移到遥感
教程资源:
🎓 十二、论文配套数据集
顶会数据集(CVPR/ICCV/ECCV)
WHU-Stereo - 立体匹配基准
- 🏔️ 高分辨率卫星立体像对
- 🎯 具有挑战性的基准
- 📝 CVPR论文
- 🔗 GitHub
DAHiTra - 层次化Transformer
遥感顶刊数据集(TGRS/RSE)
SEN12MS - Sentinel-1/2融合
- 🔄 多光谱多模态
- 🌍 全球覆盖
- 📊 广泛引用
- 🔗 GitHub
- 📚 Papers with Code
GID-15 - 高分影像数据集
- 🇨🇳 中国高分卫星
- 🎯 大规模分类
- 🔗 官网
变化检测论文数据集
LEVIR-CC - 变化描述
- 💬 变化检测+文本描述
- 📝 50385个句子
- 🔗 GitHub
Hi-UCD - 超高分辨率城市变化
- 🏙️ 城市语义变化
- 🔗 GitHub
🌟 十三、新兴数据集与趋势
基础模型时代的数据集
PhilEO - 欧空局基础模型数据集
PhilEO-downstream (400GB):
- 🏗️ 建筑密度估计
- 🛣️ 道路分割
- 🌳 土地覆盖分类
- 🔗 HuggingFace
PhilEO-pretrain (500GB):
- 🌍 全球Sentinel-2影像
- 🧠 专为模型预训练设计
- 🔗 HuggingFace
SeeFar - 卫星无关多分辨率
- 🔄 传感器无关设计
- 🌊 海岸碳监测应用
- 🔗 官网
多模态融合数据集
AI2-S2-NAIP - 多源对齐
- 🛰️ NAIP + Sentinel-2 + Sentinel-1 + Landsat
- 🇺🇸 覆盖美国全境
- 🔗 HuggingFace
SICKLE - 多传感器农业
- 🌾 关键作物参数标注
- 📡 Landsat-8 + Sentinel-1 + Sentinel-2
- 🔗 GitHub
GAMUS - 几何感知多模态
- 🏙️ 城市结构理解
- 🔗 GitHub
时序数据集新星
DynamicEarthNet
- 📅 每日多光谱
- 🔄 语义变化分割
- 🔗 GitHub
CanadaFireSat - 加拿大火灾
- 🔥 Sentinel-2 L1C时间序列
- 🇨🇦 覆盖加拿大
- 🔗 GitHub
ssl4eco - 生态系统多样性
- 🌍 全球地理和物候多样性
- 🔗 GitHub
超分辨率数据集
MuS2 - Sentinel-2超分辨率
- 📏 多图像超分辨率
- 🔗 Harvard Dataverse
SEN2VENµS - 超分辨率训练
- 🎯 匹配的Sentinel-2和VENµS数据
- 🔗 Zenodo
Planet-CR - 云移除
🛠️ 十四、数据处理工具推荐
数据下载工具
Sentinel数据下载:
Landsat工具:
- 🌈 landsat-mosaic-latest - 自动更新的无云镶嵌
- 🔗 GitHub
数据预处理
Xarray后端:
- 📊 xarray-sentinel - Sentinel-1数据处理
- 🔗 GitHub
坐标转换:
- 🗺️ GDAL/OGR - 地理空间数据抽象库
- 🐍 rasterio - Python栅格数据I/O
- 🌍 geopandas - 地理数据框架
数据增强库
albumentations 🎨 - 最强数据增强
import albumentations as A
transform = A.Compose([
A.RandomRotate90(),
A.Flip(),
A.Transpose(),
A.RandomBrightnessContrast(p=0.2),
])
- 🚀 快速高效
- 🛰️ 支持多通道遥感影像
- 📝 遥感教程
TorchGeo transforms:
from torchgeo.transforms import AugmentationSequential
可视化工具
遥感影像可视化:
- 🎨 matplotlib + rasterio - 基础组合
- 📊 folium - 交互式地图
- 🗺️ leafmap - Jupyter中的地理空间分析
- 🎯 geemap - Google Earth Engine可视化
📊 十五、数据集选择指南
按任务类型选择
🎯 目标检测任务
| 应用场景 | 推荐数据集 | 难度 | 数据规模 |
|---|---|---|---|
| 入门学习 | DOTA | ⭐⭐ | 中 |
| 船舶检测 | HRSC2016, xView3 | ⭐⭐⭐ | 大 |
| 飞机检测 | RarePlanes | ⭐⭐ | 大 |
| 车辆检测 | COWC, VEDAI | ⭐⭐ | 中 |
| 小目标 | AI-TOD | ⭐⭐⭐⭐ | 中 |
🎨 语义分割任务
| 应用场景 | 推荐数据集 | 特色 | 链接 |
|---|---|---|---|
| 建筑分割 | Inria, SpaceNet | 多城市 | 链接 |
| 道路提取 | Massachusetts Roads | 经典基准 | 链接 |
| 土地覆盖 | EuroSAT, FLAIR | 欧洲数据 | 链接 |
| 农田分割 | UKFields, Sen4AgriNet | 大规模 | 链接 |
🔄 变化检测任务
| 数据集 | 时间跨度 | 标注类型 | 推荐指数 |
|---|---|---|---|
| LEVIR-CD | 5-14年 | 建筑变化 | ⭐⭐⭐⭐⭐ |
| S2Looking | 多时相 | 侧视角 | ⭐⭐⭐⭐ |
| xView2 | 灾前灾后 | 损毁等级 | ⭐⭐⭐⭐⭐ |
| SpaceNet 7 | 月度 | 城市发展 | ⭐⭐⭐⭐⭐ |
按传感器类型选择
🛰️ 光学影像
-
高分辨率 (< 1m):
- ✅ Maxar Open Data
- ✅ NAIP (0.6m)
- ✅ Planet (3m)
-
中分辨率 (10-30m):
- ✅ Sentinel-2 (10m)
- ✅ Landsat 8 (30m)
📡 SAR影像
- 船舶检测: SSDD, xView3
- 洪水监测: Sen4AgriNet SAR部分
- 全天候应用: Sentinel-1数据集
🎨 多光谱/高光谱
- 高光谱: AeroRIT, HySpecNet-11k
- 多光谱: Sentinel-2 (13波段)
按研究阶段选择
🔰 初学者入门 (前3个月)
-
EuroSAT - 土地覆盖分类
- 小巧易用
- PyTorch内置
- 快速上手
-
UC Merced - 场景分类
- 经典数据集
- 可视化友好
-
Kaggle Ship Detection - 目标检测
- 数据质量高
- 社区活跃
🎓 进阶研究 (3-12个月)
- SpaceNet - 多任务挑战
- xView - 大规模检测
- DOTA - 旋转目标
🚀 前沿探索 (12个月+)
- 自建数据集 + 公开数据
- 基础模型预训练
- 跨模态研究
核心资源传送门 🔗:
- 📚 官方网站:satellite-image-deep-learning.com
- 💻 GitHub主仓库:satellite-image-deep-learning
更多推荐
所有评论(0)