本文目录导航:
从手写数字识别入门深度学习丨MNIST数据集详解
如同许多人通过Hello World开启编程旅程一样,MNIST数据集成为了众多深度学习研究者入门的起点。
MNIST,全称为Mixed National Institute of Standards and Technology数据库,是一个专为图像处理系统训练和测试设计的二进制图像集合,对于初学者来说,是深度学习中备受青睐的数据集之一。
让我们深入了解这个经典的数据集:
1. 数据集基础
2. 数据细节
3. 任务与评价
4. 文件结构
5. 获取资源
访问OpenDataLab获取MNIST数据集及相关资源,包括下载链接和更多学习资料。
收藏丨20个医疗场景经典、热门数据集资源汇总
人工智能在医疗领域的应用日益广泛,而医疗数据集在推动AI发展过程中发挥着关键作用。
本文将为大家介绍20个经典的医疗开源数据集,涵盖CT、MRI、内窥镜等多种模态数据,助力研究者探索和研发医疗AI大模型。
一、全身No.1 Medical Segmentation Decathlon发布方:MONAI Development Team发布时间:2019简介:医学分割十项全能是医学图像分割数据集的集合,包含大脑、心脏、肝脏等器官或部位的数据。
下载地址:二、头颈部No.2 Cephalometric X-ray Image发布方:台湾大学发布时间:2016简介:Cephalometric X-Ray数据集是一个头颅X射线图像数据集,可用于正畸分析和治疗计划制定。
下载地址:三、心脏No.4 ACDC Scribbles发布方:爱丁堡大学·意大利卢卡IMT高等研究学校发布时间:2021简介:ACDC数据集包含心脏MRI图像,与专家手工制作的分割掩模配对,可用于评估涂鸦监督训练方法的性能。
下载地址:四、胸部No.5 Chest-Xray8 (COVID-19)发布方:布里斯托尔大学·Medikal Park Hospital发布时间:2020简介:该数据集包含胸部X射线图像,包含COVID-19、肺炎和无发现三种标记。
下载地址:五、腹部No.8 CHAOS发布方:印第安纳大学·开罗大学·西北大学发布时间:2021简介:CHAOS是一个腹部CT造影图像和腹部MR造影图像数据集和挑战赛。
下载地址:(以下省略其他数据集介绍,完整内容请访问OpenDataLab官网:)
深度学习经典收藏 | 开源数据集大汇总
本文整理了国内外经典的开源数据集,涵盖了自动驾驶、目标检测、人脸识别、自然语言处理、文本检测、医学等领域的多个经典应用。
下面将详细介绍每个领域中的一些代表性的数据集。
一、自动驾驶领域数据集1. KITTI数据集:由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,旨在评估自动驾驶场景下的计算机视觉算法。
数据集包含市区、乡村和高速公路等场景,用于评测立体图像、光流、视觉测距、3D物体检测和3D跟踪等技术,具有丰富的真实图像数据和标注信息。
2. CityScapes数据集:专注于城市街景的语义理解,包含不同季节和天气条件下的街景图像。
该数据集提供精细和粗糙两种评测标准,广泛应用于目标检测、语义分割等领域。
3. BDD100K数据集:伯克利大学AI实验室发布的公开驾驶数据集,包含10万段高清视频,每视频约40秒,用于研究计算机视觉算法在不同条件下的表现。
4. nuScenes数据集:Motional团队开发的大型自动驾驶数据集,覆盖波士顿和新加坡两个城市的驾驶场景,用于研究计算机视觉算法在不同城市、天气和车辆类型下的通用性。
二、目标检测数据集1. COCO数据集:微软团队提供,用于目标识别、图像分割等任务,包含200K以上已标注图像、150万个对象实例和80个对象类别。
2. PASCAL VOC数据集:PASCAL视觉对象分类挑战赛的数据集,包含2007和2012两个版本,用于目标检测、目标分类等任务。
3. OpenImage数据集:由Google发布,包含约900万张图像URL,用于训练深度神经网络。
三、人脸识别类数据集1. YouTube Face DB数据集:包含1,595个不同人的3,425个视频,用于研究非受限情况下的视频中人脸识别。
2. CelebA数据集:大规模面部属性数据集,包含超过20万名人图像,每个图像有40个属性注释,适合研究人脸属性识别。
3. IMDB-WIKI数据集:由IMDB数据库和Wikipedia数据库组成,用于年龄和性别识别研究。
4. LFW数据集:用于研究非受限情况下的人脸识别问题,包含张人脸图像,用于验证人脸识别模型。
四、人体姿态估计类数据集1. LSP数据集:由利兹大学发布,包含约2000个姿势注释,用于研究体育姿势。
2. FLIC数据集:宾夕法尼亚大学-工程与应用科学学院GRASP实验室发布,用于研究电影场景中的人体姿态估计。
3. MPII Human Pose数据集:包含约张标注图像,用于评估人体姿势估计模型。
五、文本检测类数据集1. MNIST数据集:手写数字数据库,包含个训练样本集和个测试样本集,用于深度学习入门。
2. SVHN数据集:用于开发机器学习和对象识别算法,包含600,000位数字图像,适合解决现实场景中的数字识别问题。
3. CCPD数据集:用于车牌识别,包含30万张图片,适合训练车牌识别模型。
六、NLP数据集1. Common Voice数据集:Mozilla发起的语音识别数据库,包含全球各地的语音数据,用于训练语音识别模型。
2. LibriSpeechASR数据集:包含1000小时的有声书录音,适合入门级语音识别模型训练。
3. 20NewsGroups数据集:用于文本分类、文本挖掘和信息检索研究,包含20,000左右的新闻组文档。
4. Mandarin Chinese Scripted Speech Corpus数据集:包含755个小时的中文普通话朗读音频和转写文本,用于语音识别训练。
七、医学类数据集Covid-CT数据集:包含COVID-19患者和非患者的CT图像数据,用于研究COVID-19的影像学特征。
评论(0)