7006

2019新型冠状病毒疫情时间序列数据仓库

DXY-COVID-19-Data

新冠病毒 疾病数据 统计数据

github上开源的一个项目;2019新型冠状病毒(COVID-19/2019-nCoV)疫情状况的时间序列数据仓库,数据来源为丁香园。

免积分下载
大雄
2020年03月25日

相关数据

 电子显微镜下骨细胞图像分割数据集
电子显微镜下骨细胞图像分割数据集
来自Open-i的电子显微镜下骨细胞图像分割数据集 免积分下载
带标注的疟疾细胞图片数据集
带标注的疟疾细胞图片数据集
间日疟原虫感染人血涂片细胞图片标注数据集 免积分下载
蒙哥马利县X射线照片数据集
蒙哥马利县X射线照片数据集
该数据集中的X射线图像来自美国马里兰州蒙哥马利县卫生与人类服... 免积分下载

数据介绍

本项目为2019新型冠状病毒(COVID-19/2019-nCoV)疫情状况的时间序列数据仓库,数据来源为丁香园

数据由2019新型冠状病毒疫情实时爬虫获得,每小时检测一次更新,若有更新则推送至数据仓库中。

CSV文件列表

  1. 全国数据DXYOverall.csv
  2. 地区数据DXYArea.csv(包含英文城市名)
  3. 新闻数据DXYNews.csv
  4. 谣言数据DXYRumors.csv

数据说明:

1、部分数据存在重复统计的情况,如Issue #21中所述,河南省部分市级数据存在"南阳(含邓州)"及"邓州"两条数据,因此在求和时"邓州"的数据会被重复计算一次。

数据异常:

目前发现浙江省/湖北省部分时间序列数据存在数据异常,可能的原因是丁香园数据为人工录入,某些数据可能录入错误,比如某一次爬虫获取的浙江省治愈人数为537人,数分钟后被修改回正常人数。

本项目爬虫仅从丁香园公开的数据中获取并储存数据,并不会对异常值进行判断和处理,因此如果将本数据用作科研目的,请自己对数据进行清洗。同时,我已经在Issue中开放了异常数据反馈通道,可以直接在此问题中反馈潜在的异常数据,我会定期检查并处理。

更多信息请查看GitHub仓库。

还没有任何文件记录.