地理空间数据库课程作业:空间分析
了解空间数据在日常生活中的应用,熟悉空间数据统计分析、空间数据挖掘、空间数据可视化等技术。
新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)疫情肆虐全球多个国家,2020年3月11日,世界卫生组织 (WHO) 正式宣布将新冠肺炎列为全球性大流行病。在全球抗击新型冠状病毒疫情的过程中,产生了前所未有的大规模疫情数据,利用大数据分析技术和方法能够协助发现病毒传染源、监测疫情发展、调配救援物资,从而更好地进行疫情防控工作。空间数据分析作为大数据分析的重要组成,将数据智能处理、直观展示和交互分析有机地结合,使机器智能和人类智慧深度融合、优势互补,为疫情防控中的分析、指挥和决策提供有效依据和指南。
作业要求以新冠疫情或其它重大公共卫生事件的相关时空数据为基础,利用数据清洗与管理、统计分析、数据挖掘、数据可视化等相关技术和方法,探索并发现疫情大数据背后隐藏的模式和规律。请选择一个具体的研究题目,进行深入分析。
本项目希望能利用交互式空间数据分析技术,感知和预测疫情发展趋势与关键节点、分析社交媒体话题与情感的动态演变、对社会舆情进行态势感知。
china_provincedata.csv 中国各省、直辖市、自治区、特别行政区的疫情数据
countrydata.csv 全球214个国家地区以及钻石公主号邮轮的疫情数据
nCoV_900k_train.unlabled.csv
数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)。
nCoV_100k_train.labled.csv 同上,有标注
数据集太大了就先不上传了
nCov_10k_test.csv 同上
yqkx_data-5_21.csv 使用爬虫获取的人民网疫情快讯新闻100篇
中国社会组织_疫情防控-5_21.csv 中国社会组织公共服务平台疫情防控专区新闻
weiboComments-5_21.csv 5.21微博《战疫情》主题下的微博和评论数据
运行 server.py 打开 http://127.0.0.1:5000/