2022-07-20 10:16:37 索煒達(dá)電子 712
文件編號(hào):C15
文件大?。?/strong>46M
開發(fā)環(huán)境:Python3.8、PyCharm2020
猿創(chuàng)承諾:該項(xiàng)目親測(cè)正常運(yùn)行,需遠(yuǎn)程調(diào)試部署另外收費(fèi),確保正常使用,不能正常使用全額退款。
簡要概述:新型冠狀病毒肺炎確診病例活動(dòng)軌跡數(shù)據(jù)處理
疫情軌跡數(shù)據(jù)處理
1. chinadata文件夾:全國病例軌跡,地點(diǎn)和鏈接數(shù)據(jù),鏈接數(shù)據(jù)就是我們正在收集的文本數(shù)據(jù)來源
2. datadetail文件夾:每個(gè)省份的按每個(gè)病例分來的文本數(shù)據(jù),目前只有海南省的,其他的省份還需要爬取數(shù)據(jù)之后,從新聞內(nèi)容中獲取
3. allchinadata.py用于合并chinadata文件夾中的全國數(shù)據(jù)表,生成文檔為:allchinadata.csv,同時(shí)選出url列的域名部分?jǐn)?shù)據(jù),放在url.csv文檔中。
4. chinadata.py用于獲取全國數(shù)據(jù),生成chinadata文件夾中的數(shù)據(jù)表,注意這個(gè)是追加方式,重新獲取的話要?jiǎng)h除chinadata文件夾中的表格,再運(yùn)行程序。這個(gè)程序需要改進(jìn)一下,獲取字段中的is_today,需要修改成當(dāng)天爬取日期,然后修改程序?yàn)樵隽颗廊∧J健?/p>
5. hn-datadetail.py用于海南按每個(gè)病例分來的文本獲取,因?yàn)楹D蠑?shù)據(jù)比較規(guī)整,不需要從新聞文本中分割獲得。已經(jīng)運(yùn)行結(jié)果保存在datadetail文件夾。
演示視頻:
點(diǎn)擊查看:系統(tǒng)演示視頻
運(yùn)行結(jié)果:
遠(yuǎn)程協(xié)助:
溫馨提示:索煒達(dá).猿創(chuàng)官方提供收費(fèi)遠(yuǎn)程協(xié)助,確保您項(xiàng)目運(yùn)行成功。
點(diǎn)擊查看:遠(yuǎn)程協(xié)助相關(guān)事項(xiàng)
我們提供完整項(xiàng)目文件清單如下:
文件目錄
├ 1.項(xiàng)目源碼
├ 2.運(yùn)行截圖
└ 3.演示視頻