客至汲泉烹茶, 抚琴听者知音

pandas

前言我需要国家重点监控企业名单数据,网上找了一下,最新数据是2017年,网址如下:https://www.cenews.com.cn/company/201711/t20171116_858015.html。写个爬虫脚本把所有pdf下载下来后,遇到个大问题:pdf肯定是无法直接使用的,我需要把他们转为DataFrame格式方便分析。python方案首先我用的肯定是python,搜了一下貌似大...

前言这周一就想写这篇博客的,不过最近事务繁忙(拖延症犯了),一直拖到今天才写好几个函数,本来打算是分析一下疫情态势,不过想想我又不擅长数据分析,而且全球疫情瞬息万变,不如写一篇教程,授人以渔嘛。于是代码就先写到这里吧,感觉基本功能已经够了,如果你有新需求,可以在评论区留言,我有空就继续写。这篇博客的代码可以让你:获取全球以及中国分省市疫情数据,进行清洗与分析,最后获得一些关键指标,如累计数据...

这是github上的一个项目,作为数据分析基础入门是非常好的,于是我把它译为中文,希望对大家有所帮助。原文地址代码均已在本地测试通过。要求在此存储库中,我将记录收集数据,处理数据并进行可视化的完整过程。该项目中使用的数据集是国家数据-社会保障卡应用中心的婴儿名字,其中包括1880年至2018年的记录。需要安装python3与以下库:Requests - 下载数据集.pandas - 进行数据...