首页 存档 技术 查看内容

Python之Pandas学习(三) 六、合并 七、分组 八、Reshaping 九、时间序列 十、Catego ...

2018-3-30 13:00 |来自: 互联网 433 0

摘要: 六、合并 Pandas提供了大量的方法能够轻松的对Series,DataFrame和Panel对象进行各种符合各种逻辑关系的合并操作。 Concat Join类似于SQL类型的合并,具体请参阅:Database style joining Append将一行连接 ...

六、合并


Pandas提供了大量的方法能够轻松的对Series,DataFrame和Panel对象进行各种符合各种逻辑关系的合并操作。


Concat



Join类似于SQL类型的合并,具体请参阅:Database style joining



Append将一行连接到一个DataFrame上,具体请参阅Appending:



七、分组


对于”group by”操作,我们通常是指以下一个或多个操作步骤:


(Splitting)按照一些规则将数据分为不同的组;


(Applying)对于每组数据分别执行一个函数;


(Combining)将结果组合到一个数据结构中;



1、分组并对每个分组执行sum函数:



2、通过多个列进行分组形成一个层次索引,然后执行函数:



八、Reshaping


Stack



数据透视表,详情请参阅:Pivot Tables.



可以从这个数据中轻松的生成数据透视表:



九、时间序列


Pandas在对频率转换进行重新采样时拥有简单、强大且高效的功能(如将按秒采样的数据转换为按5分钟为单位进行采样的数据)。这种操作在金融领域非常常见。具体参考:Time Series section。



1、时区表示:



2、时区转换:



3、时间跨度转换:



4、时期和时间戳之间的转换使得可以使用一些方便的算术函数。



十、Categorical


从0.15版本开始,pandas可以在DataFrame中支持Categorical类型的数据,详细介绍参看:categorical introduction和API documentation。



1、将原始的grade转换为Categorical数据类型:



2、将Categorical类型数据重命名为更有意义的名称:



3、对类别进行重新排序,增加缺失的类别:



4、排序是按照Categorical的顺序进行的而不是按照字典顺序进行:



5、对Categorical列进行排序时存在空的类别:



十一、画图



对于DataFrame来说,plot是一种将所有列及其标签进行绘制的简便方法:



十二、导入和保存数据


1、写入csv文件:



2、从csv文件中读取:



HDF5,参考:HDFStores


1、写入HDF5存储:



2、从HDF5存储中读取:



Excel,参考:MS Excel


1、写入excel文件:



2、从excel文件中读取:


(来源:天天财经优选)


注:点击阅读原文,体验对冲头条H5!

声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部