pandas教程:[10]groupby选择列和迭代
groupby对象可以按照列选择数据,这种做法可以减少运算量,提高运算速度。而这里讲的迭代就是对各个组进行迭代以便对各个组进行不同的操作,因为进行相同的操作不必使用迭沪枭诽纾代。
引入相关模块![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/a749bb0f94fc508cd3da164b01775ddd894cfdab.jpg)
创建一个DataFrame对象,有两个index和两个column![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/3201a8f39187031cced47e4f6a86242fa972ecab.jpg)
打印一下,看看DataFrame到底有哪些内容![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/fab31cb375d7997bd7e00bebf9dade49600fd9ab.jpg)
以color index进行分类,然后选择a列数据,分组计算a列数据的总数
计算结果为:![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/35f2224133bad34194693084427622bc7cc52ca8.jpg)
假如我们不选择a列,直接计算总数,可以得到。如果我们不需要b列的数据,那么显然事先选择a列进行计算可以减少无效的运算![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/c3c22dbf3bef354ffaac658d23db574afb321ba8.jpg)
![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/a1780d1fceecd3d9d261237767995943050108a8.jpg)
迭代输出各个组的数据:
输出结果:![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/04201aa355e983ae34c3889968efe078153169a8.jpg)
假如分类索引有两个,分别是color和food
这时候迭代的结果显示,名称变为一个元组:![pandas教程:[10]groupby选择列和迭代](https://exp-picture.cdn.bcebos.com/65390a23beb9763e32d76a656ad06de89b61b0a8.jpg)
致力于数据分析的同行,欢迎与我联系交流