Home | 简体中文 | 繁体中文 | 杂文 | Github | 知乎专栏 | 51CTO学院 | CSDN程序员研修院 | OSChina 博客 | 腾讯云社区 | 阿里云栖社区 | Facebook | Linkedin | Youtube | 打赏(Donations) | About
知乎专栏多维度架构

12.4. 序列

Series:是一种类似于一维数组的对象,是由一组数据和一组与之相关的数据标签(即索引)组成。

Series 创建方式有两种:

Series 参数:

12.4.1. 创建 Series 对象

		
import pandas as pd

print('-' * 20, '通过数组创建 Series', '-' * 20)
ser = pd.Series(['a', 'b', 'c', 'd', 'e'])
print(ser)

print('-' * 20, '通过列表创建 Series', '-' * 20)
ser = pd.Series(list(range(5)), index=['a', 'b', 'c', 'd', 'e'])
print(ser)

print('-' * 20, '通过字典创建 Series', '-' * 20)
d = {'a': 1, 'b': 2, 'c': 3}
ser = pd.Series(data=d, index=['a', 'b', 'c'])
print(ser)

print('-' * 20, '指定常量创建 Series', '-' * 20)
ser = pd.Series(5, index=[1, 2, 3, 4, 5])
print(ser)

		
		

12.4.2. Series 运算

		
import pandas as pd

s1 = pd.Series(data=[1, 2, 3, 4, 5], index=["a", "b", "c", "d", "e"])
s2 = pd.Series(data=[1, 2, 3, 4, 5], index=["a", "b", "c", "e", "f"])
ser = s1 + s2
print(ser)		
		
		
		
a    2.0
b    4.0
c    6.0
d    NaN
e    9.0
f    NaN
dtype: float64		
		
		

12.4.3. Series 常用方法

12.4.3.1. head() /tail()

			
import pandas as pd
import string
data = [chr(x) for x in range(ord('a'), ord('z') + 1)]
res = pd.Series(data, index=list(string.ascii_lowercase))
# 原始数据
print(res)
# 查看前三个
print(res.head(3))
# 查看后两个
print(res.tail(2))			
			
			

12.4.3.2. isnull() / notnull()

			
print('-' * 20, '筛选出非空的正常数据', '-' * 20)
print(ser[ser.notnull()])
print('-' * 20, '筛选出空的数据', '-' * 20)
print(ser[ser.isnull()])
			
			
			

12.4.3.3. 去重复数据

			
import pandas as pd
s = pd.Series(data=[1, 1, 3, 2, 3, 4, 5, 6, 5, 6, 7, 6, 9, 7, 8, 10])
print(s.unique())			
			
			

输出结果

			
[ 1  3  2  4  5  6  7  9  8 10]