Python Pandas - 返回索引,其中删除了除第一次出现之外的重复值
pythonpandasserver side programmingprogramming
要返回索引,其中删除了除第一次出现之外的重复值,请使用 index.drop_duplicates() 方法。使用 keep 参数,值为 first。
首先,导入所需的库 −
import pandas as pd
创建带有一些重复项的索引 −
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
显示索引 −
print("Pandas Index with duplicates...\n",index)
返回删除了重复值的 Index。值为 "first" 的 "keep" 参数保留每组重复条目的第一次出现 −
index.drop_duplicates(keep='first')
示例
以下是代码 −
import pandas as pd # 创建包含一些重复项的索引 index = pd.Index(['Car','Bike','Airplane','Ship','Airplane']) # 显示索引 print("Pandas Index with duplicates...\n",index) # 返回数据的 dtype print("\ndtype对象...\n",index.dtype) # 获取数据中的字节 print("\nGet the bytes...\n",index.nbytes) # 获取数据的维度 print("\nGet the Dimensions...\n",index.ndim) # 返回已删除重复值的索引 # 值为"first"的"keep" 参数保留每组重复条目的第一次出现 print("\nIndex with duplicate values removed (keeping the first occurrence)...\n",index.drop_duplicates(keep='first'))
输出
这将产生以下代码 −
Pandas Index with duplicates... Index(['Car', 'Bike', 'Airplane', 'Ship', 'Airplane'], dtype='object') dtype 对象... object Get the bytes... 40 Get the dimensions... 1 Index with duplicate values removed (keeping the first occurrence)... Index(['Car', 'Bike', 'Airplane', 'Ship'], dtype='object')