Python Pandas - 返回删除重复值并保留最后一次出现的索引
pythonpandasserver side programmingprogramming
要返回删除重复值并保留最后一次出现的索引,请使用 index.drop_duplicates() 方法。使用 keep 参数,值为 last。
首先,导入所需的库 −
import pandas as pd
创建带有一些重复项的索引−
index = pd.Index(['Car','Bike','Airplane','Ship','Airplane'])
显示索引 −
print("Pandas Index with duplicates...\n",index)
返回删除了重复值的 Index。值为 "last" 的 "keep" 参数保留每组重复条目的最后一次出现 −
print("\n删除重复值的索引(保留最后一次出现的值)...\n",index.drop_duplicates(keep='last'))
示例
以下是代码 −
import pandas as pd # 创建包含一些重复项的索引 index = pd.Index(['Car','Bike','Airplane','Ship','Airplane']) # 显示索引 print("Pandas Index with duplicates...\n",index) # 返回数据的 dtype print("\ndtype 对象...\n",index.dtype) # 获取数据中的字节 print("\nGet the bytes...\n",index.nbytes) # 获取数据的维度 print("\nGet the Dimensions...\n",index.ndim) # 返回删除了重复值的索引 # 值为 "last" 的 "keep" 参数保留每组重复条目的最后一次出现 print("\n删除重复值的索引(保留最后一次出现的值)...\n",index.drop_duplicates(keep='last'))
输出
这将产生以下代码 −
Pandas Index with duplicates... Index(['Car', 'Bike', 'Airplane', 'Ship', 'Airplane'], dtype='object') dtype 对象... object Get the bytes... 40 Get the dimensions... 1 删除重复值的索引(保留最后一次出现的值)... Index(['Car', 'Bike', 'Ship', 'Airplane'], dtype='object')