使用 Pandas 查找给定 Excel 表中的利润和损失

pythonpandasserver side programmingprogramming

Pandas 是 Python 中流行的数据操作和分析库,被数据科学家和分析师广泛使用。它提供了几个用于处理 Excel 表中数据的函数。分析财务数据的最常见任务之一是查找给定 Excel 表中的利润和损失。

设置

要使用 Python 处理 Python 中的 excel 文件,您需要安装 openpyxl 依赖项。为此,请打开终端并输入命令 -

pip install openpyxl

安装成功后,您可以继续尝试使用 Excel 文件和电子表格。

要下载以下练习中使用的 Excel 电子表格,请查看此链接

算法

要将数据从 Excel 文件读入 Pandas DataFrame,请使用 Pandas 内置的方法 read_excel()。我们必须从总收入中扣除全部成本才能计算出盈亏。以下步骤可用于总结利用 Pandas 计算盈亏的算法 -

  • 使用 read_excel() 方法将 Excel 工作表读入 Pandas DataFrame。

  • 应使用新的盈亏列更新 DataFrame。

  • 从总收入中减去总成本以确定每行的盈亏。

  • 将 DataFrame 中的盈亏列相加以确定总盈亏。

示例 1

以下代码读取名为 'sales.xlsx' 的 Excel 工作表并创建 DataFrame。然后,它为利润和损失添加一个新列,并计算每行的利润和损失。

import pandas as pd

# 将 excel 表读入 pandas 数据框
df = pd.read_excel('sales.xlsx')

# 计算总成本
df['Total Cost'] = df['Units Purchased'] * df['Unit Cost']

# 计算总收入
df['Total Revenue'] = df['Units Sold'] * df['Unit Price']

# 计算利润/损失
df['Profit/Loss'] = df['Total Revenue'] - df['Total Cost']

# 打印结果数据框
print(df)

# 将结果数据框保存到新的 excel 表
df.to_excel('sales_results.xlsx', index=False)

输出

Units Purchased	Unit Cost	Units Sold	Unit Price	Item Name	Total Cost	Total Revenue	Profit/Loss
    50	             5.00	       40             9.00	   Apples	    250.00	    360.0	     110.00
    100	             3.50	       80	      7.00	  Oranges	    350.00	    560.0	     210.00
    25	            12.00	       20	     15.00     Pineapples	    300.00	    300.0	       0.00
    75	             1.75	       60	      3.50	  Bananas	    131.25	    210.0	      78.75
    200	             0.50	      180	      1.25	  Carrots	    100.00	    225.0	     125.00
    450	             2.00	      120	      4.50	 Potatoes	    900.00	    540.0	    -360.00
    40	             8.00	       30	     12.00	 Avocados	    320.00	    360.0	      40.00
    80	             1.50	       70	      3.00	 Tomatoes	    120.00	    210.0	      90.00
    300	            20.00	       25	     25.00	  Mangoes	   6000.00	    625.0	   -5375.00
    60	             4.00	       45	      8.00	   Grapes	    240.00	    360.0	     120.00

在此示例中,我们首先导入 Pandas 库,然后使用 read_excel() 函数读取 Excel 表。然后,我们在数据框中创建新列,以计算每种产品的总成本、总收入和利润/亏损。最后,我们打印包含新列和计算值的结果数据框,并将其保存到新的 Excel 表中以供进一步处理。

示例 2:使用过滤器计算利润和亏损

import pandas as pd

# 将 excel 表读入 pandas 数据框
df = pd.read_excel('sales_results.xlsx')

# 过滤数据框以仅包含有利润的产品
df_profit = df[df['Total Revenue'] > df['Total Cost']]

# 计算总利润
total_profit = df_profit['Total Revenue'].sum() - df_profit['Total Cost'].sum()

# 过滤数据框以仅包含有损失的产品
df_loss = df[df['Total Revenue'] < df['Total Cost']]

# 计算总损失
total_loss = df_loss['Total Cost'].sum() - df_loss['Total Revenue'].sum()

# 打印总利润和总损失
print(f"Total Profit: {total_profit}")
print(f"Total Loss: {total_loss}")

输出

Total Profit: 773.75
Total Loss: 5735.0

首先导入 Pandas 库,然后使用 read_excel() 函数读取上一个示例中保存的结果 Excel 表。然后我们过滤数据框以仅包含有利润的产品并计算总利润。同样,我们过滤数据框以仅包含有损失的产品并计算总损失。最后,我们使用 print() 函数打印总利润和损失。

使用 Pandas 计算利润和损失的应用

  • 财务数据分析 - 企业可以使用 Pandas 检查其财务信息并确定各种商品和服务的利润和损失。

  • 投资分析 - 使用 Pandas,投资者可以检查公司的财务信息以确定其是否有利可图。

  • 业务预测 - 企业可以通过检查历史数据来使用 Pandas 预测未来的收入和损失。

结论

对于从 Excel 工作表分析和计算利润和损失,Pandas 是一个可以使用的强大 Python 包。 Pandas 是任何数据分析师或财务专家的重要工具,因为它具有简单的界面和强大的功能。开发人员可以利用 Pandas 分析他们的财务数据,并按照本文中给出的示例深入了解其业务的成功。


相关文章