使用电子表格进行数据分析

data sciencepandasserver side programming

清理、转换和分析原始数据是获取有用、相关信息的第一步,这些信息可以帮助企业做出明智的结论。

通过提供相关信息和事实(通常以图表、图片、表格和图形的形式呈现),该策略有助于降低与决策相关的风险。

数据分析涉及将未处理的数据转换为相关统计数据、知识和解释的过程。

数据分析是一项关键能力,可以支持更好的决策。

电子表格是数据分析最常用的工具,内置数据透视表是最受欢迎的分析工具。

电子表格中的数据分析函数

电子表格包含数百个函数,因此很难尝试将正确的公式与正确的数据分析类型相匹配。最重要的函数不一定是最难实现的。让我们讨论一些简单的函数,它们将提高您的数据解释技能。

Concatenate()

最容易理解但最有效的数据分析公式之一是 =CONCATENATE。每个单元格都可以包含来自多个单元格的数字、文本、日期和许多其他信息。

语法

CONCATENATE (string1, string2, [string3], ...)

Len()

LEN() 函数用于显示每个单元格中存在的字母总数。它通常用于尝试区分产品编号或处理字符数有限制的内容。

语法

SYNTAX = LEN (text)

Days()

此函数 = DAYS 可用于确定两个日期之间有多少个日历天数。

语法

DAYS (from_date(ending date), to_date(starting date))

Networkdays()

Networkdays 属于电子表格中的日期/时间类别。每当调用此函数时,都会隐式省略周末的计数。

networkday 函数用于会计和财务。一个简单的用例可以根据工作天数、解决消费者问题所需的工作日数或项目期间可用的工作日数来确定员工的福利。

语法

NETWORKDAYS (starting_date, ending_date, [list of holidays])

Sumifs

=SUMIFS() 是许多数据分析师使用的"必须知道"的数据分析公式之一。

公式 =SUM 众所周知,但如果我们需要根据多个因素对数据求和,

我们可以使用 SUMIFS()。

语法

SUMIFS (range of sum , range_1, test_1, [range_2], [test_2], ...).)

在这里,您可以输入不同的标准来代替 test_1、test_2。

Averageifs()

与 SUMIFS 类似,AVERAGEIFS() 可让您计算基于参数的平均值。这些参数可以是一个或多个。

语法

AVERAGEIFS (average_range, range_1, test_1, [range_2], [test_2], ...)

Countsifs ()

使用电子表格进行数据分析的另一个有效工具是 COUNTIFS() 函数。

它大量模仿了 SUMIFS 函数。

COUNTIFS() 函数跟踪有多少个值满足给定的一组条件。

因此,它不需要像 SUMIFS 那样的范围。

COUNTIFS (range, criteria)

Counta()

单元格是否为空由 COUNTA 决定。

作为数据分析师,您会经常遇到不完整的数据集。

您可以使用 COUNTA 调查数据集中的任何间隙,而无需重新排列数据。

语法

COUNTA (value1, [value2], ...)

Vlookup()

垂直查找是缩写 VLOOKUP 的含义。

此函数指示电子表格在列(称为"表格数组")中搜索明确值,以从同一行中存在的不同列中检索项目。

VLOOKUP (item for lookup, matrix , col_indx_number, [lookup_rng])

Hlookup()

HLOOKUP 代表水平查找。每当我们想要在表格顶部的一行中搜索数据时,都会使用它。Hlookup 还可以在数据库中查找特定数量的行。

HLOOKUP (查找索引、矩阵、row_index_number、[lookup_rng])

If()

IF 函数非常有用。

借助此功能,我们可以自动对电子表格做出决策。

根据逻辑测试的结果,我们可以使用 IF() 指示电子表格进行新的计算或显示不同的值。

在 IF() 函数中,将执行测试,并且将预先为两种结果提供结果;即测试是成功还是失败;

例如让我们举一个例子,我们想判断一个数字是否为偶数。

这里的逻辑测试是计算除以 2 后的余数。

如果余数为 0,则答案为真,否则答案为假。

IF (test, [ans_if_test_successful], [ans_if_test_unsuccessful])

定位/搜索

Spreadsheets 的 FIND 函数给出一个字符串在另一个字符串中的位置(以数字表示)。

如果找不到文本,FIND 命令将返回 #VALUE 错误。

但是,=SEARCH 搜索"Bigger"将通过返回 Bigger 或 greater 的结果来扩大查询范围。

如果您正在寻找异常或特殊 ID,这非常有用。

语法

FIND (text to find, string in which you want to search,
[starting_number])

语法

SEARCH(要查找的文本,要在其中搜索的字符串,
[starting_number])

Left/Right

从单元格中获取静态数据的简单有效方法是 =LEFT 和 =RIGHT。

=LEFT 将返回从当前单元格开始的"x"个字母,而 =RIGHT 将返回从当前单元格结束的"x"个字母。

LEFT(txt,[字符数])
RIGHT(txt,[字符数])

Rank()

尽管 =RANK 是一个过时的电子表格函数,但它仍然有助于数据分析。使用 =RANK 函数可以快速按升序或降序对数据集的值进行排序。在此例中,RANK 用于识别下订单最多的客户。

语法 = RANK (number, ref, [order])

Iferror()

通过使用 IFERROR,我们可以执行不同的计算,甚至报告比 Excel 更详细的错误。 IFERROR 函数需要两个条件才能运行。需要验证哪个值是否存在错误,以及应该做什么来代替它。

SYNTAX = IFERROR (value, value_if_error)

结论

电子表格是数据分析最常用的工具。在本文中,我们了解了用于数据分析的电子表格的各种功能及其语法和输出。我们希望本文能帮助您增强对电子表格的了解。


相关文章