大数据分析 - 数据科学家
数据科学家的角色通常与预测建模、开发分割算法、推荐系统、A/B 测试框架以及经常处理原始非结构化数据等任务相关联。
他们的工作性质要求对数学、应用统计学和编程有深刻的理解。 数据分析师和数据科学家之间有一些共同的技能,例如,查询数据库的能力。 两者都分析数据,但数据科学家的决定会对组织产生更大的影响。
这是数据科学家通常需要具备的一组技能 −
- 在统计软件包中编程,例如:R、Python、SAS、SPSS 或 Julia
- 能够清理、提取和探索来自不同来源的数据
- 统计模型的研究、设计和实施
- 深厚的统计、数学和计算机科学知识
在大数据分析中,人们通常会将数据科学家的角色与数据架构师的角色混淆。 实际上,区别非常简单。 数据架构师定义了存储数据的工具和架构,而数据科学家则使用这种架构。 当然,如果临时项目需要,数据科学家应该能够设置新工具,但基础设施的定义和设计不应该是他任务的一部分。