数据处理

软件度量是一种包含许多活动的度量标准,涉及一定程度的测量。软件度量的成功取决于所收集和分析数据的质量。

什么是好数据?

如果所收集的数据能够为以下问题提供答案,则可以将其视为好数据 −

  • 它们正确吗? − 如果数据是根据度量定义的确切规则收集的,则可以将其视为正确的数据。

  • 它们准确吗? − 准确性是指数据与实际值之间的差异。

  • 它们是否足够精确? −精度与表达数据所需的小数位数有关。

  • 它们是否一致? − 如果数据在不同的测量设备之间没有显示出很大的差异,则可以认为它们是一致的。

  • 它们是否与特定活动或时间段相关? − 如果数据与特定活动或时间段相关,则应在数据中明确说明。

  • 它们可以复制吗? − 通常,调查、案例研究和实验等调查经常在不同情况下重复进行。因此,数据也应该能够轻松复制。

如何定义数据?

为测量目的而收集的数据有两种类型 −

  • 原始数据 − 原始数据来自流程、产品或资源的初始测量。例如:组织中员工的每周时间表。

  • 精炼数据 −精炼数据是从原始数据中提取必要的数据元素,以得出属性值的结果。

可以根据以下几点定义数据 −

  • 位置
  • 时间
  • 症状
  • 最终结果
  • 机制
  • 原因
  • 严重性
  • 成本

如何收集数据?

数据收集需要人工观察和报告。经理、系统分析师、程序员、测试人员和用户必须在表单上记录行数据。要收集准确完整的数据,重要的是 −

  • 保持程序简单

  • 避免不必要的记录

  • 培训员工记录数据的必要性和要使用的程序

  • 及时以有用的形式向原始提供商提供数据捕获和分析的结果,以协助他们开展工作

  • 验证在中央收集点收集的所有数据

数据收集的规划涉及几个步骤 −

  • 根据 GQM 分析决定要测量哪些产品

  • 确保产品处于配置控制之下

  • 准确决定要测量哪些属性以及如何得出间接测量值

  • 一旦指标集明确,并且要测量的组件集已经确定,确定后,设计一个方案来识别测量过程中涉及的每个活动

  • 建立处理表格、分析数据和报告结果的程序

数据收集规划必须在项目规划开始时开始。实际数据收集发生在开发的许多阶段。

例如 − 一些与项目人员相关的数据可以在项目开始时收集,而其他数据(如工作量)的收集则在项目开始时开始,并持续到运营和维护。

如何存储和提取数据

在软件工程中,数据应存储在数据库中并使用数据库管理系统 (DBMS) 进行设置。下图显示了数据库结构的示例。该数据库将存储在组织不同部门工作的不同员工的详细信息。

数据库管理系统

在上图中,每个框都是数据库中的一个表,箭头表示从一个表到另一个表的多对一映射。映射定义了保持数据逻辑一致性的约束。

一旦数据库设计好并填充了数据,我们就可以利用数据操作语言来提取数据进行分析。