SAS - 数据集
可供 SAS 程序进行分析的数据称为 SAS 数据集。 它是使用 DATA 步骤创建的。SAS 可以读取各种文件作为其数据源,例如 CSV、Excel、Access、SPSS 以及原始数据。 它还具有许多可供使用的内置数据源。
如果数据集被 SAS 程序使用并在会话运行后被丢弃,则数据集称为 临时数据集。
但如果它被永久存储以备将来使用,则它被称为永久数据集。 所有永久数据集都存储在特定库下。
SAS 数据集以行和列的形式存储,也称为 SAS 数据表。下面我们看到了内置的永久数据集以及来自外部来源的红色的示例。
SAS 内置数据集
这些数据集已在安装的 SAS 软件中可用。 它们可以被探索并用于为数据分析制定样本表达式。 要探索这些数据集,请转到 Libraries -> My Libraries -> SASHELP。 在展开它时,我们会看到所有可用的内置数据集的名称列表。
让我们向下滚动以找到名为 CARS 的数据集。双击此数据集将在右侧窗格中打开它,我们可以进一步探索它。我们还可以使用最大化视图最小化左侧窗格 右窗格下的按钮。
我们可以使用底部的滚动条向右滚动以浏览表中的所有列及其值。
导入外部数据集
我们可以使用 SAS Studio 中提供的导入功能将我们自己的文件导出为数据集。 但这些文件必须在 SAS 服务器文件夹中可用。 因此,我们必须使用 Server Files and Folders 下的上传选项将源数据文件上传到 SAS 文件夹。
接下来,我们通过导入在 SAS 程序中使用上述文件。 为此,我们使用选项 Tasks -> Utilities -> Import data ,如下所示。 双击导入数据按钮,打开右侧的窗口以选择数据集的文件。
下一步单击右窗格中导入数据程序下的Select Files按钮。 以下是可以导入的文件类型列表。
我们选择存储在本地系统中的"employee.txt"文件,得到如下图所示的导入文件。
查看导入的数据
我们可以通过运行使用 Run 选项生成的默认导入代码来查看导入的数据
我们可以使用与上述相同的方法导入任何其他文件类型,并在各种 SAS 程序中使用它。