MATLAB - 数据导入

在 MATLAB 中导入数据意味着从外部文件加载数据。 importdata函数允许加载不同格式的各种数据文件。 它有以下五种形式 −

序号 函数 & 描述
1

A = importdata(filename)

将数据从 filename 表示的文件加载到数组 A 中。

2

A = importdata('-pastespecial')

从系统剪贴板而不是文件加载数据。

3

A = importdata(___, delimiterIn)

delimiterIn 解释为 ASCII 文件、文件名或剪贴板数据中的列分隔符。 您可以将 delimiterIn 与上述语法中的任何输入参数一起使用。

4

A = importdata(___, delimiterIn, headerlinesIn)

从 ASCII 文件、文件名或剪贴板加载数据,读取从第 headerlinesIn+1 行开始的数字数据。

5

[A, delimiterOut, headerlinesOut] = importdata(___)

使用前面语法中的任何输入参数,返回在 delimiterOut 中检测到的输入 ASCII 文件的分隔符,以及在 headerlinesOut 中检测到的标题行数。

默认情况下,Octave 不支持 importdata() 函数,因此您必须搜索并安装此软件包才能使以下示例适用于您的 Octave 安装。

示例 1

让我们加载并显示一个图像文件。 创建一个脚本文件并在其中键入以下代码 −

filename = 'smile.jpg';
A = importdata(filename);
image(A);

当您运行该文件时,MATLAB 将显示图像文件。 但是,您必须将其存储在当前目录中。

导入图像文件

示例 2

在此示例中,我们导入一个文本文件并指定分隔符和列标题。 让我们创建一个带有列标题的空格分隔的 ASCII 文件,名为 weeklydata.txt

我们的文本文件weeklydata.txt看起来像这样 −

SunDay  MonDay  TuesDay  WednesDay  ThursDay  FriDay  SaturDay
95.01   76.21   61.54    40.57       55.79    70.28   81.53
73.11   45.65   79.19    93.55       75.29    69.87   74.68
60.68   41.85   92.18    91.69       81.32    90.38   74.51
48.60   82.14   73.82    41.03       0.99     67.22   93.18
89.13   44.47   57.63    89.36       13.89    19.88   46.60

创建一个脚本文件并在其中键入以下代码 −

filename = 'weeklydata.txt';
delimiterIn = ' ';
headerlinesIn = 1;
A = importdata(filename,delimiterIn,headerlinesIn);

% View data
for k = [1:7]
   disp(A.colheaders{1, k})
   disp(A.data(:, k))
   disp(' ')
end

当您运行该文件时,它会显示以下结果 −

SunDay
   95.0100
   73.1100
   60.6800
   48.6000
   89.1300
 
MonDay
   76.2100
   45.6500
   41.8500
   82.1400
   44.4700
 
TuesDay
   61.5400
   79.1900
   92.1800
   73.8200
   57.6300

WednesDay
   40.5700
   93.5500
   91.6900
   41.0300
   89.3600
 
ThursDay
   55.7900
   75.2900
   81.3200
   0.9900
   13.8900
 
FriDay
   70.2800
   69.8700
   90.3800
   67.2200
   19.8800

SaturDay
   81.5300
   74.6800
   74.5100
   93.1800
   46.6000

示例 3

在此示例中,让我们从剪贴板导入数据。

将以下行复制到剪贴板 −

Mathematics is simple

创建脚本文件并输入以下代码 −

A = importdata('-pastespecial')

当您运行该文件时,它会显示以下结果 −

A = 
   'Mathematics is simple'

低级文件 I/O

importdata 函数是一个高级函数。 MATLAB 中的低级文件 I/O 函数可以最大程度地控制对文件读取或写入数据。 但是,这些函数需要有关您的文件的更详细信息才能有效运行。

MATLAB 提供以下函数用于字节或字符级别的读写操作 −

函数 描述
fclose 关闭一个或所有打开的文件
feof 测试文件结尾
ferror 有关文件 I/O 错误的信息
fgetl 从文件中读取行,删除换行符
fgets 从文件中读取行,保留换行符
fopen 打开文件,或获取有关打开文件的信息
fprintf 将数据写入文本文件
fread 从二进制文件读取数据
frewind 将文件位置指示器移动到打开文件的开头
fscanf 从文本文件中读取数据
fseek 移动到文件中的指定位置
ftell 在打开文件中的位置
fwrite 将数据写入二进制文件

使用低级 I/O 导入文本数据文件

MATLAB 提供以下函数用于文本数据文件的低级导入 −

  • fscanf 函数读取文本或 ASCII 文件中的格式化数据。

  • fgetlfgets 函数一次读取文件的一行,其中换行符分隔每一行。

  • fread 函数以字节或位级别读取数据流。

示例

我们的工作目录中保存了一个文本数据文件"myfile.txt"。 该文件存储三个月的降雨量数据; 2012 年六月、七月和八月。

myfile.txt 中的数据包含五个地点的重复时间、月份和降雨量测量值。 头数据存储月数M; 所以我们有 M 组测量值。

文件看起来像这样 −

Rainfall Data
Months: June, July, August
 
M = 3
12:00:00
June-2012
17.21  28.52  39.78  16.55 23.67
19.15  0.35   17.57  NaN   12.01
17.92  28.49  17.40  17.06 11.09
9.59   9.33   NaN    0.31  0.23 
10.46  13.17  NaN    14.89 19.33
20.97  19.50  17.65  14.45 14.00
18.23  10.34  17.95  16.46 19.34
09:10:02
July-2012
12.76  16.94  14.38  11.86 16.89
20.46  23.17  NaN    24.89 19.33
30.97  49.50  47.65  24.45 34.00
18.23  30.34  27.95  16.46 19.34
30.46  33.17  NaN    34.89  29.33
30.97  49.50  47.65  24.45 34.00
28.67  30.34  27.95  36.46 29.34
15:03:40
August-2012
17.09  16.55  19.59  17.25 19.22
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67
17.54  11.45  13.48  22.55 24.01
NaN    21.19  25.85  25.05 27.21
26.79  24.98  12.23  16.99 18.67

我们将从该文件导入数据并显示该数据。 采取以下步骤 −

  • 使用fopen函数打开文件并获取文件标识符。

  • 使用格式说明符描述文件中的数据,例如"%s"表示字符串,"%d"表示整数,或者 '%f' 表示浮点数。

  • 要跳过文件中的文字字符,请将它们包含在格式描述中。 要跳过数据字段,请在说明符中使用星号 ('*')。

    例如,要读取标头并返回 M 的单个值,我们编写 −

    M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);
    
  • 默认情况下,fscanf根据我们的格式描述读取数据,直到找不到任何匹配的数据,或者到达文件末尾。 这里我们将使用for循环读取3组数据,每次读取7行5列。

  • 我们将在工作区中创建一个名为mydata的结构来存储从文件中读取的数据。 该结构具有三个字段 - timemonthraindata 数组。

创建一个脚本文件并在其中键入以下代码 −

filename = '/data/myfile.txt';
rows = 7;
cols = 5;
 
% 打开文件
fid = fopen(filename);
 
% 读取文件头,找到M(月数)
M = fscanf(fid, '%*s %*s\n%*s %*s %*s %*s\nM=%d\n\n', 1);
 
% 读取每组测量值
for n = 1:M
   mydata(n).time = fscanf(fid, '%s', 1);
   mydata(n).month = fscanf(fid, '%s', 1);
 
   % fscanf 按列顺序填充数组,
   % 所以转置结果
   mydata(n).raindata  = ...
      fscanf(fid, '%f', [rows, cols]);
end
for n = 1:M
   disp(mydata(n).time), disp(mydata(n).month)
   disp(mydata(n).raindata)
end
 
% close the file
fclose(fid);

当您运行该文件时,它会显示以下结果 −

12:00:00
June-2012
   17.2100   17.5700   11.0900   13.1700   14.4500
   28.5200       NaN    9.5900       NaN   14.0000
   39.7800   12.0100    9.3300   14.8900   18.2300
   16.5500   17.9200       NaN   19.3300   10.3400
   23.6700   28.4900    0.3100   20.9700   17.9500
   19.1500   17.4000    0.2300   19.5000   16.4600
   0.3500   17.0600   10.4600   17.6500   19.3400

09:10:02
July-2012
   12.7600       NaN   34.0000   33.1700   24.4500
   16.9400   24.8900   18.2300       NaN   34.0000
   14.3800   19.3300   30.3400   34.8900   28.6700
   11.8600   30.9700   27.9500   29.3300   30.3400
   16.8900   49.5000   16.4600   30.9700   27.9500
   20.4600   47.6500   19.3400   49.5000   36.4600
   23.1700   24.4500   30.4600   47.6500   29.3400

15:03:40
August-2012
   17.0900   13.4800   27.2100   11.4500   25.0500
   16.5500   22.5500   26.7900   13.4800   27.2100
   19.5900   24.0100   24.9800   22.5500   26.7900
   17.2500       NaN   12.2300   24.0100   24.9800
   19.2200   21.1900   16.9900       NaN   12.2300
   17.5400   25.8500   18.6700   21.1900   16.9900
   11.4500   25.0500   17.5400   25.8500   18.6700