Perl - CGI 编程

什么是 CGI?

  • 通用网关接口 (CGI) 是一组标准,用于定义 Web 服务器和自定义脚本之间的信息交换方式。

  • CGI 规范目前由 NCSA 维护,NCSA 定义 CGI 如下 −

  • 通用网关接口 (CGI) 是外部网关程序与 HTTP 服务器等信息服务器接口的标准。

  • 当前版本为 CGI/1.1,CGI/1.2 正在开发中。


网页浏览

要了解 CGI 的概念,让我们看看当我们单击网页上的超链接以浏览特定网页或 URL 时会发生什么。

  • 您的浏览器使用 HTTP 协议联系 Web 服务器并要求提供 URL,即网页文件名。

  • Web 服务器将检查 URL 并查找请求的文件名。 如果 Web 服务器找到该文件,则它会将文件发送回浏览器而不进行任何进一步执行,否则会发送一条错误消息,指示您请求了错误的文件。

  • Web 浏览器从 Web 服务器获取响应并显示接收到的文件内容或在未找到文件时显示错误消息。

但是,可以以这样的方式设置 HTTP 服务器,以便每当请求某个目录中的文件时,该文件不会被发回; 相反,它作为一个程序执行,并且无论该程序作为结果输出什么,都会被发送回您的浏览器以显示。 这可以通过使用 Web 服务器中可用的特殊功能来完成,它称为 通用网关接口 或 CGI,由服务器执行以产生最终结果的此类程序称为 CGI 脚本。 这些 CGI 程序可以是 PERL 脚本、Shell 脚本、C 或 C++ 程序等。


CGI 架构图

CGI 架构图

Web 服务器支持和配置

在继续进行 CGI 编程之前,请确保您的 Web 服务器支持 CGI 功能并且已配置为处理 CGI 程序。 Web 服务器要执行的所有 CGI 程序都保存在预先配置的目录中。 这个目录被称为 CGI 目录,按照惯例,它被命名为 /cgi-bin。 按照惯例,Perl CGI 文件的扩展名为 .cgi


第一个 CGI 程序

这是一个简单的链接,它链接到名为 hello.cgi 的 CGI 脚本。该文件一直保存在/cgi-bin/ 目录下,内容如下。 在运行您的 CGI 程序之前,请确保您已使用 chmod 755 hello.cgi UNIX 命令更改文件模式。

#!/usr/bin/perl

print "Content-type:text/html\r\n\r\n";
print '<html>';
print '<head>';
print '<title>Hello Word - First CGI Program</title>';
print '</head>';
print '<body>';
print '<h2>Hello Word! This is my first CGI program</h2>';
print '</body>';
print '</html>';

1;

现在,如果您单击 hello.cgi 链接,则请求将发送到在 /cgi-bin 目录中搜索 hello.cgi 的 Web 服务器,执行它并生成任何结果,Web 服务器将该结果发送回 网页浏览器,如下 −

Hello Word! This is my first CGI program

这个 hello.cgi 脚本是一个简单的 Perl 脚本,它将其输出写入 STDOUT 文件,即屏幕。 有一个重要且额外的功能可用,即要打印的第一行 Content-type:text/html\r\n\r\n。 该行被发送回浏览器并指定要在浏览器屏幕上显示的内容类型。 现在您必须了解 CGI 的基本概念,并且可以使用 Perl 编写许多复杂的 CGI 程序。 该脚本还可以与任何其他应用系统交互以交换信息,例如数据库、Web 服务或任何其他复杂的接口。


了解 HTTP 标头

第一行 Content-type:text/html\r\n\r\n 是 HTTP 标头的一部分,它被发送到浏览器,以便浏览器可以理解传入的内容 从服务器端。 所有 HTTP 标头都将采用以下形式 −

HTTP Field Name: Field Content

例如 −

Content-type:text/html\r\n\r\n

很少有其他重要的 HTTP 标头,您将在 CGI 编程中经常使用它们。

序号 标头 & 描述
1

Content-type: String

定义返回内容格式的 MIME 字符串。 示例是 Content-type:text/html

2

Expires: Date String

信息失效的日期。 浏览器应该使用它来决定何时需要刷新页面。 有效日期字符串的格式应为 1998 年 1 月 1 日 12:00:00 GMT。

3

Location: URL String

应返回的 URL,而不是请求的 URL。 您可以使用此字段将请求重定向到任何其他位置。

4

Last-modified: String

上次修改文件的日期。

5

Content-length: String

返回的数据的长度(以字节为单位)。 浏览器使用此值报告文件的估计下载时间。

6

Set-Cookie: String

设置通过 string 传递的 cookie


CGI 环境变量

所有 CGI 程序都可以访问以下环境变量。 这些变量在编写任何 CGI 程序时都起着重要作用。

序号 变量名称 & 描述
1

CONTENT_TYPE

内容的数据类型。 当客户端向服务器发送附加内容时使用。 例如文件上传等。

2

CONTENT_LENGTH

查询信息的长度。 它仅适用于 POST 请求

3

HTTP_COOKIE

以 key & value 对的形式返回设置的 cookie。

4

HTTP_USER_AGENT

User-Agent request-header 字段包含有关发起请求的用户代理的信息。 它的网络浏览器名称。

5

PATH_INFO

CGI 脚本的路径。

6

QUERY_STRING

使用 GET 方法请求发送的 URL 编码信息。

7

REMOTE_ADDR

发出请求的远程主机的 IP 地址。 这对于日志记录或身份验证很有用。

8

REMOTE_HOST

发出请求的主机的完全限定名称。 如果此信息不可用,则可以使用 REMOTE_ADDR 获取 IR 地址。

9

REQUEST_METHOD

用于发出请求的方法。 最常用的方法是 GET 和 POST。

10

SCRIPT_FILENAME

CGI 脚本的完整路径。

11

SCRIPT_NAME

CGI 脚本的名称。

12

SERVER_NAME

服务器的主机名或 IP 地址。

13

SERVER_SOFTWARE

服务器正在运行的软件的名称和版本。

这是一个小型 CGI 程序,用于列出 Web 服务器支持的所有 CGI 变量

#!/usr/bin/perl

print "Content-type: text/html\n\n";
print "<font size=+1>Environment</font>\n";
foreach (sort keys %ENV) {
   print "<b>$_</b>: $ENV{$_}<br>\n";
}

1;

弹出"文件下载"对话框?

有时您希望提供用户单击链接的选项,它会向用户弹出"文件下载"对话框,而不是显示实际内容。 这很容易,将通过 HTTP 标头实现。

此 HTTP 标头将与上一节中提到的标头不同。 例如,如果你想让 FileName 文件可以从给定的链接下载,那么它的语法如下 −

#!/usr/bin/perl

# HTTP Header
print "Content-Type:application/octet-stream; name = \"FileName\"\r\n";
print "Content-Disposition: attachment; filename = \"FileName\"\r\n\n";

# Actual File Content will go hear.
open( FILE, "<FileName" );
while(read(FILE, $buffer, 100) ) {
   print("$buffer");
}

GET 和 POST 方法

当您需要将一些信息从浏览器传递到 Web 服务器并最终传递给处理您的请求的 CGI 程序时,您一定遇到过很多情况。最常见的浏览器使用两种方法将此信息传递给 Web 服务器。 这些方法是GET 方法和POST 方法。 让我们一一检查。


使用 GET 方法传递信息

GET 方法发送附加到页面 URL 本身的编码用户信息。 页面和编码信息由 ? 分隔。 字符如下 −

http://www.test.com/cgi-bin/hello.cgi?key1=value1&key2=value2

GET 方法是将信息从浏览器传递到 Web 服务器的默认方法,它会生成一个长字符串,该字符串会出现在浏览器的 Location:box 中。 如果您有密码或其他敏感信息要传递给服务器,则永远不应使用 GET 方法。 GET 方法有大小限制:请求字符串中只能传递 1024 个字符。

此信息使用 QUERY_STRING 标头传递,并且可以通过 QUERY_STRING 环境变量在您的 CGI 程序中访问,您可以在 CGI 程序中解析和使用该环境变量。

您可以通过简单地连接键和值对以及任何 URL 来传递信息,也可以使用 HTML <FORM> 标签使用 GET 方法传递信息。


简单 URL 示例:Get 方法

这是一个简单的 URL,它将使用 GET 方法将两个值传递给 hello_get.cgi 程序。

/cgi-bin/hello_get.cgi?first_name=ZARA&last_name=ALI

下面是 hello_get.cgi 脚本,用于处理 Web 浏览器给出的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "GET") {
   $buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}
$first_name = $FORM{first_name};
$last_name  = $FORM{last_name};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";

1;

简单的 FORM 示例:GET 方法

这是一个简单的例子,它使用 HTML FORM 和提交按钮传递两个值。 我们将使用相同的 CGI 脚本 hello_get.cgi 来处理这个输入。

<FORM action = "/cgi-bin/hello_get.cgi" method = "GET">
First Name: <input type = "text" name = "first_name">  <br>

Last Name: <input type = "text" name = "last_name">
<input type = "submit" value = "Submit">
</FORM>

这是上述表单编码的实际输出。 现在您可以输入名字和姓氏,然后单击提交按钮以查看结果。

First Name:

Last Name:

使用 POST 方法传递信息

将信息传递给 CGI 程序的一种更可靠的方法是 POST 方法。 这以与 GET 方法完全相同的方式打包信息,但不是将其作为文本字符串发送到 URL 中的 ? 之后,而是将其作为单独的消息作为 HTTP 标头的一部分发送。 Web 服务器以标准输入的形式将此消息提供给 CGI 脚本。

下面是修改后的 hello_post.cgi 脚本,用于处理 Web 浏览器给出的输入。 该脚本将处理 GET 和 POST 方法。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}
$first_name = $FORM{first_name};
$last_name  = $FORM{last_name};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Hello - Second CGI Program</title>";
print "</head>";
print "<body>";
print "<h2>Hello $first_name $last_name - Second CGI Program</h2>";
print "</body>";
print "</html>";

1;

让我们再次以与上面相同的示例为例,它使用 HTML FORM 和提交按钮传递两个值。 我们将使用 CGI 脚本 hello _post.cgi 来处理这个输入。

<FORM action = "/cgi-bin/hello_post.cgi" method = "POST">
First Name: <input type = "text" name = "first_name">  <br>

Last Name: <input type = "text" name = "last_name">

<input type = "submit" value = "Submit">
</FORM>

这是上述表单编码的实际输出,您输入名字和姓氏,然后单击提交按钮以查看结果。

First Name:

Last Name:

将复选框数据传递给 CGI 程序

当需要选择多个选项时使用复选框。 这是带有两个复选框的表单的示例 HTML 代码。

<form action = "/cgi-bin/checkbox.cgi" method = "POST" target = "_blank">
<input type = "checkbox" name = "maths" value = "on"> Maths
<input type = "checkbox" name = "physics" value = "on"> Physics
<input type = "submit" value = "Select Subject">
</form>

这段代码的结果是下面的形式 −

Maths Physics

下面是 checkbox.cgi 脚本,用于处理 Web 浏览器为单选按钮提供的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}
if( $FORM{maths} ) {
   $maths_flag ="ON";
} else {
   $maths_flag ="OFF";
}
if( $FORM{physics} ) {
   $physics_flag ="ON";
} else {
   $physics_flag ="OFF";
}

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Checkbox - Third CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> CheckBox Maths is : $maths_flag</h2>";
print "<h2> CheckBox Physics is : $physics_flag</h2>";
print "</body>";
print "</html>";

1;

将单选按钮数据传递给 CGI 程序

当只需要选择一个选项时使用单选按钮。 这是带有两个单选按钮的表单的示例 HTML 代码 −

<form action = "/cgi-bin/radiobutton.cgi" method = "POST" target = "_blank">
<input type = "radio" name = "subject" value = "maths"> Maths
<input type = "radio" name = "subject" value = "physics"> Physics
<input type = "submit" value = "Select Subject">
</form>

这段代码的结果是下面的形式 −

Maths Physics

下面是 radiobutton.cgi 脚本,用于处理网络浏览器为单选按钮提供的输入。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}
$subject = $FORM{subject};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Radio - Fourth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";

1;

将文本区域数据传递给 CGI 程序

当必须将多行文本传递给 CGI 程序时,使用 textarea 元素。 这是带有 TEXTAREA 框的表单的示例 HTML 代码 −

<form action = "/cgi-bin/textarea.cgi" method = "POST" target = "_blank">
<textarea name = "textcontent" cols = 40 rows = 4>
Type your text here...
</textarea>
<input type = "submit" value = "Submit">
</form>

这段代码的结果是下面的形式 −

下面是处理网络浏览器输入的 textarea.cgi 脚本。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}
$text_content = $FORM{textcontent};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Text Area - Fifth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Entered Text Content is $text_content</h2>";
print "</body>";
print "</html>";

1;

将下拉框数据传递给 CGI 程序

当我们有许多可用选项但只会选择一两个时,使用下拉框。 这是带有一个下拉框的表单的示例 HTML 代码2

<form action = "/cgi-bin/dropdown.cgi" method = "POST" target = "_blank">
<select name = "dropdown">
<option value = "Maths" selected>Maths</option>
<option value = "Physics">Physics</option>
</select>
<input type = "submit" value = "Submit">
</form>

这段代码的结果是下面的形式 −

下面是处理网络浏览器输入的 dropdown.cgi 脚本。

#!/usr/bin/perl

local ($buffer, @pairs, $pair, $name, $value, %FORM);
# Read in text
$ENV{'REQUEST_METHOD'} =~ tr/a-z/A-Z/;
if ($ENV{'REQUEST_METHOD'} eq "POST") {
   read(STDIN, $buffer, $ENV{'CONTENT_LENGTH'});
} else {
   $buffer = $ENV{'QUERY_STRING'};
}
# Split information into name/value pairs
@pairs = split(/&/, $buffer);
foreach $pair (@pairs) {
   ($name, $value) = split(/=/, $pair);
   $value =~ tr/+/ /;
   $value =~ s/%(..)/pack("C", hex($1))/eg;
   $FORM{$name} = $value;
}
$subject = $FORM{dropdown};

print "Content-type:text/html\r\n\r\n";
print "<html>";
print "<head>";
print "<title>Dropdown Box - Sixth CGI Program</title>";
print "</head>";
print "<body>";
print "<h2> Selected Subject is $subject</h2>";
print "</body>";
print "</html>";

1;

在 CGI 中使用 Cookie

HTTP 协议是一种无状态协议。 但是对于商业网站来说,需要维护不同页面之间的会话信息。 例如,一个用户注册在跨越许多页面的事务之后结束。 但是如何在所有网页中维护用户的会话信息呢?

在许多情况下,使用 Cookie 是记住和跟踪偏好、购买、佣金和其他更好的访问者体验或网站统计数据所需的信息的最有效方法。


工作原理

您的服务器以 cookie 的形式向访问者的浏览器发送一些数据。 浏览器可以接受 cookie。 如果是这样,它将作为纯文本记录存储在访问者的硬盘上。 现在,当访问者到达您网站上的另一个页面时,cookie 就可以检索了。 一旦检索到,您的服务器就会知道/记住存储的内容。

Cookie 是 5 个可变长度字段的纯文本数据记录 −

  • Expires − cookie 过期的日期。 如果此项为空,则 cookie 将在访问者退出浏览器时过期。

  • Domain − 您网站的域名。

  • Path − 设置 cookie 的目录或网页的路径。 如果您想从任何目录或页面检索 cookie,这可能是空白的。

  • Secure − 如果此字段包含"secure"一词,则只能使用安全服务器检索 cookie。 如果此字段为空,则不存在此类限制。

  • Name = Value − Cookie 以键值对的形式设置和回顾。


设置 Cookies

将 cookie 发送到浏览器非常容易。 这些 cookie 将与 HTTP 标头一起发送。 假设您要将 UserID 和 Password 设置为 cookie。 所以它将按如下方式完成 −

#!/usr/bin/perl

print "Set-Cookie:UserID = XYZ;\n";
print "Set-Cookie:Password = XYZ123;\n";
print "Set-Cookie:Expires = Tuesday, 31-Dec-2007 23:12:40 GMT";\n";
print "Set-Cookie:Domain = www.tutorialspoint.com;\n";
print "Set-Cookie:Path = /perl;\n";
print "Content-type:text/html\r\n\r\n";
...........Rest of the HTML Content goes here....

这里我们使用 Set-Cookie HTTP 标头来设置 cookie。 设置 cookie 属性(如 Expires、Domain 和 Path)是可选的。 需要注意的是,cookie 是在发送幻行 "Content-type:text/html\r\n\r\n 之前设置的。


检索 Cookies

检索所有设置的 cookie 非常容易。 Cookie 存储在 CGI 环境变量 HTTP_COOKIE 中,它们将具有以下形式。

key1 = value1;key2 = value2;key3 = value3....

Here is an example of how to retrieve cookies.

#!/usr/bin/perl
$rcvd_cookies = $ENV{'HTTP_COOKIE'};
@cookies = split /;/, $rcvd_cookies;
foreach $cookie ( @cookies ) {
   ($key, $val) = split(/=/, $cookie); # splits on the first =.
   $key =~ s/^\s+//;
   $val =~ s/^\s+//;
   $key =~ s/\s+$//;
   $val =~ s/\s+$//;
   if( $key eq "UserID" ) {
      $user_id = $val;
   } elsif($key eq "Password") {
      $password = $val;
   }
}
print "User ID  = $user_id\n";
print "Password = $password\n";

这将产生以下结果,前提是在调用检索 cookie 脚本之前已设置上述 cookie。

User ID = XYZ
Password = XYZ123

CGI 模块和库

您会在 Internet 上找到许多内置模块,它们为您提供在 CGI 程序中使用的直接功能。 以下是重要的一次。