【网络】应用层——HTTP协议

> 作者:დ旧言~
> 座右铭:松树千年终是朽,槿花一日自为荣。

> 目标:了解什么是HTTP协议。

> 毒鸡汤:有些事情,总是不明白,所以我不会坚持。早安!

> 专栏选自:网络

> 望小伙伴们点赞👍收藏✨加关注哟💕💕

​​

 一、前言

前面我们已经学习了网络的基础知识,对网络的基本框架已有认识,算是初步认识到网络了,如果上期我们的学习网络是步入基础知识,那么这次学习的板块就是基础知识的实践,我们今天的板块是学习网络重要之一,学习完这个板块对虚幻的网络就不再迷茫!!!

  二主体

学习【网络】应用层——HTTP协议咱们按照下面的图解:

2.1 HTTP协议简介

概念:

  • HTTP 协议 是 Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网( WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。HTTP 是一个基于 TCP/IP 通信协议来传递数据(HTML 文件、图片文件、查询结果等)。
  • HTTP协议用于在客户端和服务器之间传输超文本。它是 Web 的基础,可用于检索和提交信息,例如 HTML 文件、图像、样式表等。HTTP 是无状态的,也就是说每个请求都是独立的,服务器不会存储任何有关先前请求的信息。HTTP协议常用于浏览器与 Web 服务器之间的通信。

2.2 认识URL

概念:

在WWW上,每一信息资源都有统一的且在网上的地址,该地址就叫URL(Uniform Resource Locator,统一资源定位器),它是WWW的统一资源定位标志,就是指网络地址。平时我们俗称的 "网址" 其实就是说的 URL,URL标识了Internet上的每一个唯一的网页。

URL组成部分如下:

协议方案名:

概念:

http://表示的是协议名称,表示请求时需要使用的协议,通常使用的是HTTP协议或者是安全协议HTTPS。

常见的应用层协议:

  • DNS(Domain Name System)协议:域名系统。
  • FTP(File Transfer Protocol)协议:文件传输协议。
  • TELNET(Telnet)协议:远程终端协议。
  • HTTP(Hyper Text Transfer Protocol)协议:超文本传输协议。
  • HTTPS(Hyper Text Transfer Protocol over SecureSocket Layer)协议:安全数据传输协议。
  • SMTP(Simple Mail Transfer Protocol)协议:电子邮件传输协议。
  • POP3(Post Office Protocol - Version 3)协议:邮件读取协议。
  • SNMP(Simple Network Management Protocol)协议:简单网络管理协议。
  • TFTP(Trivial File Transfer Protocol)协议:简单文件传输协议。

登录信息:

usr:pass 表示的是登录认证信息,包括登录用户的用户名和密码,不过登录信息一般不显示在URL中,绝大部分URL中的这个字段是被省略的,因为登录信息可以通过其他方案交给服务器。

服务器地址:

说明:

www.example.jp表示的是服务器地址,也叫做域名,比如:www.baidu.com,www.jd.com等。

域名可以被解析成IP地址:

补充:

在这里我们需要知道的是:虽然IP地址可以标识公网内的一台主机,但是IP地址一般不会直接给用户看到,因为用户看到IP地址后并不知道该IP地址的网站是干什么的,但是如果使用www.baidu.com或者www.qq.com这种网址的方式访问网站,那么用户至少可以知道这两个域名对应的是哪两家公司。

域名和IP地址是等价的,我们同样可以使用IP地址来访问网址,但是URL呈现出来是给用户看的,所以URL中以域名的方式表示服务器的地址。

服务器端口号:

解释:

80表示的是服务器的端口号,HTTP协议和套接字编程都是位于应用层的,因此应用层协议同样也需要有明确的端口号。

当然,当我们在使用某种协议时,该协议就是在为我们提供服务,因此一般常用的服务和端口号之间的关系都是一一对应的,所以我们在使用某种协议时并不需要明确指定端口号。因此在URL中服务器的端口号一般都是被省略的。

常见协议对应的端口号:

  • HTTP (Hyper Text Transfer Protocol) 端口号:80
  • HTTPS (Secure Hyper Text Transfer Protocol) 端口号:443
  • FTP (File Transfer Protocol) 端口号:21
  • SMTP (Simple Mail Transfer Protocol) 端口号:25
  • POP3 (Post Office Protocol version 3) 端口号:110
  • IMAP (Internet Message Access Protocol) 端口号:143
  • DNS (Domain Name System) 端口号:53
  • DHCP (Dynamic Host Configuration Protocol) 端口号:67/68
  • Telnet (Terminal Emulation) 端口号:23
  • SSH (Secure Shell) 端口号:22
  • NTP (Network Time Protocol) 端口号:123
  • SNMP (Simple Network Management Protocol) 端口号:161/162
  • RDP (Remote Desktop Protocol) 端口号:3389
  • SIP (Session Initiation Protocol) 端口号:5060/5061
  • ICQ (Internet Control Message Protocol) 端口号:7
  • IRC (Internet Relay Chat) 端口号:194
  • BitTorrent 端口号:6881-6889

带层次的文件路径:

/dir/index.htm

表示的是要访问的资源所在的路径,访问服务器的目的是获取服务器上的某种资源,通过前面的域名和端口号已经能够找到对应的服务器进程了,接下来我们需要指明该资源所在的路径。

在URL当中的路径分隔符用 / 表示而不是 \ 证明了大多数的服务器都是部署在Linux下的。

查询字符串:

uid=1:表示的是请求时提供的额外参数,这些参数一般都是以键值对的形式,通过&服务分隔。当然我们使用百度搜索时提供的搜索关键字也在其中。

片段标识符:

ch1表示的是片段标识符,是对资源的部分补充,当我们在看图片的时候,URL当中就会出现片段标识符,当我们切换到其他图片时这个符号也会发生变化。

2.3 HTTP协议格式

概念:

HTTP是基于请求和响应的应用层服务器,作为客户端,我们可以向服务器发起请求,服务器收到这个请求后,会对这个请求做数据分析,然后构建response,完成一次HTTP请求,这种基于request和response的工作方式,一般被称为cs或者bs模式,c表示client,s表示server,b表示browser。

2.3.1 HTTP请求协议格式

HTTP请求协议的格式:

  • 请求行:请求方法 + url + http版本
  • 请求报头:请求的属性,这些属性都是以key: value的形式按行陈列的。
  • 空行:遇到空行表示请求报头结束。
  • 请求正文:请求正文允许为空字符串,如果请求正文存在,则在请求报头中会有一个Content-Length属性来标识请求正文的长度。

解释说明:

  • 前面三部分是一般是HTTP协议自带的,是由HTTP协议自行设置的,而请求正文一般是用户的相关信息或数据,如果用户在请求时没有信息要上传给服务器,此时请求正文就为空字符串
  • 这里的空行可以将可以将HTTP的报头和有效载荷进行分离。当服务器收到一个HTTP请求时,就可以按行进行读取,如果读取到空行则说明已经将报头读取完毕了。

2.3.2 HTTP响应协议格式

HTTP响应协议格式如下:

  • 状态行:http版本 + 状态码 + 状态码描述
  • 响应报头:响应的属性,这些属性都是以key: value的形式按行陈列的。
  • 空行:遇到空行表示响应报头结束。
  • 响应正文:响应正文允许为空字符串,如果响应正文存在,则响应报头中会有一个Content-Length属性来标识响应正文的长度。比如服务器返回了一个html页面,那么这个html页面的内容就是在响应正文当中的。

2.4 HTTP的方法

HTTP常见的方法如下:

GET方法和POST方法:

  • GET方法用于获取某种资源信息
  • POST方法用于将数据上传给服务器

但实际生活中上传数据时也有可能使用GET方法,比如百度官网提交数据时实际使用的就是GET方法。

  • GET方法通过url传参
  • POST方法通过正文传参

因为url的长度是有限的,而正文则可以很长,所以使用POST方法通过正文传参可以携带更多的数据,同时,使用POST方法传参更加私密,因为POST方法不会将我们所提交的参数回响到url当中。但是两者都不安全,想要更加安全只能通过加密来实现。

表单(Form) :

是 HTML 中一种常用的元素,它是用来接受用户输入的一种方式。表单包含了各种表单元素,如文本框、单选框、复选框、下拉框等,用户可以通过这些元素输入信息,然后通过表单提交(Submit)按钮将这些信息发送到后端服务器。

写一个表单:index.html (get方法)

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title>
</head>
<body><form action="/a/b/c/index2.html" method="get">name:<input type="text" name="name"><br>passwd:<input type="password" name="passwd"><br><input type="submit" value="提交"></form>--><h1>这个是我们的首页</h1> 
</body>
</html>

结果:

分析:

我们发现 如果我们要提交参数给我们的服务器,我们使用get方法的时候,url上加上了我们的参数,而我们提交的参数是通过url提交的!但是此时在我们网页根目录之下不存在这样的路径,所以就返回404。

修改后的代码:

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title>
</head>
<body><form action="/a/b/c/index2.html" method="post">name:<input type="text" name="name"><br>passwd:<input type="password" name="passwd"><br><input type="submit" value="提交"></form>--><h1>这个是我们的首页</h1> 
</body>
</html>

结果:

2.5 HTTP的状态码

HTTP状态码是用来表示HTTP请求的处理结果的三位数字代码。它们可以分为五大类:信息响应(1xx)、成功响应(2xx)、重定向(3xx)、客户端错误(4xx)和服务端错误(5xx)。

信息响应(1xx)

信息响应表示请求已经被接受,但处理尚未完成。常见的状态码有:

  • 100 Continue:服务器已经接收到请求头,并且客户端应继续发送请求体。
  • 101 Switching Protocols:服务器已经理解并同意将请求切换到新的协议。

 成功响应(2xx) 

成功响应表示请求已经被成功处理。常见的状态码有:

  • 200 OK:请求已成功处理,返回结果。
  • 201 Created:请求已被实现,而且有一个新的资源被创建。
  • 204 No Content:服务器成功处理了请求,但没有返回任何内容。

 重定向(3xx) 

重定向表示请求的资源已经被移动到了一个新的位置,客户端需要重新发送请求。常见的状态码有:

  • 301 Moved Permanently:请求的资源已经被永久移动到新的位置。
  • 302 Found:请求的资源已经被临时移动到新的位置。
  • 303 See Other:请求的资源可以通过GET方法访问另一个URI。
  • 307 Temporary Redirect:与302类似,但指定了临时重定向。

客户端错误(4xx)

客户端错误表示或者客户端发送的请求有问题。常见的状态码有:

  • 400 Bad Request:服务器无法理解客户端发送的请求。
  • 401 Unauthorized:请求需要用户验证。
  • 403 Forbidden:服务器拒绝处理请求,可能是因为客户端没有权限。
  • 404 Not Found:请求的资源不存在。

服务端错误(5xx)

服务端错误表示服务器在处理请求时发生了错误。常见的状态码有:

  • 500 Internal Server Error:服务器在处理请求时发生了未知的错误。
  • 503 Service Unavailable:服务器暂时无法处理请求,通常是因为服务器过载或维护。

2.5.1 见一见404状态码(代码)

首先我们要明白这个404一定是没找到资源才会触发的:

err.html文件:

<!doctype html>
<html lang="en"><head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title>
</head><body><div><h1>404</h1><p>页面未找到<br></p><p>您请求的页面可能已经被删除、更名或者您输入的网址有误。<br>请尝试使用以下链接或者自行搜索:<br><br><a href="https://www.baidu.com">百度一下></a></p></div>
</body>
</html>

HttpServer.hpp:

#pragma once#include <iostream>
#include <string>
#include <pthread.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <fstream>
#include <sstream>
#include <vector>
#include "Socket.hpp"using namespace std;static const uint16_t defaultport = 8877;
const string wwwroot = "./wwwroot"; // web 根目录
const string homepath = "/index.html"; 
const std::string sep = "\r\n";class HttpRequest
{
public:// 反序列化函数,用于将字符串格式的HTTP请求分解为请求头和请求体void Deserialize(std::string req){// 假设sep是一个成员变量,用于分隔请求头和请求体,但在此代码段中未定义// 这里应该是用于分割请求头中每一行的分隔符,例如"\r\n"// while循环用于遍历字符串,直到找不到分隔符while (true){// 在请求字符串中查找分隔符\r\n的位置size_t pos = req.find(sep);// 如果没有找到分隔符\r\n,则退出循环if (pos == string::npos)break;// 截取从开头到分隔符\r\n之前的字符串作为请求头的一部分string temp = req.substr(0, pos);// 如果截取的字符串为空,则也退出循环(这通常是不必要的,因为find不会返回0位置除非是空字符串)if (temp.empty())break;// 将截取的字符串添加到请求头向量中req_header.push_back(temp);// 从请求字符串中移除已经处理的部分,包括分隔符req.erase(0, pos + sep.size());}// 剩下的字符串(如果有的话)被认为是请求正文text = req;}// 解析函数,用于解析请求行的第一部分(通常是HTTP方法、URL和HTTP版本)void Parse(){// 使用stringstream和字符串流输入操作符来解析请求行的第一个元素std::stringstream ss(req_header[0]); // 将第一行交给ss// 将请求行解析为HTTP方法、URL和HTTP版本ss >> method >> url >> http_version; // gei第一个单词会给method,第二个会给url,第3个会给http_versionfile_path=wwwroot;//./wwwrootif(url=="/" || url=="/index.html"){file_path+=homepath;// ./wwwroot/index.html}else{file_path+=url;//./wwwroot/url}  }// 调试打印函数,用于输出请求的所有信息void DebugPrint(){// 遍历请求头,并打印每一行for (auto &line : req_header){std::cout << "--------------------------------" << std::endl;std::cout << line << "\n\n";}// 打印解析后的HTTP方法、URL和HTTP版本std::cout << "method: " << method << std::endl;std::cout << "url: " << url << std::endl;std::cout << "http_version: " << http_version << std::endl;std::cout << "file_path: " << file_path << std::endl;// 打印请求正文std::cout << text << std::endl;}public:std::vector<std::string> req_header; // 用于存储请求头的字符串向量std::string text;                    // 用于存储请求正文的字符串std::string file_path;//用于存储转换后的文件地址  // 解析请求行之后得到的结果std::string method;       // HTTP方法,如GET、POSTstd::string url;          // 请求的URLstd::string http_version; // HTTP的版本号,如HTTP/1.1
};class HttpServer; // 声明class ThreadData // 传给线程的数据
{
public:ThreadData(int fd): _sockfd(fd){}public:int _sockfd;
};class HttpServer
{
public:HttpServer(uint16_t port = defaultport): _port(port){}bool Start(){_listensockfd.Socket();_listensockfd.Bind(_port);_listensockfd.Listen();for (;;){// 获取用户信息string clientip;uint16_t clientport;// 两个都是输出型参数// 注意Accept成员函数会返回一个新的套接字,专门用于发送信息的int sockfd = _listensockfd.Accept(&clientip, &clientport); // 这里获取了客户端IP和端口号if (sockfd < 0)continue;std::cout << "get a new connect, sockfd:" << sockfd << std::endl;// 下面使用多线程来和用户端进行通信pthread_t tid;ThreadData *td = new ThreadData(sockfd);pthread_create(&tid, nullptr, ThreadRun, td);}return true;}static string ReadHtmlContent(const string &htmlpath) // 读html文件,将它的内容存到content{// 坑ifstream in(htmlpath);if (!in.is_open())return "";std::cout << htmlpath << std::endl;string content;string line;while (getline(in, line)){content += line;}in.close();return content;}static void HandlerHttp(int sockfd){char buffer[10240];ssize_t n = recv(sockfd, buffer, sizeof(buffer) - 1, 0);// 注意这里我们不用read了,而是使用recv函数,这个和read非常类似,第3个参数为0的时候,功能和read一模一样if (n > 0) // 读取成功{buffer[n] = 0;cout << buffer <<  std::endl; // 输出HTTP请求// 这里是巨大变化HttpRequest req;req.Deserialize(buffer);req.Parse();req.DebugPrint();// 返回响应的过程,这里需要返回一个HTTP响应协议std::cout << req.file_path << std::endl;bool ok=true;string text = ReadHtmlContent(req.file_path);//HTTP协议有效载荷——这里是一个简单的网页,这个网页放在req.file_pathif(text.empty()){ok=false;std::string err_html=wwwroot;err_html+="/err.html";text=ReadHtmlContent(err_html);//}string response_line;if(ok){ response_line="HTTP/1.0 200 OK\r\n";//HTTP响应协议的第一行的版本号 状态码 状态码描述}else{response_line="HTTP/1.0 404 Not Found\r\n";//HTTP响应协议的第一行的版本号 状态码 状态码描述}string response_header = "Content-Length: ";//HTTP报头的最后一行需要记录有效载荷的大小response_header += to_string(text.size()); // 11response_header += "\r\n";//结束这一行string  block_line = "\r\n";//这一行是空行,用来区分协议报头和有效载荷string response = response_line;response += response_header;response += block_line;response += text;//response 最终就是"HTTP/1.0 200 OK\r\nContent-Length: 11\r\n\r\nhello world"send(sockfd, response.c_str(), response.size(), 0);//注意这里不用write了,//send前几个参数和write基本一样,当send第4个为0的时候功能和write一模一样}close(sockfd);}static void *ThreadRun(void *args){pthread_detach(pthread_self()); // 分离线程ThreadData *td = static_cast<ThreadData *>(args);HandlerHttp(td->_sockfd); // 执行http的任务delete td;return nullptr;}~HttpServer(){}private:Sock _listensockfd; // 用于监听的uint16_t _port;     // 用于发送消息的
};

 结果: 

2.5.2 见一见3XX状态码(代码)

这里只需要修改部分代码:

class HttpServer
{
......static void HandlerHttp(int sockfd){.......response_line="HTTP/1.0 302 Found\r\n";string response_header = "Content-Length: ";//HTTP报头的最后一行需要记录有效载荷的大小response_header += to_string(text.size()); // 11response_header += "\r\n";//结束这一行response_header += "Location: https://www.baidu.com";//注意这里string  block_line = "\r\n";//这一行是空行,用来区分协议报头和有效载荷string response = response_line;response += response_header;response += block_line;response += text;//response 最终就是"HTTP/1.0 200 OK\r\nContent-Length: 11\r\n\r\nhello world"send(sockfd, response.c_str(), response.size(), 0);//注意这里不用write了,//send前几个参数和write基本一样,当send第4个为0的时候功能和write一模一样....}};

2.6 HTTP常见的Header

  • Content-Type:数据类型(text / html 等)
  • Content-Length:Body 的长度,用于指示客户端应该接收多少字节的响应
  • Host:客户端告知服务器,所请求的资源是在哪个主机的哪个端口上
  • User-Agent:声明用户的操作系统和浏览器版本信息
  • referer:当前页面是从哪个页面跳转过来的
  • location:搭配 3xx 状态码使用,告诉客户端接下来要去哪里访问
  • Cookie:用于在客户端存储少量信息,通常用于实现会话(session)的功能

Keep-Alive(长连接):

HTTP 的长连接和短连接都是指在 TCP 层面上的连接。HTTP 协议是基于 TCP 协议的,每次 HTTP 请求和响应都需要建立和断开 TCP 连接,因此在高并发场景下会产生大量的 TCP 连接开销,从而影响性能。如果HTTP请求或响应报头当中的Connect字段对应的值是Keep-Alive,就代表支持长连接。

短连接:

指每次HTTP请求和响应都建立一个新的 TCP 连接,并在请求结束后立即关闭连接。这种方式下,每次请求都需要重新建立和断开 TCP 连接,会增加连接管理的负担和开销。在 HTTP/1.0 中,HTTP 默认采用短连接,也就是每次请求和响应都建立和断开一次 TCP 连接。

总结:

如今的HTTP/1.1是支持长连接的。所谓的长连接就是建立连接后,客户端可以不断地向服务器一次写入多个HTTP请求,而服务器在上层一次读取这些请求就行了,此时一条连接就可以传送大量的请求和响应。

长连接和短连接有优缺点:

长连接可以减少 TCP 连接的建立和断开次数,降低网络开销,但长时间占用连接会增加服务器资源消耗;短连接可以保证每个请求的独立性,减少因单个请求错误导致的影响,但频繁的 TCP 连接建立和断开会影响性能。因此,根据具体的应用场景和需求选择长连接或短连接,或者结合两者的优点,使用 HTTP/2 的多路复用技术。

2.7 Cookie(会话)和Session(会期)

HTTP的特征:

  • 无状态:每个 HTTP 请求都是独立的,服务器不会保存任何客户端的请求信息,因此 HTTP 被称为无状态协议。为了维护客户端状态,通常使用 Cookie 和 Session技术。
  • 可扩展:HTTP 报头可以通过添加自定义报头实现扩展功能。
  • 灵活:HTTP 可以传输任何类型的数据,如 HTML、图片、音频、视频等。
  • 明文传输:HTTP 是明文传输的,请求和响应中的所有内容都可以被窃听,因此使用 HTTPS 进行加密。
  • 请求 / 响应模型:HTTP 采用客户端-服务器模型,客户端发送请求,服务器发送响应。
  • 无连接:HTTP 协议不维护连接,连接是 TCP 协议维护的,HTTP直接发起请求和响应即可。
  • 缓存:HTTP 支持缓存,可以通过在响应报头中添加缓存信息控制客户端和服务器的缓存机制。

补充说明:

虽然在HTTP的特征中有 无状态 的特点,但是我们可以发现每次在使用浏览器的时候却不是这样的,当我们在使用账号和密码登陆到一个网站的时候,无论我们将该网站关闭还是将浏览器关闭,当我们再次打开该网站时,我们发现我们的账号还是处于登录状态。

但是在实际应用中,为了实现用户的登录状态等功能,网站会在服务器端保存用户的会话状态,并分配给用户一个唯一的 会话标识符(Session ID),这个会话标识符可以在每次请求时传递给服务器,服务器就可以根据这个标识符识别用户,从而实现用户状态的保持。

2.7.1 Cookie

概念:

Cookie 是一种小的文本信息,由服务器发送给客户端的浏览器,然后由浏览器存储在用户的计算机上。它主要用于跟踪和维护Web应用程序的状态,以便在不同的HTTP请求之间保持用户的特定信息。简单点来说就是,HTTP不支持记录用户状态,我们需要一种技术来帮我们支持,这种技术目前现在已经内置到HTTP协议当中了,他就是Cookie。

  

补充说明:

当我们认证通过后在服务端会进行Set-Cookie设置,当服务器在对浏览器进行HTTP响应时就会将这个Set-Cookie相应给浏览器,浏览器收到响应后自动提取出Set-Cookie的值,并将其保存在浏览器的Cookie文件中,此时就相当于我们的账号密码等信息保存在了本地浏览器的Cookie文件中。

当我们再次向该网站发起HTTP请求时,该请求当中就会自动包含一个Cookie字段,Cookie字段中携带的就是我们第一次的认证信息。因此之后对端服务器在进行认证时只需要提取出HTTP请求当中的Cookie字段即可。

Cookie的种类:本质上就时浏览器当中的一个小文件,文件里记录的是用户的私有信息

  • 文件级的 Cookie 文件是存储在用户计算机上的硬盘上,是一种持久性的 Cookie。它们的过期时间可以设置为一段时间,也可以永不过期。在访问同一个网站时,浏览器会自动发送该网站存储在本地计算机上的 Cookie文件,以便在服务器端进行身份验证和授权操作。
  • 内存级的 Cookie 文件是存储在内存中的临时 Cookie。当浏览器关闭时,它们会自动删除。内存级的 Cookie 可以用于存储一些敏感信息,如密码和银行账户信息等,以提高安全性。

2.7.2 SessionID

概念:

如果我们仅仅使用Cookie是不安全的,因为此时Cookie文件当中是我们的私密信息,一旦Cookie文件泄露我们的隐私信息也会泄露。所以就引入了SessionID这样的概念。

当我们第一次输入账号密码验证成功后,服务端就会生成一个对应的Session ID,并将其发送给客户端。之后,客户端每次请求都会携带这个 Session ID,服务器就可以根据 Session ID 查找对应的会话对象,获取用户的相关信息,从而实现用户状态的保持。这个Session ID与用户信息是不相关的。同时系统会将所有登录用户的Session ID统一维护起来。

  

2.8 构建HTTP请求和响应(补充代码)


2.8.1 见见简单的HTTP请求

概念说明:

事实上,上面那些http请求报头都是加密过,其实显示出来的效果不好。我们可以自己写一个代码来获取HTTP请求,首先我们需要使用套接字,所以我们需要将我们之前封装好的套接字拿过来。

Socket.hpp:

#pragma once  #include <iostream>  
#include <string>  
#include <unistd.h>  
#include <cstring>  
#include <sys/types.h>  
#include <sys/stat.h>  
#include <sys/socket.h>  
#include <arpa/inet.h>  
#include <netinet/in.h>  // 定义一些错误代码  
enum  
{  SocketErr = 2,    // 套接字创建错误  BindErr,          // 绑定错误  ListenErr,        // 监听错误  
};  // 监听队列的长度  
const int backlog = 10;  class Sock  //服务器专门使用
{  
public:  Sock() : sockfd_(-1) // 初始化时,将sockfd_设为-1,表示未初始化的套接字  {  }  ~Sock()  {  // 析构函数中可以关闭套接字,但这里选择不在析构函数中关闭,因为有时需要手动管理资源  }  // 创建套接字  void Socket()  {  sockfd_ = socket(AF_INET, SOCK_STREAM, 0);  if (sockfd_ < 0)  {  printf("socket error, %s: %d", strerror(errno), errno); //错误  exit(SocketErr); // 发生错误时退出程序  }  }  // 将套接字绑定到指定的端口上  void Bind(uint16_t port)  {  //让服务器绑定IP地址与端口号struct sockaddr_in local;  memset(&local, 0, sizeof(local));//清零  local.sin_family = AF_INET;  // 网络local.sin_port = htons(port);  // 我设置为默认绑定任意可用IP地址local.sin_addr.s_addr = INADDR_ANY; // 监听所有可用的网络接口  if (bind(sockfd_, (struct sockaddr *)&local, sizeof(local)) < 0)  //让自己绑定别人{  printf("bind error, %s: %d", strerror(errno), errno);  exit(BindErr);  }  }  // 监听端口上的连接请求  void Listen()  {  if (listen(sockfd_, backlog) < 0)  {  printf("listen error, %s: %d", strerror(errno), errno);  exit(ListenErr);  }  }  // 接受一个连接请求  int Accept(std::string *clientip, uint16_t *clientport)  {  struct sockaddr_in peer;  socklen_t len = sizeof(peer);  int newfd = accept(sockfd_, (struct sockaddr*)&peer, &len);  if(newfd < 0)  {  printf("accept error, %s: %d", strerror(errno), errno);  return -1;  }  char ipstr[64];  inet_ntop(AF_INET, &peer.sin_addr, ipstr, sizeof(ipstr));  *clientip = ipstr;  *clientport = ntohs(peer.sin_port);  return newfd; // 返回新的套接字文件描述符  }  // 连接到指定的IP和端口——客户端才会用的  bool Connect(const std::string &ip, const uint16_t &port)  {  struct sockaddr_in peer;//服务器的信息  memset(&peer, 0, sizeof(peer));  peer.sin_family = AF_INET;  peer.sin_port = htons(port);inet_pton(AF_INET, ip.c_str(), &(peer.sin_addr));  int n = connect(sockfd_, (struct sockaddr*)&peer, sizeof(peer));  if(n == -1)   {  std::cerr << "connect to " << ip << ":" << port << " error" << std::endl;  return false;  }  return true;  }  // 关闭套接字  void Close()  {  close(sockfd_);  }  // 获取套接字的文件描述符  int Fd()  {  return sockfd_;  }  private:  int sockfd_; // 套接字文件描述符  
};

我们可以自己来写一个代码来获取到HTTP请求:

#pragma once // 防止头文件被重复包含  #include <iostream> // 引入标准输入输出流库  
#include <string> // 引入字符串库  
#include <pthread.h> // 引入POSIX线程库  
#include "Socket.hpp" // 假设这是一个封装了socket操作的类  using namespace std; // 使用标准命名空间  // 定义默认端口号  
static const uint16_t defaultport = 8080;  // 线程数据结构体,用于在线程间传递socket文件描述符  
struct ThreadData  
{  int sockfd; // socket文件描述符  
};  // HTTP服务器类  
class HttpServer  
{  
public:  // 构造函数,初始化服务器监听的端口  HttpServer(uint16_t port = defaultport)  : _port(port) // 初始化成员变量_port  {  }  // 启动服务器  bool Start()  {  _listensockfd.Socket(); // 创建socket  _listensockfd.Bind(_port); // 绑定socket到指定的端口  _listensockfd.Listen(); // 开始监听端口  for(;;) // 无限循环,等待连接  {  string clientip; // 用于存储客户端IP地址  uint16_t clientport; // 用于存储客户端端口号  int sockfd = _listensockfd.Accept(&clientip, &clientport); // 接受连接,返回新的socket文件描述符  pthread_t tid; // POSIX线程标识符  printf("get a new connect, sockfd: %d\n", sockfd);  // 创建线程数据并传递给新线程  ThreadData *td = new ThreadData;  td->sockfd = sockfd;  pthread_create(&tid, nullptr, ThreadRun, td); // 创建新线程处理客户端请求  }  return true; // 注意:这里的return实际上永远不会被执行,因为for循环是无限的  }  // 静态成员函数,用于处理客户端请求  static void *ThreadRun(void *args)  {  pthread_detach(pthread_self()); // 分离线程,让线程在结束时自动释放资源  ThreadData *td = static_cast<ThreadData *>(args); // 将void*类型的参数转换为ThreadData*  char buffer[10240]; // 接收数据的缓冲区  ssize_t n = recv(td->sockfd, buffer, sizeof(buffer)-1, 0); // 接收客户端发送的数据  if (n > 0) // 如果接收到数据  {  buffer[n] = 0; // 确保字符串以null字符结尾  cout << buffer; // 输出HTTP请求  }  close(td->sockfd); // 关闭socket连接  delete td; // 释放线程数据占用的内存  return nullptr; // 线程结束  }  // 析构函数,用于清理资源(但在这个例子中,没有特别的资源需要清理)  ~HttpServer()  {  }  private:  Sock _listensockfd; // 监听socket对象  uint16_t _port; // 服务器监听的端口号  
};  

然后我们通过主函数给我们的服务器传入端口号,就可以正常启动我们的服务器了:

#include "HttpServer.hpp"
#include <iostream>
#include <memory>
#include <pthread.h>using namespace std;int main(int argc, char *argv[])
{if(argc != 2){exit(1);}uint16_t port = std::stoi(argv[1]);std::unique_ptr<HttpServer> svr(new HttpServer(port));svr->Start();return 0;
}

2.8.2 见见简单的HTTP响应

概念:

实现一个最简单的HTTP服务器,只在网页上输出 "hello world",只要我们按照HTTP协议的要求构造数据,就很容易能做到。

HTTPserver.hpp:

#pragma once#include <iostream>
#include <string>
#include <pthread.h>
#include <sys/types.h>
#include <sys/socket.h>
#include"Socket.hpp"using namespace std;static const uint16_t defaultport = 8877;class HttpServer;//声明class ThreadData//传给线程的数据
{
public:ThreadData(int fd): _sockfd(fd){}public:int _sockfd;
};class HttpServer
{
public:HttpServer(uint16_t port = defaultport): _port(port){}bool Start(){_listensockfd.Socket();_listensockfd.Bind(_port);_listensockfd.Listen();for (;;){//获取用户信息string clientip;uint16_t clientport;//两个都是输出型参数//注意Accept成员函数会返回一个新的套接字,专门用于发送信息的int sockfd = _listensockfd.Accept(&clientip, &clientport);//这里获取了客户端IP和端口号if(sockfd < 0) continue;std::cout<<"get a new connect, sockfd:"<<sockfd<<std::endl;//下面使用多线程来和用户端进行通信pthread_t tid; ThreadData *td = new ThreadData(sockfd);pthread_create(&tid, nullptr, ThreadRun, td);}return true;}static void HandlerHttp(int sockfd){char buffer[10240];ssize_t n = recv(sockfd, buffer, sizeof(buffer) - 1, 0);//注意这里我们不用read了,而是使用recv函数,这个和read非常类似,第3个参数为0的时候,功能和read一模一样if (n > 0)//读取成功{buffer[n] = 0;cout << buffer; // 输出HTTP请求// 返回响应的过程,这里需要返回一个HTTP响应协议string text = "hello world";//HTTP协议有效载荷string response_line = "HTTP/1.0 200 OK\r\n";//HTTP响应协议的第一行的版本号 状态码 状态码描述string response_header = "Content-Length: ";//HTTP报头的最后一行需要记录有效载荷的大小response_header += to_string(text.size()); // 11response_header += "\r\n";//结束这一行string  block_line = "\r\n";//这一行是空行,用来区分协议报头和有效载荷string response = response_line;response += response_header;response += block_line;response += text;//response 最终就是"HTTP/1.0 200 OK\r\nContent-Length: 11\r\n\r\nhello world"send(sockfd, response.c_str(), response.size(), 0);//注意这里不用write了,//send前几个参数和write基本一样,当send第4个为0的时候功能和write一模一样}close(sockfd);}static void *ThreadRun(void *args){pthread_detach(pthread_self());//分离线程ThreadData *td = static_cast<ThreadData *>(args);HandlerHttp(td->_sockfd);//执行http的任务delete td;return nullptr;}~HttpServer(){}private:Sock _listensockfd;//用于监听的uint16_t _port;//用于发送消息的
};

HTTPserver.cc:

#include"HTTPserver.hpp"
#include <iostream>
#include <string>
#include <memory>int main()
{unique_ptr<HttpServer> psvr (new HttpServer());psvr->Start();return 0;
}

makefile:

HttpServer : HTTPserver.ccg++ -o $@ $^ -std=c++11 -lpthread.PHONY:clean
clean:rm -rf HttpServer

2.8.3 完整型代码

  • 我们需要让他可以动态存储
  • 我们需要让他可以实现网页的刷新

HttpServer.hpp测试版:

#pragma once#include <iostream>
#include <string>
#include <pthread.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <fstream>
#include <sstream>
#include <vector>
#include "Socket.hpp"using namespace std;static const uint16_t defaultport = 8877;
const string wwwroot = "./wwwroot"; // web 根目录
const string homepath = "/index.html"; 
const std::string sep = "\r\n";class HttpRequest
{
public:// 反序列化函数,用于将字符串格式的HTTP请求分解为请求头和请求体void Deserialize(std::string req){// 假设sep是一个成员变量,用于分隔请求头和请求体,但在此代码段中未定义// 这里应该是用于分割请求头中每一行的分隔符,例如"\r\n"// while循环用于遍历字符串,直到找不到分隔符while (true){// 在请求字符串中查找分隔符\r\n的位置size_t pos = req.find(sep);// 如果没有找到分隔符\r\n,则退出循环if (pos == string::npos)break;// 截取从开头到分隔符\r\n之前的字符串作为请求头的一部分string temp = req.substr(0, pos);// 如果截取的字符串为空,则也退出循环(这通常是不必要的,因为find不会返回0位置除非是空字符串)if (temp.empty())break;// 将截取的字符串添加到请求头向量中req_header.push_back(temp);// 从请求字符串中移除已经处理的部分,包括分隔符req.erase(0, pos + sep.size());}// 剩下的字符串(如果有的话)被认为是请求正文text = req;}// 解析函数,用于解析请求行的第一部分(通常是HTTP方法、URL和HTTP版本)void Parse(){// 使用stringstream和字符串流输入操作符来解析请求行的第一个元素std::stringstream ss(req_header[0]); // 将第一行交给ss// 将请求行解析为HTTP方法、URL和HTTP版本ss >> method >> url >> http_version; // gei第一个单词会给method,第二个会给url,第3个会给http_versionfile_path=wwwroot;//./wwwrootif(url=="/" || url=="/index.html"){file_path+=homepath;// ./wwwroot/index.html}else{file_path+=url;//./wwwroot/url}  }// 调试打印函数,用于输出请求的所有信息void DebugPrint(){// 遍历请求头,并打印每一行for (auto &line : req_header){std::cout << "--------------------------------" << std::endl;std::cout << line << "\n\n";}// 打印解析后的HTTP方法、URL和HTTP版本std::cout << "method: " << method << std::endl;std::cout << "url: " << url << std::endl;std::cout << "http_version: " << http_version << std::endl;std::cout << "file_path: " << file_path << std::endl;// 打印请求正文std::cout << text << std::endl;}public:std::vector<std::string> req_header; // 用于存储请求头的字符串向量std::string text;                    // 用于存储请求正文的字符串std::string file_path;//用于存储转换后的文件地址  // 解析请求行之后得到的结果std::string method;       // HTTP方法,如GET、POSTstd::string url;          // 请求的URLstd::string http_version; // HTTP的版本号,如HTTP/1.1
};class HttpServer; // 声明class ThreadData // 传给线程的数据
{
public:ThreadData(int fd): _sockfd(fd){}public:int _sockfd;
};class HttpServer
{
public:HttpServer(uint16_t port = defaultport): _port(port){}bool Start(){_listensockfd.Socket();_listensockfd.Bind(_port);_listensockfd.Listen();for (;;){// 获取用户信息string clientip;uint16_t clientport;// 两个都是输出型参数// 注意Accept成员函数会返回一个新的套接字,专门用于发送信息的int sockfd = _listensockfd.Accept(&clientip, &clientport); // 这里获取了客户端IP和端口号if (sockfd < 0)continue;std::cout << "get a new connect, sockfd:" << sockfd << std::endl;// 下面使用多线程来和用户端进行通信pthread_t tid;ThreadData *td = new ThreadData(sockfd);pthread_create(&tid, nullptr, ThreadRun, td);}return true;}static string ReadHtmlContent(const string &htmlpath) // 读html文件,将它的内容存到content{// 坑ifstream in(htmlpath);if (!in.is_open())return "404";string content;string line;while (getline(in, line)){content += line;}in.close();return content;}static void HandlerHttp(int sockfd){char buffer[10240];ssize_t n = recv(sockfd, buffer, sizeof(buffer) - 1, 0);// 注意这里我们不用read了,而是使用recv函数,这个和read非常类似,第3个参数为0的时候,功能和read一模一样if (n > 0) // 读取成功{buffer[n] = 0;cout << buffer; // 输出HTTP请求// 这里是巨大变化HttpRequest req;req.Deserialize(buffer);req.Parse();req.DebugPrint();// 返回响应的过程,这里需要返回一个HTTP响应协议string text = ReadHtmlContent(req.file_path);//HTTP协议有效载荷——这里是一个简单的网页,这个网页放在req.file_pathstring response_line = "HTTP/1.0 200 OK\r\n";//HTTP响应协议的第一行的版本号 状态码 状态码描述string response_header = "Content-Length: ";//HTTP报头的最后一行需要记录有效载荷的大小response_header += to_string(text.size()); // 11response_header += "\r\n";//结束这一行string  block_line = "\r\n";//这一行是空行,用来区分协议报头和有效载荷string response = response_line;response += response_header;response += block_line;response += text;//response 最终就是"HTTP/1.0 200 OK\r\nContent-Length: 11\r\n\r\nhello world"send(sockfd, response.c_str(), response.size(), 0);//注意这里不用write了,//send前几个参数和write基本一样,当send第4个为0的时候功能和write一模一样}close(sockfd);}static void *ThreadRun(void *args){pthread_detach(pthread_self()); // 分离线程ThreadData *td = static_cast<ThreadData *>(args);HandlerHttp(td->_sockfd); // 执行http的任务delete td;return nullptr;}~HttpServer(){}private:Sock _listensockfd; // 用于监听的uint16_t _port;     // 用于发送消息的
};

index2.html 跳转外部网页版:

<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>Document</title>
</head>
<body><h1>这个是我们的尾页</h1><a href="https://www.baidu.com/">百度官网</a> 
</body>
</html>

三、结束语 

       今天内容就到这里啦,时间过得很快,大家沉下心来好好学习,会有一定的收获的,大家多多坚持,嘻嘻,成功路上注定孤独,因为坚持的人不多。那请大家举起自己的小手给博主一键三连,有你们的支持是我最大的动力💞💞💞,回见。

​​ 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/8825.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

计算生物学与生物信息学漫谈-5-mapping算法

之前的文章我们介绍了参考基因组&#xff0c;也介绍了一些基本概念&#xff0c;具体可以看之前的博客&#xff1a; 计算生物学与生物信息学漫谈-4-参考基因组与Mapping准备_基因组的map-CSDN博客 这次我们讲如何将read map到基因组上所用到的各种算法&#xff1a; 目录 1.1 …

qsqlmysql.lib的编译和使用

文章目录 打开源码 打开源码 打开qt源码安装路径 src相对路径下的文件Src\qtbase\src\plugins\sqldrivers\mysql 比如我是5.9.9版本我的路径就是&#xff1a;D:\Qt5.9.9\5.9.9\Src\qtbase\src\plugins\sqldrivers\mysql 可以看到待编译的mysql驱动文件 使用IDE打开pro文件进…

leetcode 693.交替位二进制数

1.题目要求&#xff1a; 2.题目代码: class Solution { public:bool hasAlternatingBits(int n) {int num n;//设置数组存入二进制位vector<int> array;while(num){array.push_back(num % 2); num num / 2;}//把数组颠倒就能得到此数真正二进制位reverse(array.begin…

IP协议知识点总结

IP协议主要分为三个 1. 地址管理 每个网络上的设备, 要能分配一个唯一的地址 2. 路由选择 小A 给小B 发消息, 具体应该走什么路线 3. 地址管理 IP 地址. 本质上是一个 32 位的整数 通常将, 32 位的整数使用点分十进制来表示, 如 192.168.1.1 一共可以表示 42 亿 9 千万个地址…

【重学 MySQL】八十二、深入探索 CASE 语句的应用

【重学 MySQL】八十二、深入探索 CASE 语句的应用 CASE语句的两种形式CASE语句的应用场景数据分类动态排序条件计算在 SELECT 子句中使用在 WHERE子句中使用在 ORDER BY 子句中使用 注意事项 在MySQL中&#xff0c;CASE 语句提供了一种强大的方式来实现条件分支逻辑&#xff0c…

机器学习1_机器学习定义——MOOC

一、机器学习定义 定义一 1959年Arthur Samuel提出机器学习的定义&#xff1a; Machine Learning is Fields of study that gives computers the ability to learn without being explicitly programmed. 译文&#xff1a;机器学习是这样的领域&#xff0c;它赋予计算机学习的…

充电桩--OCPP 充电通讯协议介绍

一、OCPP协议介绍 OCPP的全称是 Open Charge Point Protocol 即开放充电点协议&#xff0c; 它是免费开放的协议&#xff0c;该协议由位于荷兰的组织 OCA&#xff08;开放充电联盟&#xff09;进行制定。Open Charge Point Protocol (OCPP) 开放充电点协议用于充电站(CS)和任何…

如何制作公司小程序

我是【码云数智】平台的黄导&#xff0c;今天分享&#xff1a;如何制作公司小程序 企业小程序怎么制作&#xff0c;企业小程序制作不仅成为了连接消费者与品牌的桥梁&#xff0c;更是企业数字化转型的重要一环。 01、小程序制作流程 02、微信小程序开发多少钱 03、微信小程…

明道云正式发布国际品牌Nocoly

在2024年明道云伙伴大会上&#xff0c;明道云正式发布了其国际品牌Nocoly以及国际版产品Nocoly HAP。这标志着公司正式开启了海外业务。明道云的海外业务由全资拥有的Nocoly.com Limited经营&#xff0c;该公司注册在香港特别行政区。总部位于上海的明道云已经将围绕HAP超级应用…

如何构建一个可扩展的测试自动化框架?

以下为作者观点&#xff1a; 假设你是测试自动化方面的新手&#xff0c;想参与构建一个框架。在这种情况下&#xff0c;重要的是要了解框架所需的组件&#xff0c;以及它们是如何组合的。思考项目的具体需求和目标&#xff0c;以及可能遇到的困难和挑战。 假如你是一个测试架…

C++builder中的人工智能(11):双曲正切激活函数(ANN函数)?

在这篇文章中&#xff0c;我们将探讨双曲正切函数&#xff08;tanh&#xff09;是什么&#xff0c;以及如何在C中使用这个函数。让我们来回答这些问题。 在AI中激活函数意味着什么&#xff1f; 激活函数&#xff08;phi()&#xff09;&#xff0c;也称为转移函数或阈值函数&a…

基于SSM+VUE宠物医院后台管理系统JAVA|VUE|Springboot计算机毕业设计源代码+数据库+LW文档+开题报告+答辩稿+部署教+代码讲解

源代码数据库LW文档&#xff08;1万字以上&#xff09;开题报告答辩稿 部署教程代码讲解代码时间修改教程 一、开发工具、运行环境、开发技术 开发工具 1、操作系统&#xff1a;Window操作系统 2、开发工具&#xff1a;IntelliJ IDEA或者Eclipse 3、数据库存储&#xff1a…

二、SSM框架制作CRM系统案例

一、搭建框架 1、首先创建下面的目录结构 2、添加相关依赖&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-inst…

【GPTs】Email Responder Pro:高效生成专业回复邮件

博客主页&#xff1a; [小ᶻZ࿆] 本文专栏: AIGC | GPTs应用实例 文章目录 &#x1f4af;GPTs指令&#x1f4af;前言&#x1f4af;Email Responder Pro主要功能适用场景优点缺点 &#x1f4af;小结 &#x1f4af;GPTs指令 Email Craft is a specialized assistant for cra…

知识课堂之域名系统中实现动态代理

怎么在域名系统中解析动态ip&#xff0c;这一直是一个需要解决的问题&#xff0c;人们对与网络的稳定连接与灵活运用已经成为生活和工作中不可或缺的一部分&#xff0c;因此这样的问题的解决迫在眉睫。 大家对于动态ip是什么&#xff0c;应该都有所了解了&#xff0c;所谓的动…

【Go语言】| 第1课:Golang安装+环境配置+Goland下载

&#x1f60e; 作者介绍&#xff1a;我是程序员洲洲&#xff0c;一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。 &#x1f913; 同时欢迎大家关注其他专栏&#xff0c;我将分享Web前后端开发、人工智能、机器学习、深…

程序猿要失业了,一行代码没写,1小时嘴搓了一个图片分割插件(好看又好用)

如题&#xff0c;一行代码没写&#xff0c;使用 AI 编程工具实现了一个浏览器图片分割插件的开发&#xff0c;先看效果吧&#xff08; Chrome商店上架审核中~ &#xff09; 支持点击&#xff0c;拖拽&#xff0c;直接粘贴&#xff0c;还支持预览&#xff0c;次数统计&#xff0…

基于SpringBoot+Vue实现新零售商城系统

作者主页&#xff1a;编程千纸鹤 作者简介&#xff1a;Java领域优质创作者、CSDN博客专家 、CSDN内容合伙人、掘金特邀作者、阿里云博客专家、51CTO特邀作者、多年架构师设计经验、多年校企合作经验&#xff0c;被多个学校常年聘为校外企业导师&#xff0c;指导学生毕业设计并参…

【湖南】《湖南省省直单位政府投资信息化项目预算编制与财政评审工作指南(试行)》湘财办〔2024〕10号-省市费用标准解读系列06

2024年4月12日&#xff0c;湖南省财政厅发布实施《湖南省省直单位政府投资信息化项目预算编制与财政评审工作指南&#xff08;试行&#xff09;》湘财办〔2024〕10号&#xff08;以下简称“10号文”&#xff09;&#xff0c;该文件旨在指导提高湖南省直单位政府投资信息化项目预…