初始爬虫1(补充)
TCP 和 UDP 是什么?
TCP(Transmission Control Protocol)和 UDP(User Datagram Protocol)都是传输层协议,它们负责在计算机网络上发送和接收数据包。两者有不同的特性和适用场景:
TCP(传输控制协议)
连接导向:TCP 是一种面向连接的协议,意味着在发送数据之前,必须先建立一个可靠的连接(例如三次握手)。
可靠性:TCP 提供可靠的数据传输,确保数据包按顺序到达,并且会进行错误检测和重传丢失的数据。
流量控制:TCP 有内置的流量控制和拥塞控制机制,确保不会发送过多的数据导致接收方缓冲区溢出。
用途:适用于需要高可靠性的场景,如网页浏览(HTTP/HTTPS)、文件传输(FTP)、电子邮件(SMTP)等。
UDP(用户数据报协议)
无连接:UDP 是一种无连接的协议,发送数据时不需要建立连接,数据报文直接发送,不保证接收方是否收到。
不可靠:UDP 不提供数据重传、流量控制等机制,发送的数据可能丢失或到达顺序可能错乱。
效率高:由于没有连接建立、重传机制,UDP 的数据传输速度比 TCP 快,适合需要低延迟的场景。
用途:适用于对可靠性要求不高,但对实时性要求高的场景,如视频流、语音通话、在线游戏、DNS 查询等。
TCP客户端转换为UDP无连接通信:
1. 套接字创建:将 SOCK_STREAM 改为 SOCK_DGRAM。
2. 连接方式:在 UDP 中不需要 connect(),直接使用 sendto() 发送数据。
3. 接收方式:使用 recvfrom() 代替 recv(),因为 UDP 不需要保持连接,它会返回发送方的地址。
4. 退出和错误处理:UDP 是无连接协议,因此退出时直接关闭套接字,不需要特定的断开逻辑。
两个代码实现TCP客户端和TCP服务器端通过TCP协议传输消息,实现基本的网络通信。
原代码:TCP客户端,两个代码需要先后共同运行。
# -*- coding: utf-8 -*-
"""
Created on Mon Sep 13 17:38:35 2021
@author: Administrator
"""
#首先打开服务器,这里是服务器的程序,打开后再运行客户端程序
#netstat -an |find /i "50000"
#TCP 服务端程序 client.py#
from socket import *
IP ='127.0.0.1'
SERVER_PORT = 50000
BUFLEN = 512
#实例化一个socket对象
#参数AF_INET 表示该socket网络层使用IP协议
#参数SOCK_STREAM 表示该socket传输层使用tcp协议
listenSocket = socket(AF_INET, SOCK_STREAM)
#连接服务端socket#
listenSocket.bind((IP,SERVER_PORT))
#使socket处于监听状态,等待客户端的连接请求
#参数5表示 最多接受多少个等待连接的客户端
listenSocket.listen(5)
print(f'服务器端启动成功,在{SERVER_PORT}端口等待客户端连接。。。')
dataSocket,addr = listenSocket.accept()
print('接受一个客户端连接:',addr)
while True:
#尝试读取对方发送信息
#buflen 指定从接受缓存里最多读取多少字节
recved = dataSocket.recv(BUFLEN)
#如果返回空bytes,表示对方关闭了连接
#推出循环,结束消息收发
if not recved:
break
#读取的字节数据是bytes类型,需要解码为字符串
info = recved.decode()
print(f'收到对方消息:{info}')
#发送消息,也要编码为bytes
dataSocket.send(f'服务器收到消息 {info}'.encode())
dataSocket.close()
listenSocket.close()
# -*- coding: utf-8 -*-
"""
Created on Mon Sep 13 17:51:16 2021
@author: Administrator
"""
#客户端程序
#TCP 服务端程序 client.py
##等待客户端来连接
from socket import *
IP ='127.0.0.1'
SERVER_PORT = 50000
BUFLEN = 1024
#实例化一个socket对象
dataSocket = socket(AF_INET, SOCK_STREAM)
# 连接服务器socket
dataSocket.connect((IP,SERVER_PORT))
while True:
#从终端读入用户输入的字符串
toSend = input('>> ')
if toSend == 'exit':
break
#发送消息,也要编码为bytes
dataSocket.send(toSend.encode())
#等待接收服务端的消息
recved = dataSocket.recv(BUFLEN)
#如果返回空bytes,表示对方关闭了连接
if not recved:
break
#打印读取的信息
print(recved.decode())
dataSocket.close()
TCP客户端转换为UDP无连接通信
# -*- coding: utf-8 -*-
# 套接字创建:将 SOCK_STREAM 改为 SOCK_DGRAM,以使用 UDP 协议。
# 连接处理:UDP 是无连接的,所以不需要 listen() 和 accept() 操作。直接接收来自客户端的数据。
# 接收和发送数据:使用 recvfrom() 接收数据,并且通过 sendto() 返回数据给客户端。
from socket import *
# 定义服务器IP和端口
IP = '127.0.0.1'
SERVER_PORT = 50000
BUFLEN = 512
# 实例化一个 UDP socket 对象,使用 SOCK_DGRAM
listenSocket = socket(AF_INET, SOCK_DGRAM)
# 绑定服务器地址和端口
listenSocket.bind((IP, SERVER_PORT))
print(f'服务器端启动成功,在{SERVER_PORT}端口等待客户端消息...')
while True:
# 尝试接收来自客户端的消息(recvfrom返回数据和客户端地址)
recved, addr = listenSocket.recvfrom(BUFLEN)
# 如果返回空bytes,表示对方可能关闭了连接
if not recved:
break
# 将收到的字节数据解码为字符串
info = recved.decode()
print(f'收到来自{addr}的消息:{info}')
# 发送回复消息给客户端
listenSocket.sendto(f'服务器收到消息 {info}'.encode(), addr)
# 关闭socket
listenSocket.close()
# -*- coding: utf-8 -*-
# TCP客户端转换为UDP无连接通信
# 套接字创建:将 SOCK_STREAM 改为 SOCK_DGRAM。
# 连接方式:在 UDP 中不需要 connect(),直接使用 sendto() 发送数据。
# 接收方式:使用 recvfrom() 代替 recv(),因为 UDP 不需要保持连接,它会返回发送方的地址。
# 退出和错误处理:UDP 是无连接协议,因此退出时直接关闭套接字,不需要特定的断开逻辑。
from socket import *
# 定义服务器的IP地址和端口号
IP = '127.0.0.1'
SERVER_PORT = 50000
BUFLEN = 1024
# 实例化一个 UDP socket 对象,使用 SOCK_DGRAM
dataSocket = socket(AF_INET, SOCK_DGRAM)
while True:
# 从终端读入用户输入的字符串
toSend = input('>> ')
# 输入 'exit' 时退出
if toSend == 'exit':
break
# 发送消息(注意 UDP 使用 sendto 发送数据,并指定目标地址)
dataSocket.sendto(toSend.encode(), (IP, SERVER_PORT))
# 等待接收服务端的消息
recved, addr = dataSocket.recvfrom(BUFLEN)
# 如果接收到空的bytes,表示对方可能关闭了连接(UDP中一般不会有空数据)
if not recved:
break
# 打印读取的信息
print(recved.decode())
# 关闭socket
dataSocket.close()