当前位置: 首页 > article >正文

C语言实现网络爬虫

我常使用C语言写网络爬虫,能够将网页爬出来,但是,图片却爬不出来,有没有大佬帮解决一下!!!

代码:

#include <stdio.h>
#include<string.h>
#include<WinSock2.h>
#pragma comment(lib,"ws2_32.lib")
/*
网络部分:http  url
url 三部分
https://www.baidu.com/?tn=62095104_29_oem_dg&ch=6
1.协议	http 超文本传输协议
2.主机名  www.baidu.com  需要的ip地址  240e:ff:e020:966:0:ff:b042:f296
3.资源名 /?tn=62095104_29_oem_dg&ch=6

*/

void parseUrl(const char* url, char* host, char* resPath);
void getImgUrl(const char* html, char* imgUrl);

typedef struct Spider
{
	char host[128];             //主机名
	char resPath[128];          //资源路径
	SOCKET fd;
}Spider;
//获取资源
void spider_init(Spider* spider, const char* url)
{
	memset(spider->host, 0, sizeof(spider->host));
	memset(spider->resPath, 0, sizeof(spider->host));

	parseUrl(url, spider->host, spider->resPath);
}
//连接到服务器:网络编程
void spider_connect(Spider* spider)
{
	//打开socket

http://www.kler.cn/a/231811.html

相关文章:

  • 1.CSS的三大特性
  • 从新手到高手的蜕变:MySQL 视图进阶全攻略
  • 2024 行远自迩,笃行不怠
  • 详细介绍:Kubernetes(K8s)的技术架构(核心概念、调度和资源管理、安全性、持续集成与持续部署、网络和服务发现)
  • Java 中的设计模式:经典与现代实践
  • rocketmq基本架构
  • 【C++】C++的简要介绍
  • Stable Diffusion 模型下载:Samaritan 3d Cartoon SDXL(撒玛利亚人 3d 卡通 SDXL)
  • Nginx+React在Docker中实现项目部署
  • Pinia的使用与原理
  • Rust入门1——HelloWorld
  • Golang数据库编程详解 | 深入浅出Go语言原生数据库编程
  • C语言:操作符详解
  • LabVIEW高精度主动模拟肺系统的开发与应用
  • 华为机考入门python3--(11)牛客11-数字颠倒
  • 【C语言自定义类型详解进阶】结构体(补充结构体的对齐和位段,一口气看完系列,央妈都点赞的博文)
  • 【Java 数据结构】反射
  • 扩展说明: 指令微调 Llama 2
  • SpringBoot + Tess4J 实现本地与远程图片的文字识别
  • 优化Mac电脑文件管理工具cleanmymac2024
  • 机器学习中常用的性能度量—— ROC 和 AUC
  • 【华为云】容灾方案两地三中心实践理论
  • Pymysql之Cursor常用API
  • 服务器安装Docker (ubuntu)
  • 《Docker极简教程》--Docker基础--Docker的基本概念
  • 【大数据】Flink on YARN,如何确定 TaskManager 数