当前位置: 首页 > article >正文

C语言实现网络爬虫

我常使用C语言写网络爬虫,能够将网页爬出来,但是,图片却爬不出来,有没有大佬帮解决一下!!!

代码:

#include <stdio.h>
#include<string.h>
#include<WinSock2.h>
#pragma comment(lib,"ws2_32.lib")
/*
网络部分:http  url
url 三部分
https://www.baidu.com/?tn=62095104_29_oem_dg&ch=6
1.协议	http 超文本传输协议
2.主机名  www.baidu.com  需要的ip地址  240e:ff:e020:966:0:ff:b042:f296
3.资源名 /?tn=62095104_29_oem_dg&ch=6

*/

void parseUrl(const char* url, char* host, char* resPath);
void getImgUrl(const char* html, char* imgUrl);

typedef struct Spider
{
	char host[128];             //主机名
	char resPath[128];          //资源路径
	SOCKET fd;
}Spider;
//获取资源
void spider_init(Spider* spider, const char* url)
{
	memset(spider->host, 0, sizeof(spider->host));
	memset(spider->resPath, 0, sizeof(spider->host));

	parseUrl(url, spider->host, spider->resPath);
}
//连接到服务器:网络编程
void spider_connect(Spider* spider)
{
	//打开socket

http://www.kler.cn/a/231811.html

相关文章:

  • 【网络安全 | 漏洞挖掘】通过密码重置污染实现账户接管
  • shell脚本配置nginx
  • 哈希表学习分享
  • 谷粒商城のRedisESRabbit MQ集群
  • 排序算法(基础)大全
  • 论文解析:计算能力资源的可信共享:利益驱动的异构网络服务提供机制
  • 【C++】C++的简要介绍
  • Stable Diffusion 模型下载:Samaritan 3d Cartoon SDXL(撒玛利亚人 3d 卡通 SDXL)
  • Nginx+React在Docker中实现项目部署
  • Pinia的使用与原理
  • Rust入门1——HelloWorld
  • Golang数据库编程详解 | 深入浅出Go语言原生数据库编程
  • C语言:操作符详解
  • LabVIEW高精度主动模拟肺系统的开发与应用
  • 华为机考入门python3--(11)牛客11-数字颠倒
  • 【C语言自定义类型详解进阶】结构体(补充结构体的对齐和位段,一口气看完系列,央妈都点赞的博文)
  • 【Java 数据结构】反射
  • 扩展说明: 指令微调 Llama 2
  • SpringBoot + Tess4J 实现本地与远程图片的文字识别
  • 优化Mac电脑文件管理工具cleanmymac2024
  • 机器学习中常用的性能度量—— ROC 和 AUC
  • 【华为云】容灾方案两地三中心实践理论
  • Pymysql之Cursor常用API
  • 服务器安装Docker (ubuntu)
  • 《Docker极简教程》--Docker基础--Docker的基本概念
  • 【大数据】Flink on YARN,如何确定 TaskManager 数