C语言实现网络爬虫
我常使用C语言写网络爬虫,能够将网页爬出来,但是,图片却爬不出来,有没有大佬帮解决一下!!!
代码:
#include <stdio.h>
#include<string.h>
#include<WinSock2.h>
#pragma comment(lib,"ws2_32.lib")
/*
网络部分:http url
url 三部分
https://www.baidu.com/?tn=62095104_29_oem_dg&ch=6
1.协议 http 超文本传输协议
2.主机名 www.baidu.com 需要的ip地址 240e:ff:e020:966:0:ff:b042:f296
3.资源名 /?tn=62095104_29_oem_dg&ch=6
*/
void parseUrl(const char* url, char* host, char* resPath);
void getImgUrl(const char* html, char* imgUrl);
typedef struct Spider
{
char host[128]; //主机名
char resPath[128]; //资源路径
SOCKET fd;
}Spider;
//获取资源
void spider_init(Spider* spider, const char* url)
{
memset(spider->host, 0, sizeof(spider->host));
memset(spider->resPath, 0, sizeof(spider->host));
parseUrl(url, spider->host, spider->resPath);
}
//连接到服务器:网络编程
void spider_connect(Spider* spider)
{
//打开socket