当前位置: 首页 > article >正文

信息收集2

目标扫描

检查目标网站的目录结构

http的请求状态码:

  • 1xx:是一个提示信息
  • 2xx:表示请求成功的
    • 200
  • 3xx:表示请求被重定向到其他位置了
    • 301
    • 302
    • 304
  • 4xx:表示请求失败,表示客户端出的错
    • 404:表示请求的页面不存在
    • 403:表示请求的页面是无权访问的
  • 5xx:表示请求失败,表示服务端出的错
    • 500
    • 501

扫描目录的原理:

一直在网站的域名后面添加字符串,如果返回结果是404,表示页面不存在,如果是其他结果的值,说明这个页面是存在的

第三方软件:

  • 御剑
  • dirbuster

网站的爬虫文件

robots.txt

这个文件是为了网络搜索引擎爬虫程序准备的目的就是为了让爬虫文件爬取网站的信息,便于搜索引擎收录网站,存在的风险就是这个目录记录的是网站的目录结构

旁站扫描

什么是旁站?就是同一个服务器上不同的网站,就是旁站

为什么要找旁站?

扩展测试面

找旁站的方法:

https://tool.chinaz.com/same/

注意点:

两个网站同IP,不一定在一个服务器上,还有另一种可能:两个网站在两个不同的服务器上,但是两个服务器在同一个内部网站

C段扫描

C段:是IP地址的c段,在信息收集中,表示的是和目标IP地址接近的其他IP

例子:

目标是192.168.1.2        c段:192.168.1.10        20

IP反查

将IP反向解析成这IP绑定的域名

IP反查的结果不一定准确

反查的原理:

就是曾经有人查询过这个域名 相对应的IP,在查询过后,网络就会留下记录,做IP反查的时候,将这展示出来

IP反查的地址

https://dns.aizhan.com/

Google

简介:

可以用google的搜索引擎的语法,来搜索敏感的信息

google默认是访问不到的

访问google:

在fofa中,搜索关键词"title="Google""

https://18.162.49.236/        查到能用的,不一定什么时候就不能用了

google语法:

关键词1:filetype

作用:搜索指定类型的文件

案例:搜索文件是xls的文件,页面中包含身份证3个字

filetype:xls  身份证

filetype:xls  "身份证|姓名"

文件类型:

  • doc
  • txt
  • ppt

关键词2:

作用:从指定的域名中取搜索内容

案例:搜索ur中包含zju.edu.cn的内容

site:zju.edu.cn

案例:搜索浙大相关网站的后台管理页面

site:zju.edu.cn  后台管理

案例:搜索浙大学生名单

filetype:xls  site:zju.edu.cn  名单

关键词3:inurl

作用:域名后面包含的内容

案例:搜索url中包含admin.php的网页

inurl:admin.php

了解:

https://www.exploit-db.com/google-hacking-database

识别waf

waf:用于对服务器中网站进行保护,本质上就是安全厂商提供的安全产品

判断目标是否使用waf

wafw00f

下载wafw00f项目:码云

git clone http://gitee.com/p4sschen/wafw00f.git
cd  wafw00f
python  setup.py  install
使用:wafw00f  网站

CMS指纹识别

什么是CMS

内容管理系统,通过使用cms能快速开发网站

主流CMS:

DedeCMS:织梦

Discuz

wordpress

thinkphp

基于CMS开发的网站的特点:

  • 都是php语言写的
  • 数据库都是mysql

指纹识别:

指纹识别就是判断网站的编程语言、数据库类型、cms的类型、操作系统、waf...

指纹识别的思路:

1)在网站页面上,查看网站版权相关信息

        这个版权信息,往往是被隐藏的

2)查看网站特定文件的MD5值

MD5:是一种加密方式,通过MD5,可以计算得到这个文件的校验字符串

如果MD5值有相同,则说明是同一个文件,不同则不是同一个文件

判断目标网站是否使用了特定的cms开发的

检查网站的一些小图片,将这些图片的MD5值,和特定的cms中的图片MD5做比对,一样则说明用的是同一个cms

指纹识别库

https://github.com/Lucifer1993/cmsprint
3)借助网站的源码
如果网站代码中出现了特定的变量、字符串、文件,那么可以推测使用了某个cms
重点关注的是head标签中

 4)借助于robots.txt文件

robots其实是一种协议,爬虫协议

通过robots协议,可以给网络爬虫爬取网站,完成记录

CDN

在给客户端解析域名的时候,或根据客户端的地域,返回不同的IP地址

客户端解析到的IP地址,是代理服务器的地址

客户端能访问的仅仅是代理服务器

判断目标网站是否使用了cdn

从不同的位置去ping,如果返回的IP地址是相同的,代表没有使用cdn,如不同则代表使用了cdn

www.17ce.com

怎么绕过cdn找到真实的ip

1.从国外来访问

2.查找网络的域名解析记录


http://www.kler.cn/news/356985.html

相关文章:

  • 软件测试工程师:如何写出好的测试用例?
  • 《七度荒域:混沌之树》风灵月影二十二项游戏辅助:上帝模式/无限HP和EP/金币不减
  • 利用 OBS 推送 WEBRTC 流到 smart rtmpd
  • 数据结构--二叉树随记
  • IDEA中我常用的快捷键
  • 基于微信小程序的汽车预约维修系统(lw+演示+源码+运行)
  • 前端遮罩层的应用
  • 51单片机的智能电饭煲【proteus仿真+程序+报告+原理图+演示视频】
  • 基于DNA算法的遥感图像加解密matlab仿真
  • ElasticSearch集群搭建及常见问题(三节点)
  • MySQL去除空白字符(如非标准空格、制表符等)
  • STM32学习笔记---DMA
  • UE小:UE5的Pixelstreaming在捕获画面的时候没办法显示非Viewport的Slate区域按钮的ToolTip
  • 51单片机的仓库管理系统【proteus仿真+程序+报告+原理图+演示视频】
  • 一次使用LD_DEBUG定位问题的经历
  • 【论文速读】|PROMPTFUZZ:利用模糊测试技术对大语言模型中的提示注入进行鲁棒性测试
  • 文本数据可视化
  • Kettle9.4支持Clickhouse数据源插件开发以及性能测试
  • 基于因果推理的强对流降水临近预报问题研究
  • adb使用命令记录