当前位置: 首页 > article >正文

python网络爬虫(零)——认识网页结构

  网页一般有三部分组成,分别是HTML(超文本标记语言)、CSS(层叠样式表)、JScript(活动脚本语言)

1.HTML

  HTML是整个网页的结构,相当于整个网站的框架。带“<”“>”符号都属于HTML的标签,并且标签都是成对出现的。

语法内容
html网页
body内容
div框架
p段落
li列表
hi标题
a href超链接

  一个简单的html代码如下:

<html>
<head>
<title>python3爬虫与数据清洗入门</title>
</head>
<body>
<div>
<p>python3爬虫与数据清洗入门</p>
</div>
<ul>
<li><a href="http://www.baidu.com">爬虫</a></li>
<li>数据清洗</li>
</ul>
</div>
</body>
</html>

  程序执行效果如下:
在这里插入图片描述

2.CSS

  CSS表示样式,表示将在下面引用一个CSS,并在CSS中定义了对应的样式。

3. JScript

  JScript表示功能,交互的内容和各种特效都在JScript,JScript描述了网站中的各种功能。
  如果把网页比喻为人体,那么html就是人的骨架,并且定义了人的五官;CSS表示人的外观细节,即五官长什么样子,JScript表示人的技能。


http://www.kler.cn/a/285096.html

相关文章:

  • 2024年11月10日系统架构设计师考试题目回顾
  • go语言中的log 包详解
  • CSP/信奥赛C++语法基础刷题训练(1):洛谷P5715 :三位数排序
  • 【大数据学习 | kafka高级部分】kafka的kraft集群
  • Linux驱动开发(4):Linux的设备模型
  • sql专题 之 count()区别
  • Linux主机网络参数的设置—IP地址的作用和类型
  • LabVIEW呼吸机测试系统开发
  • sqli-labs靶场通关攻略(五十一到五十六关)
  • 【c++】日期类相关实践:计算日期到天数转换、日期差值
  • 如何打造免费体育馆场地预约系统?php vue技术实现,简易操作指南
  • Veeam Data Platform 12.2 发布下载,新增功能概览
  • K8S(Kubernates) 知识目录
  • Redis缓存的一些案例
  • 带权重的随机算法
  • 机械学习—零基础学习日志(概率论总笔记1)
  • DRF——serializer中获取嵌套评论
  • 鸿蒙HarmonyOS之使用preferences首选项保存获取数据
  • 1、Java简介+DOS命令+java的编译运行(字节码/机器码、JRE/JVM/JDK的区别)+一个简单的Java程序
  • Linux 数据结构 树知识
  • shell小白学习记录
  • 如何将线程绑定到特定的CPU核
  • HarmonyOS开发实战( Beta5版)减小应用包大小
  • 【2024】Datawhale X 李宏毅苹果书 AI夏令营 Task2
  • Linux(CentOS 7)
  • element的el-date-picker组件实现只显示年月日时分,不显示秒