当前位置: 首页 > article >正文

cs*n 网页内容转为html 加入 onenote

csdn上有好用的内容,我们怎么将它们加到 onenote 里吃灰呢。

一、创建 新html

create_html.py

import sys

def create_html_file(filename):
    # 检查是否提供了文件名
    if not filename:
        print("请提供HTML文件名")
        return
    
    # 创建HTML内容
    html_content = f"""<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>{filename}</title>
</head>
<body>
</body>
</html>
"""

    # 写入文件
    with open(filename, 'w', encoding='utf-8') as file:
        file.write(html_content)
    
    print(f"文件 {filename} 已创建")

if __name__ == "__main__":
    if len(sys.argv) != 2:
        print("用法: python create_html.py <html文件名>")
    else:
        create_html_file(sys.argv[1])

使用命令 创建html
在这里插入图片描述

二、网页找内容

在这里插入图片描述
content_views 里就是真正内容了。
copy-> copy outerhtml
粘贴到 创建的html 的 body 中。

三、替换内容

modify_html.py

import sys
import os
from bs4 import BeautifulSoup

def modify_html_file(filename):
    # 检查是否提供了文件名
    if not filename:
        print("请提供HTML文件名")
        return
    
    # 查找当前目录下的HTML文件
    if not os.path.exists(filename):
        print(f"文件 {filename} 不存在")
        return
    
    # 读取HTML内容
    with open(filename, 'r', encoding='utf-8') as file:
        html_content = file.read()
    
    # 使用BeautifulSoup解析HTML
    soup = BeautifulSoup(html_content, 'html.parser')
    
    # 替换指定的div
    divs_to_remove = soup.find_all('div', class_='hljs-button {2}')
    for div in divs_to_remove:
        new_tag = soup.new_tag('p')  # 创建一个新的标签
        new_tag.string = "----------------------------------------------------------------------------------------------------------------"
        div.replace_with(new_tag)  # 替换原标签
    
    # 替换指定的div
    divs_to_remove = soup.find_all('div', class_='hide-preCode-box')
    for div in divs_to_remove:
        # 在原位置添加“------------------”
        new_tag = soup.new_tag('p')  # 创建一个新的标签
        new_tag.string = "----------------------------------------------------------------------------------------------------------------"
        div.replace_with(new_tag)  # 替换原标签
        
    # 删除指定的ul
    uls_to_remove = soup.find_all('ul', class_='pre-numbering')
    for ul in uls_to_remove:
        ul.decompose()
    
    # 写回修改后的HTML内容
    with open(filename, 'w', encoding='utf-8') as file:
        file.write(str(soup))
    
    print(f"文件 {filename} 已修改")

if __name__ == "__main__":
    if len(sys.argv) != 2:
        print("用法: python modify_html.py <html文件名>")
    else:
        modify_html_file(sys.argv[1])

因为拷贝的 html 有以下内容
在这里插入图片描述
太不美观了,要把它们删除掉

在这里插入图片描述
再打开就好看多了
在这里插入图片描述
现在 html 的内容也可以直接复制到 onenote 里吃灰了


http://www.kler.cn/a/552480.html

相关文章:

  • 抖音IP属地显示:准确性与关闭方法全解析
  • 新能源汽车充电桩运营模式,开启绿色出行新篇
  • 【基础架构篇十二】《DeepSeek多租户架构:企业级SaaS服务设计》
  • Jtti:centos主机如何搭建lnmp环境
  • 机器学习基础(第3个月):监督学习、无监督学习、模型评估指标(准确率、召回率等)
  • 【第4章:循环神经网络(RNN)与长短时记忆网络(LSTM)— 4.4 文本分类与情感分析】
  • linux redis ipv6、ipv4 只接收本地访问、接收本地和远程访问
  • 第二十四章 R 开头的术语
  • x86平台基于Qt+opengl优化ffmpeg软解码1080P视频渲染效率
  • idea无法联网,离线安装插件
  • Go 自动升级依赖版本
  • 【设计模式】【结构型模式】享元模式(Flyweight)
  • Docker容器中如何识别Linux系统并安装软件?新手避坑指南
  • spring cloud gateway限流常见算法
  • Docker 镜像标签使用
  • 代码随想录算法营Day42 | 322. 零钱兑换,279. 完全平方数,139. 单词拆分
  • IP证书 vs SSL证书:数字安全的两条技术路径与未来博弈
  • 网络安全趋势
  • DHCP详解,网络安全零基础入门到精通实战教程!
  • 鸿蒙NEXT开发-元服务和服务卡片的开发