当前位置: 首页 > article >正文

人工智能ACA(七)——计算机视觉基础

一、自然语言处理基本介绍

1. 自然语言处理的定义

1-1 自然语言

人类使用的在社会生活中自然形成的语言

1-2 自然语言处理

目标是让计算机能够理解、解析、生成和处理人类的自然语言

包含自然语言理解和自然语言生成两部分组成

2. 自然语言处理的发展趋势

3.自然语言处理的数据基础

3-1 自然语言处理的语料库

语料库

  • 是大规模的语言数据集合
  • 用于语言研究和应用的基础资源
  • 语言学角度:真实语言使用的采样记录
  • 计算语言学角度:用于自然语言处理的结构化文本数据

4.自然语言处理的技术基础

4-1 自然语言处理的技术体系

4-2 自然语言工作流程

二、自然语言处理基础技术详细介绍

1. 分词

1-1 分词的定义
  • 将长文本非结构化数据 分解为字词为单位的数据结构(结构化数据)
  • 常见方法为 最大匹配分词法 和 最短路径分词法

 1-2 分词难点

 1-3 分词的实现方法——最大匹配分词方法
1-4 分词的实现方法——最短路径分词发

2. 词性标注

2-1 定义
  • 词性 是指词的语法分类,又称词类
  • 词性标注 是在给定句子中判断每个词的语法范畴,确定其词性并加以标注的过程

2-2 词性标注规范

3. 关键词提取

3-1 定义

关键词即文本中一些“重要”词,通过这些重要的词可以理解文本中心思想。类似论文的摘要

根据关键词 大概能理解整句话的含义

3-2 关键词提取的实现方法——步骤1获取候选关键词
3-2 关键词提取的实现方法——步骤2 对候选关键词打分

4. 命名实体识别

4-1 定义
  • 文本中具有特定意义的实体词
  • 表示特定类型的名词
  • 具有唯一性和专指性的词语

 4-2 命名实体识别的标注

5. 语法分析

5-1 定义
  • 分析句子的语法结构
  • 确定句子成分之间的关系
  • 构建句子的语法树
  • 验证句子的语法正确性

 5-2 语法分析的难点
5-3 语法分析的实现方法

6. 文本向量化

6-1 定义

6-2 文本向量化的实现方法——离散式词向量
6-3 文本向量化的实现方法——分布式词向量

离散式词向量:每一行代表一个词,列出该词在句子中的位置。

分布式词向量:每一列代表改词在不同特征上的分布

每个词在相同特征上的均值就是这句话在该特征的特征值

词语特征1特征2特征3特征4
0.10.20.40.2
喜欢0.20.30.70.1
学习0.50.90.10.3
NLP0.20.30.60.2

三、自然语言理解技术介绍与应用

1. 文本分类技术

2. 情感分析技术


3. 文本纠错技术



4. 问答系统技术



四、自然语言生成技术介绍与应用

1. 文本标签生成技术


2. 文本摘要生成技术


3. 智能创作



五、实验


http://www.kler.cn/a/452220.html

相关文章:

  • 傅里叶变换原理
  • 【设备 磁盘】重要备份存放U盘的风险 + winhex 磁盘清零(清理windows无法格式化的磁盘)
  • 国产之光--仓颉编程语言的实战案例分析
  • MySQL for update skip locked 与 for update nowait
  • 领克Z20结合AI技术,革新自动驾驶辅助系统
  • [C/C++]智能指针是什么?实现原理是什么?
  • Vue3入门(8)
  • THREE.js 入门(六) 纹理、uv坐标
  • 深入探索 npm cache clean --force:清理 npm 缓存的艺术
  • Python + 深度学习从 0 到 1(03 / 99)
  • Pyside6 在 pycharm 中的配置
  • 数据库 SQL 常用语句全解析
  • 瑞吉外卖项目学习笔记(八)修改菜品信息、批量启售/停售菜品
  • Matplotlib中隐藏坐标轴但保留坐标轴标签的3D图
  • 面经zhenyq
  • 图像处理-Ch5-图像复原与重建
  • 前端取Content-Disposition中的filename字段与解码(vue)
  • 「Java EE开发指南」如何用MyEclipse构建一个Web项目?(一)
  • 【Select 语法全解密】.NET开源ORM框架 SqlSugar 系列
  • CPU架构的变化史
  • 用Python写炸金花游戏
  • CoinShares预测2025年加密市场前景看涨
  • 【k8s】在ingress-controlller中Admission Webhook 的作用
  • 批量识别工作表中二维码信息-Excel易用宝
  • 【UE5 C++课程系列笔记】11——FString、FName、FText的基本使用
  • C 语言基础运算:输入两个整数并计算和、差、积