当前位置: 首页 > article >正文

阿里云人工智能ACA(七)——计算机视觉基础

一、自然语言处理基本介绍

1. 自然语言处理的定义

1-1 自然语言

人类使用的在社会生活中自然形成的语言

1-2 自然语言处理

目标是让计算机能够理解、解析、生成和处理人类的自然语言

包含自然语言理解和自然语言生成两部分组成

2. 自然语言处理的发展趋势

3.自然语言处理的数据基础

3-1 自然语言处理的语料库

语料库

  • 是大规模的语言数据集合
  • 用于语言研究和应用的基础资源
  • 语言学角度:真实语言使用的采样记录
  • 计算语言学角度:用于自然语言处理的结构化文本数据

4.自然语言处理的技术基础

4-1 自然语言处理的技术体系

4-2 自然语言工作流程

二、自然语言处理基础技术详细介绍

1. 分词

1-1 分词的定义
  • 将长文本非结构化数据 分解为字词为单位的数据结构(结构化数据)
  • 常见方法为 最大匹配分词法 和 最短路径分词法

 1-2 分词难点

 1-3 分词的实现方法——最大匹配分词方法
1-4 分词的实现方法——最短路径分词发

2. 词性标注

2-1 定义
  • 词性 是指词的语法分类,又称词类
  • 词性标注 是在给定句子中判断每个词的语法范畴,确定其词性并加以标注的过程

2-2 词性标注规范

3. 关键词提取

3-1 定义

关键词即文本中一些“重要”词,通过这些重要的词可以理解文本中心思想。类似论文的摘要

根据关键词 大概能理解整句话的含义

3-2 关键词提取的实现方法——步骤1获取候选关键词
3-2 关键词提取的实现方法——步骤2 对候选关键词打分

4. 命名实体识别

4-1 定义
  • 文本中具有特定意义的实体词
  • 表示特定类型的名词
  • 具有唯一性和专指性的词语

 4-2 命名实体识别的标注

5. 语法分析

5-1 定义
  • 分析句子的语法结构
  • 确定句子成分之间的关系
  • 构建句子的语法树
  • 验证句子的语法正确性

 5-2 语法分析的难点
5-3 语法分析的实现方法

6. 文本向量化

6-1 定义

6-2 文本向量化的实现方法——离散式词向量
6-3 文本向量化的实现方法——分布式词向量

离散式词向量:每一行代表一个词,列出该词在句子中的位置。

分布式词向量:每一列代表改词在不同特征上的分布

每个词在相同特征上的均值就是这句话在该特征的特征值

词语特征1特征2特征3特征4
0.10.20.40.2
喜欢0.20.30.70.1
学习0.50.90.10.3
NLP0.20.30.60.2

三、自然语言理解技术介绍与应用

1. 文本分类技术

2. 情感分析技术


3. 文本纠错技术



4. 问答系统技术



四、自然语言生成技术介绍与应用

1. 文本标签生成技术


2. 文本摘要生成技术


3. 智能创作



五、实验


http://www.kler.cn/a/456428.html

相关文章:

  • 解决opencv在windows环境下读取中文图片名问题
  • 基于 Python Flask 的前程无忧招聘可视化系统,招聘网站爬取数据可视化
  • Pandas02
  • 基于ArcGIS Pro的SWAT模型在流域水循环、水生态模拟中的应用及案例分析;SWAT模型安装、运行到结果读取全流程指导
  • 【RabbitMQ高级篇】消息可靠性问题(1)
  • module ‘django.db.models‘ has no attribute ‘FieldDoesNotExist‘
  • 理解数列和函数的极限
  • 基于SpringBoot的垃圾分类系统设计与实现【源码+文档+部署讲解】
  • 十二月第五周python
  • 正则表达式(学习Django过程中可能涉及的)
  • Java并发编程框架之综合案例—— 分布式日志分析系统(七)
  • Linux高级--2.4.2 linux TCP 系列操作函数 -- 深层理解
  • 【全栈开发】----Mysql基本配置与使用
  • .NET Framework 逐渐过时,.NET 8和 .NET 9引领未来
  • Postman接口测试工具
  • 【详细讲解】hive优化
  • Android 13 Aosp SystemUI Android Studio版本
  • 25页PDF | 企业级指标体系设计方法
  • 大学课程Go语言的算法与数据结构
  • Windows安装ElasticSearch与kibana