当前位置: 首页 > article >正文

图嵌入 Node2Vec

文章目录

  • 图嵌入之 Node2Vec
    • 1 两个概念
    • 2 两种节点采样方法
    • 3 Node2Vec 中的二阶 Random Walk
    • 4 二阶 Random Walk 的优势
    • 5 算法步骤

图嵌入之 Node2Vec

论文地址 https://arxiv.org/pdf/1607.00653.pdf

对 Random Walk 中随机地选择游走序列进行了改进,别的地方与 Deep Walk 大致相同

请添加图片描述

1 两个概念

  • homophily:同质性,越是相邻的节点同质的趋势更大

  • structural equivalence:结构相似性,如 Figure 1 中 u 节点和 S 6 S_6 S6 节点在结构上很相似

2 两种节点采样方法

  • 广度优先采样BFS:采样的节点序列更能挖掘结构相似性(微观)

  • 深度优先采样DFS:采样的节点序列更能挖掘同质性(宏观)

3 Node2Vec 中的二阶 Random Walk

3.1 Random Walks 的定义

c i c_i ci 表示随机游走中的第 i 个节点, c i c_i ci 的选择遵循如下分布:

请添加图片描述

π v x \pi_{vx} πvx 表示节点 v v v x x x 之间未归一化的过渡概率, Z Z Z 是进行归一化的常数

即从当前节点 v 到下一个节点 x 的条件概率等于 π v x Z \frac{\pi_{vx}}{Z} Zπvx π v x \pi_{vx} πvx 怎么算往下看

3.2 搜索偏置 α \alpha α

定义两个参数 p p p q q q (超参数)来引导随机序列的选择,

请添加图片描述

返回参数 p p p(Return parameter):控制从一个节点回退一步的似然,在 Figure 2中,设 t 为走过的上一个节点,v 为当前节点,用 α = 1 / p \alpha=1/p α=1/p 表示从 v 到 t 的权重

区分似然(likelihood)与 概率(probability)

  • 对于联合概率函数 P ( y i ^ ∣ x i , θ ) P(\hat{y_i}|x_i,θ) P(yi^xi,θ) 而言。
  • 概率探究的是自变量与因变量之间的关系,即 θ \theta θ 已知,在不同的特征向量 x i x_i xi 下,得到 y i ^ \hat{y_i} yi^ 的可能性。
  • 似然探究的是参数向量与因变量之间的关系,即 x i x_i xi 已知,在不同的参数向量 θ \theta θ 下,得到 y i ^ \hat{y_i} yi^ 的可能性。

进出参数 q q q(In-out parameter):若 q > 1 q > 1 q>1,随机游走算法会偏向于选择,当前节点局部范围(local view)内的节点,类似 BFS ;若 q < 1 q < 1 q<1,随机游走算法倾向于选择更深一步(further away)的节点,类似 DFS

基于边的权重来对下一个节点进行采样,定义边的权重 π v x = α p q ( t , x ) ∗ w v x \pi_{vx} = \alpha_{pq}(t,x)*w_{vx} πvx=αpq(t,x)wvx,当前节点到下一个节点的转移概率由 α \alpha α 进行加权,其中 α \alpha α 定义为:

请添加图片描述

d t x d_{tx} dtx 表示节点 t 到节点 x 的最短路径长度


4 二阶 Random Walk 的优势

快!
请添加图片描述
请添加图片描述

5 算法步骤

请添加图片描述


http://www.kler.cn/news/9683.html

相关文章:

  • 前端开发必看100道大厂面试题集锦(一)
  • 网站怎么接入chatGPT来自动写文章
  • python【反爬、xpath解析器、代理ip】
  • ZooKeeper领导者选举流程
  • 子集和问题
  • 华为OD机试-通信误码-2022Q4 A卷-Py/Java/JS
  • 【教程】解决VSCode中Python第三方库无法自动补全
  • Segment Anything论文阅读笔记
  • HummerRisk 使用教程:操作审计
  • Qt·核心机制
  • 商汤科技推出“日日新SenseNova”,大模型体系赋能人工智能新未来
  • Elasticsearch:ESQL 简介 — 一种用于灵活、迭代分析的新查询语言
  • 使用模板窗口生成测试数据
  • TypeScript由浅到深(上篇)
  • 工程管理系统软件 自主研发,工程行业适用
  • 【国内chatgpt最全使用方法合集】(总有一个适合你)
  • GaussDB行存储表列存储表相关
  • 本地安装WSL的发行版后,导出到另一台计算机安装的办法
  • 自然语言处理(七): Deep Learning for NLP: Recurrent Networks
  • Python第三方库安装
  • 人脑体内扩散张量分布MRI的新框架
  • Diffusion模型系列文章
  • midjourney注册教程
  • 浏览器表单自动填充调研
  • 企业资源规划(ERP)监控工具
  • Python 进阶指南(编程轻松进阶):一、处理错误和寻求帮助
  • AttributeError: ‘HowNetDict‘ object has no attribute ‘en_map‘ 解决方法
  • 医疗耗材缺陷视觉检测的应用
  • 进步电机和伺服电机
  • 肖 sir_就业课__009接口测试和接口自动化讲解