当前位置: 首页 > article >正文

机器学习数学基础:36.φ相关系数分析

用φ相关系数分析性别与心理测验态度关系的教程

一、学习目标

学会使用φ相关系数分析两个二分变量(如性别男/女、对心理测验态度肯定/否定)之间的关系,并通过卡方检验判断结果是否具有统计学意义。

二、数据准备

假设我们想研究青年大学生的性别和对心理测验的态度之间的关系,收集到如下 2 × 2 2×2 2×2列联表数据(调查了 170 170 170人):

肯定否定合计
男生 22 22 22 88 88 88 110 110 110
女生 18 18 18 42 42 42 60 60 60
合计 40 40 40 130 130 130 170 170 170

三、涉及公式及含义

(一)卡方统计量( χ 2 \chi^{2} χ2)公式

χ 2   = N ( a d − b c ) 2 ( a + b ) ( c + d ) ( a + c ) ( b + d ) \chi^{2}\ =\frac{N(ad - bc)^{2}}{(a + b)(c + d)(a + c)(b + d)} χ2 =(a+b)(c+d)(a+c)(b+d)N(adbc)2
- N N N:表示总样本数量,这里 N   = 170 N \ = 170 N =170
- a a a:男生且对测验态度为肯定的人数, a   = 22 a \ = 22 a =22
- b b b:男生且对测验态度为否定的人数, b   = 88 b \ = 88 b =88
- c c c:女生且对测验态度为肯定的人数, c   = 18 c \ = 18 c =18
- d d d:女生且对测验态度为否定的人数, d   = 42 d \ = 42 d =42
- a + b a + b a+b:男生的总人数, a + b   = 110 a + b \ = 110 a+b =110
- c + d c + d c+d:女生的总人数, c + d   = 60 c + d \ = 60 c+d =60
- a + c a + c a+c:对测验态度为肯定的总人数, a + c   = 40 a + c \ = 40 a+c =40
- b + d b + d b+d:对测验态度为否定的总人数, b + d   = 130 b + d \ = 130 b+d =130

(二)φ相关系数( r φ r_{\varphi} rφ)公式

r φ   = χ 2 N r_{\varphi}\ =\sqrt{\frac{\chi^{2}}{N}} rφ =Nχ2 ,它反映两个二分变量之间的相关程度,取值在 − 1 -1 1 1 1 1之间。接近 1 1 1表示强正相关,接近 − 1 -1 1表示强负相关,接近 0 0 0表示相关性弱。

四、计算步骤

(一)计算卡方统计量( χ 2 \chi^{2} χ2

将数据代入 χ 2 \chi^{2} χ2公式:
χ 2   = 170 × ( 22 × 42 − 88 × 18 ) 2 40 × 130 × 110 × 60   = 170 × ( 924 − 1584 ) 2 40 × 130 × 110 × 60   = 170 × ( − 660 ) 2 40 × 130 × 110 × 60   = 170 × 435600 34320000   = 2.1577 \begin{align*} \chi^{2}&\ =170\times\frac{(22\times42 - 88\times18)^{2}}{40\times130\times110\times60}\\ &\ =170\times\frac{(924 - 1584)^{2}}{40\times130\times110\times60}\\ &\ =170\times\frac{(-660)^{2}}{40\times130\times110\times60}\\ &\ =170\times\frac{435600}{34320000}\\ &\ = 2.1577 \end{align*} χ2 =170×40×130×110×60(22×4288×18)2 =170×40×130×110×60(9241584)2 =170×40×130×110×60(660)2 =170×34320000435600 =2.1577

(二)计算φ相关系数( r φ r_{\varphi} rφ

χ 2   = 2.1577 \chi^{2}\ =2.1577 χ2 =2.1577 N   = 170 N \ = 170 N =170代入 r φ r_{\varphi} rφ公式:
r φ   = 2.1577 170 ≈ 0.0127 ≈ 0.1127 \begin{align*} r_{\varphi}&\ =\sqrt{\frac{2.1577}{170}}\\ &\approx\sqrt{0.0127}\\ &\approx 0.1127 \end{align*} rφ =1702.1577 0.0127 0.1127

(三)确定临界值并判断

  1. 计算自由度:对于 2 × 2 2×2 2×2列联表,自由度 d f   = ( 2 − 1 ) × ( 2 − 1 )   = 1 df\ =(2 - 1)\times(2 - 1)\ =1 df =(21)×(21) =1
  2. χ 2 \chi^{2} χ2分布表:找到自由度为 1 1 1,显著性水平为 0.05 0.05 0.05时的临界值 χ 0.05 2 ( 1 )   = 3.84 \chi_{0.05}^{2}(1)\ =3.84 χ0.052(1) =3.84
  3. 判断:因为计算得到的 χ 2   = 2.1577 < 3.84 \chi^{2}\ =2.1577<3.84 χ2 =2.1577<3.84,所以在当前显著性水平下,没有足够证据拒绝原假设(原假设是性别与对心理测验的态度相互独立)。同时, r φ   = 0.1127 r_{\varphi}\ =0.1127 rφ =0.1127数值较小且不具有统计显著意义,这表明青年男女大学生的性别与对心理测验的态度之间是独立无关的。

五、总结

通过以上步骤,我们利用 χ 2 \chi^{2} χ2统计量和 φ \varphi φ相关系数分析了性别和对心理测验态度的关系。在实际应用中,大家可以根据研究问题收集相应的 2 × 2 2×2 2×2列联表数据,按照这些步骤来分析两个二分变量之间的关系哦。


http://www.kler.cn/a/560072.html

相关文章:

  • steam_api.dll丢失3分钟修复指南,解决Steam游戏无法运行
  • Idea2024中搭建JavaFX开发环境并创建运行项目
  • 4. MySQL 逻辑架构说明
  • 基于Flask的淘宝商品数据可视化分析系统的设计与实现
  • 【MySQL学习】数据库建表实操!!
  • Android NDK基本开发流程
  • AI智算-k8s+SGLang实战:DeepSeek-r1:671b满血版多机多卡私有化部署全攻略
  • 网关和过滤器学习
  • 企业数据集成:实现高效调拨出库自动化
  • jenkins docker容器中安装python3.9环境
  • 一周学会Flask3 Python Web开发-Jinja2模板基本使用
  • 【Python量化金融实战】-第2章:金融市场数据获取与处理:2.1 数据源概览:Tushare、AkShare、Baostock、通联数据(DataAPI)
  • Java集合框架设计模式面试题
  • 注意力机制深度优化
  • 【附源码】基于opencv+pyqt5搭建的人脸识别系统
  • 2025/2/17--2/23学习笔记(week1)_C语言
  • Vi 编辑器基本使用指南
  • 自动化部署工具Jenkins和Jpom的区别及优缺点,你选择用哪个?
  • C++对象模型之C++额外成本
  • React Server Components引擎的混合渲染架构:突破传统SPA的性能边际