当前位置: 首页 > article >正文

R数据科学1.7练习题

(1) stat_summary() 函数的默认几何对象是什么?不使用统计变换函数的话,如何使用几何对象函数重新生成以上的图?

stat_summary() 的默认几何对象是 geom_pointrange(),即点、线范围图,它会在给定位置绘制点和误差线。

(2) geom_col() 函数的功能是什么?它和 geom_bar() 函数有何不同?

  1. geom_col():
    geom_col() 直接使用数据中的 y 值来生成柱形图。这意味着你需要明确提供 x 和 y 的数据值。
    功能:它按照你提供的 y 值来绘制柱状图。

  2. geom_bar():
    geom_bar() 则不需要提供 y 值,默认情况下它会统计数据的频次或计数并生成柱形图。它的 y 轴值默认使用计数(count)或指定统计变换(如比例 …prop…)。

  3. 区别:
    geom_col():直接使用给定的 y 值。
    geom_bar():计算 y 值为分类的计数或比例。

(3) 多数几何对象和统计变换都是成对出现的,总是配合使用。仔细阅读文档,列出所有成对的几何对象和统计变换。它们有什么共同之处?

  1. geom_bar() 和 stat_count():绘制柱状图,默认统计分类频数。
  2. geom_smooth() 和 stat_smooth():绘制平滑趋势线,默认计算线性模型或局部回归。
  3. geom_point() 和 stat_identity():绘制散点图,直接使用原始数据,不进行额外统计变换。
  4. geom_histogram() 和 stat_bin():绘制直方图,默认统计数据的分布频次。
  5. geom_boxplot() 和 stat_boxplot():绘制箱线图,统计五数摘要(最小值、下四分位数、中位数、上四分位数、最大值)。
    共同之处:几何对象用于定义图形外观,而统计变换则决定如何从数据生成几何对象所需的统计值。例如,geom_bar() 绘制柱状图,stat_count() 提供所需的计数统计;geom_smooth() 生成平滑曲线,stat_smooth() 计算拟合的回归模型。

(4) stat_smooth() 函数会计算出什么变量?哪些参数可以控制它的行为?

stat_smooth() 主要计算以下变量:

  1. y:平滑曲线的拟合值。
  2. ymin 和 ymax:置信区间的上下边界(如果 se = TRUE)。、

可控制 stat_smooth() 行为的参数:

  1. method:指定平滑方法,例如 lm(线性回归)或 loess(局部加权回归)。
  2. se:是否显示95%的置信区间,默认为 TRUE。
  3. span:用于 loess 回归时,控制平滑程度的参数,值越小,曲线越贴合数据。
  4. formula:指定回归模型的公式,例如 y ~ x。

(5) 在比例条形图中,我们需要设定 group = 1,这是为什么呢?换句话说,以下两张图会有什么问题?

ggplot(data = diamonds) +
geom_bar(mapping = aes(x = cut, y = ..prop..))
ggplot(data = diamonds) +
geom_bar(
mapping = aes(x = cut, fill = color, y = ..prop..)
)

在比例条形图中,设定 group = 1 是为了确保 y = …prop… 计算的是总体比例,而不是分组比例。如果不设定 group = 1,则 …prop… 会根据默认的分组(即 fill 的分组变量)来计算比例,这会导致错误的图形显示。


http://www.kler.cn/news/360042.html

相关文章:

  • 基于SpringBoot的宠物领养系统的设计与实现
  • 【4.10】图搜索算法-BFS和DFS解电话号码的字母组合
  • 鸿蒙网络编程系列25-TCP回声服务器的实现
  • 关于希尔排序的理解
  • Flink时间窗口程序骨架结构
  • 创建一个异步爬虫并将数据存入excel
  • redis—cluster集群
  • 在C++中,使用基于range的for循环迭代range
  • Meta因称其AI模型Llama为“开源” 遭炮轰,被指“污染” 开源术语
  • Nature 正刊丨年轻的小行星家族是陨石的主要来源
  • [DICOM活久见-2]认识DICOM的多帧图像,并且用pydicom拆分为单帧图像
  • C++学习路线(十九)
  • ReactNative项目根据平台去判断允许用户是热更新还是强更新或者若更新
  • docker基础使用创建固定硬盘大小为40G的虚拟机
  • qt继承结构
  • yolo自动化项目实例解析(八)自建UI-键鼠录制回放
  • linux主机定时发送邮件(s-nail)
  • 不常用的css合集
  • 从网络请求到Excel:自动化数据抓取和保存的完整指南
  • 【设计模式七大设计原则】