R语言 基础笔记
起因:
今天不知道要写什么。 把之前的笔记复制一下。
代码开头,导入:
# 清除系统变量
rm(list = ls())
# 隐藏警告信息:
options(warn = -1)
# 把当前目录,设置为工作目录。
library(rstudioapi)
current_folder_path <- dirname(rstudioapi::getActiveDocumentContext()$path)
setwd(current_folder_path)
getwd()
R语言 临时笔记
- 输入: ?trainControl 查看函数的文档
- 查看目标列的分布情况
- table(wbcd$diagnosis)
检查缺失值: na
- is.na(kk) # 检查是否存在 na
- sum(is.na(kk)) # 计算 na 的个数
- unname(df) # 去除 列标签,让结果更整洁一些。
文件路径
- setwd(“some_path”) 设置当前的工作文件夹。
- getwd() 获取当前的工作文件夹 (一般是项目的根文件夹)
- 把数据文件 csv 放在这个文件夹里面
- R studio 设置 安装包的位置
- https://blog.csdn.net/qq_45642410/article/details/116858793
安装包
- 安装一个包 install.packages(“tidyverse”)
- 导入一个包 library(tidyverse)
- 我当前使用的 R
- 版本是 4.1.3, 查看版本 version
- 安装路径是 C:\Program Files\R\R-4.1.3\etc
- 可以修改里面的 Rprofile.site
Jupyter 运行 R, 只需要一句话。
!!以管理员身份运行!!
-
conda install -c r r-base r-essentials
-
另一种尝试
conda install -c r r-base=3.6.3
conda install -c r r-essentialsinstall.packages(‘IRkernel’)
IRkernel::installspec() -
安装 R 这个才是正确的。
conda install -c conda-forge r-base=4.1.3 r-essentials
------------------------- 笔记 -----------------------
frame 操作
- 新增一列
df$year <- df[, “VCF0004”] - 对 frame 的一列进行重命名,原始数据的第一列,重命名为 Year
colnames(college_data)[1] = “Year”
frame 过滤筛选数据
- 类似 isin()
year_df <- filter(df, year %in% Year ) - 多个条件
filter(year_df, ideology >0.0 & ideology <10.0) - 分组聚合,类似 groupby()
df2 <- aggregate(df1KaTeX parse error: Expected 'EOF', got '#' at position 21: …ogy_score, #̲ 聚合后要选取的目标 …year), # 按照那一列来
mean) # 操作函数 - 拼接2个frame
rbind(A, B) 按照行拼接, r-bind , row–bind
cbind(A, B) 按照列拼接 c-bind , column-bind - 按照某一列进行排序 使用 order 函数
df[order(df$Year, decreasing = FALSE),]