dplyr函数速查表

函数描述
filter()按条件筛选行 data %>% filter(var1==1& iso3 == "CHN")
select()选择指定的列 data %>% select(1:3) 或 data %>% select(var1,var3) 或 data %>% select(start_with("lnY"))
arrange()对数据框按指定列进行升序排序 data %>% arrange(a,b)
desc()对数据框按指定列进行降序排序 data %>% arrange(desc(a),desc(b))
relocate()对数据框的列(变量)进行重新排序
mutate()添加新的变量列
summarize()汇总数据,生成统计指标
group_by()按指定列分组,用于进行分组操作
merge()数据框的合并操作
rename()重命名列或数据框的列名
distinct()去除重复行
sample_n()随机抽样指定数量的观测
count()计算每组的观测数量
slice()选择数据框的指定行 /slice_head()/slice_tail()
summarize_all()对所有列进行汇总
case_when()对多个条件进行条件判断和赋值
top_n()选取每组中指定数量的前几个观测
ungroup()解除数据框的分组状态
distinct()去除数据框中的重复行
transmute()同时进行变量的变换和选择,生成新的数据框
left_join()左连接两个数据框
right_join()右连接两个数据框
inner_join()内连接两个数据框
outer_join()外连接两个数据框
between()选择在指定范围内的数值
coalesce()返回第一个非缺失值
distinct_all()对数据框中所有列去除重复行
rename_all()对数据框中所有列进行重命名
transmute_all()对数据框中所有列进行变换和选择
rowwise()使下游函数作用在每一行而不是整个数据框
across()在多个列上应用相同的函数
if_else()基于条件进行元素级别的替换
case_when()多条件下的元素级别的替换
starts_with()选择以指定前缀开头的列
ends_with()选择以指定后缀结尾的列
contains()选择包含指定字符串的列
group_split()将数据框按照分组变量拆分为列表
distinct_at()去除指定列中的重复行
summarise_at()对指定列应用汇总函数
mutate_at()对指定列应用变换函数
filter_at()对指定列应用条件过滤
select_at()选择指定列
pull()提取数据框的某一列为向量
rename_at()对指定列进行重命名
case_when()对多个条件进行条件判断和赋值
pivot_longer()数据框的长格式转换为宽格式
pivot_wider()数据框的宽格式转换为长格式
anti_join()返回两个数据框中不匹配的观测
semi_join()返回两个数据框中匹配的观测
bind_rows()按行合并多个数据框
bind_cols()按列合并多个数据框
recode()重新编码变量值
case_when()多条件下的元素级别的替换
relocate()调整列的位置
summarise_all()对所有列进行汇总
ungroup()解除数据框的分组状态
nest()将数据框中的变量嵌套为列表
unnest()将列表中的变量展开为数据框