dplyr函数速查表
函数 | 描述 |
---|---|
filter() | 按条件筛选行 data %>% filter(var1==1& iso3 == "CHN") |
select() | 选择指定的列 data %>% select(1:3) 或 data %>% select(var1,var3) 或 data %>% select(start_with("lnY")) |
arrange() | 对数据框按指定列进行升序排序 data %>% arrange(a,b) |
desc() | 对数据框按指定列进行降序排序 data %>% arrange(desc(a),desc(b)) |
relocate() | 对数据框的列(变量)进行重新排序 |
mutate() | 添加新的变量列 |
summarize() | 汇总数据,生成统计指标 |
group_by() | 按指定列分组,用于进行分组操作 |
merge() | 数据框的合并操作 |
rename() | 重命名列或数据框的列名 |
distinct() | 去除重复行 |
sample_n() | 随机抽样指定数量的观测 |
count() | 计算每组的观测数量 |
slice() | 选择数据框的指定行 /slice_head()/slice_tail() |
summarize_all() | 对所有列进行汇总 |
case_when() | 对多个条件进行条件判断和赋值 |
top_n() | 选取每组中指定数量的前几个观测 |
ungroup() | 解除数据框的分组状态 |
distinct() | 去除数据框中的重复行 |
transmute() | 同时进行变量的变换和选择,生成新的数据框 |
left_join() | 左连接两个数据框 |
right_join() | 右连接两个数据框 |
inner_join() | 内连接两个数据框 |
outer_join() | 外连接两个数据框 |
between() | 选择在指定范围内的数值 |
coalesce() | 返回第一个非缺失值 |
distinct_all() | 对数据框中所有列去除重复行 |
rename_all() | 对数据框中所有列进行重命名 |
transmute_all() | 对数据框中所有列进行变换和选择 |
rowwise() | 使下游函数作用在每一行而不是整个数据框 |
across() | 在多个列上应用相同的函数 |
if_else() | 基于条件进行元素级别的替换 |
case_when() | 多条件下的元素级别的替换 |
starts_with() | 选择以指定前缀开头的列 |
ends_with() | 选择以指定后缀结尾的列 |
contains() | 选择包含指定字符串的列 |
group_split() | 将数据框按照分组变量拆分为列表 |
distinct_at() | 去除指定列中的重复行 |
summarise_at() | 对指定列应用汇总函数 |
mutate_at() | 对指定列应用变换函数 |
filter_at() | 对指定列应用条件过滤 |
select_at() | 选择指定列 |
pull() | 提取数据框的某一列为向量 |
rename_at() | 对指定列进行重命名 |
case_when() | 对多个条件进行条件判断和赋值 |
pivot_longer() | 数据框的长格式转换为宽格式 |
pivot_wider() | 数据框的宽格式转换为长格式 |
anti_join() | 返回两个数据框中不匹配的观测 |
semi_join() | 返回两个数据框中匹配的观测 |
bind_rows() | 按行合并多个数据框 |
bind_cols() | 按列合并多个数据框 |
recode() | 重新编码变量值 |
case_when() | 多条件下的元素级别的替换 |
relocate() | 调整列的位置 |
summarise_all() | 对所有列进行汇总 |
ungroup() | 解除数据框的分组状态 |
nest() | 将数据框中的变量嵌套为列表 |
unnest() | 将列表中的变量展开为数据框 |