{r setup, include=FALSE} knitr::opts_chunk$set(eval = FALSE) 思想是,假设数据有$n$行,且可十等分。 随机给出均匀分布,$1 \to 10$, 给这个数据表打上标签,按照标签分类, 实现随机分类十组。
实现的过程如下。
使用runif函数。
runif(n, min = 1, max = 10) 定义好最大值和最小值。 $n$表示样本模拟的大小。
{r} library(tidyverse) runif(10000, min = 1, max = 11) %>% as.integer() %>% table()/100
因为runif的bug,导致数据需要取整,as.integer(), table()证明分布应该是均匀的。
因此把这个变量加入到数据表, runif(10000, min = 1, max = 11) %>% as.integer(),作为一个变量, 然后dplyr::group_by(这个变量)就可以分组了。