5 min read

技术:指标设计学习笔记

技术 系列导航

1 技术:Poisson分布、回归Python实现 2017-12-20
2 技术:beta系数理解 2017-12-21
3 技术:Python List剔除重复值 2017-12-21
4 技术:t-SNE处理高维数据可视化 2017-12-21
5 技术:用R语言进行文件系统管理 2017-12-21
6 技术:fct_lump分箱使用方法 2017-12-22
7 技术:F1分数为什么可以看不平衡样本的预测能力 2017-12-27
8 技术:Fisher的一个矩阵预算 2017-12-27
9 技术:case_when使用方法 2017-12-28
10 技术:Python接口函数 2017-12-28
11 技术:fct_relevel调整对照组,批量的方案 2017-12-30
12 技术:python中变量批量处理集成方案 2017-12-30
13 技术:Python接口函数-中台 2018-01-03
14 技术:使用pbd包进行debug 2018-01-03
15 技术:R实现随机分组 2018-01-04
16 技术:jiebaR包做文本清洗 2018-01-05
17 技术:r_WACC使用说明 2018-01-05
18 技术:使用switchhost安装host 2018-01-05
19 技术:Git的下载问题 2018-01-06
20 技术:新闻爬虫 2018-01-07
21 技术:Scalable Data Processing in R 2018-01-08
22 技术:使用git创建一个自己的本地仓库 2018-01-11
23 技术:dashboard构建,来自yihui的包 2018-01-12
24 技术:最大似然估计再理解 2018-01-12
25 技术:itchat包提取微信好友公开数据 2018-01-13
26 技术:do函数和biglm包 2018-01-17
27 技术:Imputer后X少了一列 2018-01-18
28 技术:mac连接mysql,理论上win7也可以 2018-01-19
29 技术:ggpubr提高作图效率 2018-01-20
30 技术:t-SNE理论部分补充 2018-01-22
31 技术:RMarkdown的使用技巧 2018-01-30
32 技术:通过anova检验,理解R2、R_adj.2、F值 2018-01-31
33 技术:ggridges 山峦图 学习笔记 2018-02-02
34 技术:Tidyverse使用技巧 2018-02-02
35 技术:XGBoost 学习笔记 2018-02-02
36 技术:分布变离散,或者纠正skew 2018-02-02
37 技术:rsq在R中自定义函数 2018-02-03
38 技术:Jupyter实战 2018-02-13
39 技术:美化与定制 2018-02-21
40 技术:数据对比可视化指南 2018-02-22
41 技术:功能体验 2018-02-26
42 技术:高效数据处理 2018-02-27
43 技术:模型优化技巧 2018-03-05
44 技术:原理与应用 2018-03-06
45 技术:模型与可视化 2018-03-08
46 技术:美化与交互指南 2018-03-11
47 技术:高效操作指南 2018-03-14
48 技术:用法与优化技巧 2018-03-17
49 技术:效率提升指南 2018-03-18
50 技术:问题排查技巧 2018-03-18
51 技术:高效操作指南 2018-03-19
52 技术:方法与代码示例 2018-03-21
53 技术:进阶技巧与优化 2018-03-21
54 技术:实战示例 2018-03-22
55 技术:效率与规范指南 2018-03-24
56 技术:dplython包测评 2018-03-25
57 技术:原理与实现 2018-04-02
58 技术:原理与应用解析 2018-04-03
59 技术:实战指南 2018-04-05
60 技术:核心语法与函数整理 2018-04-05
61 技术:复利计算与应用 2018-04-08
62 技术:简单规则模型解析 2018-04-14
63 技术:高效代码设计指南 2018-04-25
64 技术:原理与应用学习笔记 2018-04-29
65 技术:原理与应用 2018-05-01
66 技术:表格格式化指南 2018-05-02
67 技术:原理与应用介绍 2018-05-08
68 技术:高效文本拼接 2018-05-11
69 技术:方法与实践学习笔记 2018-05-12
70 技术:方法与工具 2018-05-12
71 技术:功能解析 2018-05-17
72 技术:高效数据输入 2018-05-21
73 技术:基础模型与方法 2018-05-22
74 技术:功能与使用体验 2018-05-26
75 技术:特征筛选学习笔记 2018-05-29
76 技术:实战技巧 2018-05-30
77 技术:建模思路解析 2018-06-03
78 技术:策略与实战 2018-06-03
79 技术:数据展示指南 2018-06-04
80 技术:包与环境配置指南 2018-07-14
81 技术:高效操作指南 2018-07-19
82 技术:统计建模学习笔记 2018-07-24
83 技术:展示技巧与原则 2018-08-10
84 技术:数据采集实战技巧 2018-08-21
85 技术:建模流程实战 2018-10-01
86 技术:大规模数据探索 2018-10-20
87 技术:文本提取与分析 2018-10-20
88 技术:原理与R实现实战 2018-10-21
89 技术:学习资源获取技巧 2018-10-23
90 技术:深度学习模型实战 2018-10-24
91 技术:实战指南 2018-10-30
92 技术:分析与展示指南 2018-11-03
93 技术:图片编辑与转换 2018-11-03
94 技术:安装与使用基础学习笔记 2018-11-07
95 技术:非结构化数据处理 2018-11-29
96 技术:表格美化技巧 2018-12-13
97 技术:分类数据可视化 2018-12-24
98 技术:流程图绘制技巧 2018-12-24
99 技术:自动化设置 2018-12-28
100 技术:协作与版本控制 2018-12-29
101 技术:pipeline设计 2018-12-30
102 技术:Git历史记录清理 2018-12-31
103 技术:AUC指标对比 2019-01-01
104 技术:时间序列可视化 2019-01-01
105 技术:变量命名工具指南 2019-01-02
106 技术:网页自动化截图 2019-01-02
107 技术:配置与优化 2019-01-03
108 技术:原理与应用 2019-01-07
109 技术:语法与核心概念 2019-01-14
110 技术:R包徽章设计 2019-01-15
111 技术:项目结构设计 2019-01-21
112 技术:文本分类基础任务 2019-01-22
113 技术:线性与非线性模型 2019-01-22
114 技术:有效性验证 2019-01-27
115 技术:评估与应用 2019-01-29
116 技术:循环神经网络入门 2019-01-30
117 技术:长短期记忆网络入门 2019-01-30
118 技术:for循环示例 2019-02-03
119 技术:基础到进阶 2019-02-06
120 技术:查询与整合 2019-02-06
121 技术:方法与案例 2019-02-14
122 技术:R包高效开发指南 2019-02-20
123 技术:解析与操作 2019-02-20
124 技术:训练与预测 2019-02-25
125 技术:原理与代码 2019-02-26
126 技术:GitHub个人访问令牌(PAT)设置 2019-03-04
127 技术:方法与工具 2019-03-07
128 技术:文本特征提取示例 2019-03-08
129 技术:基础任务示例 2019-03-18
130 技术:条形图与表头设计 2019-03-20
131 技术:连续与分类变量差异 2019-03-30
132 技术:思路与方法 2019-04-08
133 技术:方法与工具 2019-04-15
134 技术:多格式读取 2019-04-16
135 技术:方法与工具 2019-05-11
136 技术:Git/GitHub/GitLab 2019-05-13
137 技术:命令与操作 2019-05-19
138 技术:协作与版本控制 2019-05-26
139 技术:语法与实践 2019-06-28
140 技术:功能与API 2019-07-13
141 技术:安装与使用 2019-07-24
142 读《未来简史》:技术与未来 2019-09-14
143 技术:高效数据处理 2019-10-09
144 技术:性能优化技巧 2019-10-12
145 技术:配置与运维 2019-10-29
146 技术:原理与经典模型 2019-12-25
147 技术:构建到发布流程 2019-12-26
148 技术:KS统计量工具 2019-12-27
149 技术:基于物品的推荐系统1.0.0版本发布 2019-12-27
150 技术:方法与案例 2019-12-27
151 技术:conversion-metrics 2.0.0版本发布 2019-12-28
152 技术:命令与自动化 2019-12-30
153 技术:wide-and-deep模型1.0.0版本发布 2020-01-12
154 技术:data-science-bowl-2019 1.0.1版本发布 2020-01-14
155 技术:Pandas数据处理实战指南 2020-01-19
156 技术:特征工程之目标编码学习笔记 2020-01-20
157 技术:文档编写与美化 2020-01-28
158 技术:核心算法与应用 2020-01-29
159 技术:流程图绘制技巧 2020-01-29
160 技术:DataCamp课程笔记 2020-01-31
161 技术:Python实用代码片段合集 2020-01-31
162 技术:自动化构建流程 2020-02-02
163 技术:自动化工作流配置 2020-02-04
164 技术:dynamic_topic_modeling 1.1.0版本发布说明 2020-02-09
165 技术:高效查找代码与项目 2020-02-11
166 技术:代码环境快速部署 2020-02-24
167 技术:USD数据分析论文收录暨GitBook发布 2020-05-02
168 游记西安博物院(5)西汉器物工艺到新莽技术应用 2020-10-01
169 技术:Causal Forest 2021-03-18
170 研究综述:决策学习与优化技术 2023-06-19
171 技术小团队人才培养思考:压力・复盘・沉淀 2024-05-21
172 BJ Fogg模型:从说服技术理论到行为设计实践 2024-11-24
173 管理视角:技术团队的核心交付是什么 2025-02-13
174 研读毛选:核心技术三大特征 2025-03-28
175 技术:数据分析📊 交通违法行为举报记录分析 2025-08-23

本文于2026-03-28更新。 如发现问题或者有建议,欢迎提交 Issue

项目需求是给在一群运动员内选出最佳的几个,并给出相应的数据支持。

  1. 数据支持方面,需要给出几个指标供参考,最后做(无监督学习),将指标聚合,最后使用一个综合得分进行选择的评价。
  2. 决策的方面,最后的数据支持是要展示出来,并知道决策的,因此最后会使用ggplot包展示选出的最佳运动员,和其他运动员的比较,以此来说服需求方。

本文的数据、Code、思路参考 @Perry2018

思路具体如下,

  1. 创建四个指标
    1. TotalDistance 总成绩
    2. StandardDev 成绩数据的标准差,体现风险
    3. Success 成功次数
    4. diff 后三次和前三次的成绩差
  2. 匹配权重,这里可以用PCA等完成,但不是本文重点,因此直接赋值。
  3. 找出最好的五位选手,用maxmean水平来体现这五个选手的优势,这个idea很棒。

清洗数据

# Load the tidyverse package
library(tidyverse)
## Error in `library()`:
## ! there is no package called 'tidyverse'
# Import the full dataset
data <- read_csv('../../../picbackup/athletics.csv')
## Error in `read_csv()`:
## ! could not find function "read_csv"
# Select the results of interest: women's javelin
javelin <- data %>% 
    filter(Male_Female =='Female',Event=='Javelin') %>% 
    select(-Male_Female,-Event)
## Error in `data %>% filter(Male_Female == "Female", Event == "Javelin") %>% select(
##     -Male_Female, -Event)`:
## ! could not find function "%>%"
# Give yourself a snapshot of your data 
javelin %>% head()
## Error in `javelin %>% head()`:
## ! could not find function "%>%"
javelin %>% summary()
## Error in `javelin %>% summary()`:
## ! could not find function "%>%"

构建指标

# Assign the tidy data to javelin_long
javelin_long <- javelin %>% 
    gather(Flight,Distance,Flight1:Flight6)
## Error in `javelin %>% gather(Flight, Distance, Flight1:Flight6)`:
## ! could not find function "%>%"
# Make Flight a numeric
javelin_long <- 
    javelin_long %>% 
    mutate(Flight = str_extract(Flight,'[:digit:]{1,}')) %>% 
    mutate(Flight = as.numeric(Flight))
## Error in `javelin_long %>% mutate(Flight = str_extract(Flight, "[:digit:]{1,}")) %>%
##     mutate(Flight = as.numeric(Flight))`:
## ! could not find function "%>%"
# Examine the first 6 rows
javelin_long %>% head()
## Error in `javelin_long %>% head()`:
## ! could not find function "%>%"
javelin_totals <- javelin_long %>%
    filter(Distance > 0) %>% 
    group_by(Athlete, EventID) %>% 
    summarise(
        TotalDistance = sum(Distance)
        ,StandardDev = sd(Distance) %>% round(.,3)
        ,Success = n()
    )
## Error in `javelin_long %>% filter(Distance > 0) %>% group_by(Athlete, EventID) %>%
##     summarise(TotalDistance = sum(Distance), StandardDev = sd(Distance) %>% round(
##       ., 3), Success = n())`:
## ! could not find function "%>%"
# View 10 rows of javelin_totals
javelin_totals[11:20,]
## Error:
## ! object 'javelin_totals' not found
javelin <- javelin %>% 
    mutate(early = Flight1+Flight2+Flight3
#            ,late = Flight2+Flight3+Flight4
          ,late = Flight4+Flight5+Flight6
          ) %>% 
    mutate(diff = late - early)
## Error in `javelin %>% mutate(early = Flight1 + Flight2 + Flight3, late = Flight4 +
##   Flight5 + Flight6) %>% mutate(diff = late - early)`:
## ! could not find function "%>%"
javelin %>% tail(10)
## Error in `javelin %>% tail(10)`:
## ! could not find function "%>%"
# .... YOUR CODE FOR TASK 4 ....

构建综合评分和选出选手

# Examine the last ten rows
# .... YOUR CODE FOR TASK 4 ....

javelin_totals <- 
    javelin_totals %>% 
    left_join(javelin ,by=c('Athlete','EventID')) %>% 
    select(Athlete,TotalDistance,StandardDev,Success,diff)
## Error in `javelin_totals %>% left_join(javelin, by = c("Athlete", "EventID")) %>% select(
##     Athlete, TotalDistance, StandardDev, Success, diff)`:
## ! could not find function "%>%"
javelin_totals %>% 
    head(10)
## Error in `javelin_totals %>% head(10)`:
## ! could not find function "%>%"
norm  <- function(result) {
    (result - min(result)) / (max(result) - min(result))
}
aggstats <- c("TotalDistance", "StandardDev", "Success", "diff")
javelin_norm <- javelin_totals %>%
    ungroup() %>%
    mutate_at(vars(aggstats),norm) %>% 
    group_by(Athlete) %>% 
    summarise_all(funs(mean(.)))
## Error in `javelin_totals %>% ungroup() %>% mutate_at(vars(aggstats), norm) %>% group_by(
##     Athlete) %>% summarise_all(funs(mean(.)))`:
## ! could not find function "%>%"
head(javelin_norm)
## Error:
## ! object 'javelin_norm' not found
weights <- c(1, 2, 3, 4)
javelin_team <- javelin_norm %>%
    mutate(TotalScore = 
               weights[1]*TotalDistance + 
               weights[2]*StandardDev + 
               weights[3]*Success +            
               weights[4]*diff
          ) %>% 
    arrange(desc(TotalScore)) %>% 
    select(Athlete,TotalScore) %>% 
    head(5)
## Error in `javelin_norm %>% mutate(TotalScore = weights[1] * TotalDistance + weights[2] *
##     StandardDev + weights[3] * Success + weights[4] * diff) %>% arrange(desc(
##     TotalScore)) %>% select(Athlete, TotalScore) %>% head(5)`:
## ! could not find function "%>%"
javelin_team
## Error:
## ! object 'javelin_team' not found

构建可比水平

team_stats <- javelin_totals %>% 
# .... YOUR CODE FOR TASK 8 ....
# .... YOUR CODE FOR TASK 8 ....
    filter(Athlete %in% javelin_team$Athlete) %>% 
    summarise_all(funs(mean(.)))
## Error in `javelin_totals %>% filter(Athlete %in% javelin_team$Athlete) %>% summarise_all(
##     funs(mean(.)))`:
## ! could not find function "%>%"
pool_stats <- data.frame(do.call('cbind', sapply(javelin_totals, function(x) if(is.numeric(x)) c(max(x), mean(x)))))
## Error:
## ! object 'javelin_totals' not found
pool_stats$MaxAve <- c("Maximum", "Average")
## Error:
## ! object 'pool_stats' not found
pool_stats <- pool_stats %>%
    gather(key="Statistic", value="Aggregate", -MaxAve)
## Error in `pool_stats %>% gather(key = "Statistic", value = "Aggregate", -MaxAve)`:
## ! could not find function "%>%"
# Examine team stats
# .... YOUR CODE FOR TASK 8 ....

team_stats
## Error:
## ! object 'team_stats' not found
pool_stats
## Error:
## ! object 'pool_stats' not found

展示

p <- team_stats %>%
    gather(Statistic,Aggregate,-Athlete) %>% 
    ggplot(aes(x=Athlete,y=Aggregate,fill=Athlete))+
        geom_bar(stat="identity") + 
  facet_wrap (~Statistic, nrow = 2, ncol = 2, scales="free_y") +
  geom_hline(data=pool_stats, aes(yintercept=Aggregate, group=Statistic, color=MaxAve), size=1) +
  labs(title=".... Your Team Name....: Women's Javelin", color="Athlete pool maximum / average") +
  scale_fill_hue(l=70) +
  scale_color_hue(l=20) +
  theme_minimal() +
  theme(axis.text.x=element_blank(), axis.title.x=element_blank(), axis.title.y=element_blank())
## Error in `team_stats %>% gather(Statistic, Aggregate, -Athlete) %>% ggplot(aes(x = Athlete,
##     y = Aggregate, fill = Athlete))`:
## ! could not find function "%>%"
p
## Error:
## ! object 'p' not found

模拟比赛结果

home <- c(1,2,3)
away <- sample(1:nrow(javelin_totals), 3, replace=FALSE)
## Error:
## ! object 'javelin_totals' not found
HomeTeam <- round(sum(team_stats$TotalDistance[home]),2)
## Error:
## ! object 'team_stats' not found
AwayTeam <- round(sum(javelin_totals$TotalDistance[away]),2)
## Error:
## ! object 'javelin_totals' not found
print(paste0("Javelin match, Final Score: ", HomeTeam, " - ", AwayTeam))
## Error:
## ! object 'HomeTeam' not found
ifelse(HomeTeam > AwayTeam, print("Win!"), print("Sometimes you just have to take the L."))
## Error:
## ! object 'HomeTeam' not found

技术 系列导航

1 技术:Poisson分布、回归Python实现 2017-12-20
2 技术:beta系数理解 2017-12-21
3 技术:Python List剔除重复值 2017-12-21
4 技术:t-SNE处理高维数据可视化 2017-12-21
5 技术:用R语言进行文件系统管理 2017-12-21
6 技术:fct_lump分箱使用方法 2017-12-22
7 技术:F1分数为什么可以看不平衡样本的预测能力 2017-12-27
8 技术:Fisher的一个矩阵预算 2017-12-27
9 技术:case_when使用方法 2017-12-28
10 技术:Python接口函数 2017-12-28
11 技术:fct_relevel调整对照组,批量的方案 2017-12-30
12 技术:python中变量批量处理集成方案 2017-12-30
13 技术:Python接口函数-中台 2018-01-03
14 技术:使用pbd包进行debug 2018-01-03
15 技术:R实现随机分组 2018-01-04
16 技术:jiebaR包做文本清洗 2018-01-05
17 技术:r_WACC使用说明 2018-01-05
18 技术:使用switchhost安装host 2018-01-05
19 技术:Git的下载问题 2018-01-06
20 技术:新闻爬虫 2018-01-07
21 技术:Scalable Data Processing in R 2018-01-08
22 技术:使用git创建一个自己的本地仓库 2018-01-11
23 技术:dashboard构建,来自yihui的包 2018-01-12
24 技术:最大似然估计再理解 2018-01-12
25 技术:itchat包提取微信好友公开数据 2018-01-13
26 技术:do函数和biglm包 2018-01-17
27 技术:Imputer后X少了一列 2018-01-18
28 技术:mac连接mysql,理论上win7也可以 2018-01-19
29 技术:ggpubr提高作图效率 2018-01-20
30 技术:t-SNE理论部分补充 2018-01-22
31 技术:RMarkdown的使用技巧 2018-01-30
32 技术:通过anova检验,理解R2、R_adj.2、F值 2018-01-31
33 技术:ggridges 山峦图 学习笔记 2018-02-02
34 技术:Tidyverse使用技巧 2018-02-02
35 技术:XGBoost 学习笔记 2018-02-02
36 技术:分布变离散,或者纠正skew 2018-02-02
37 技术:rsq在R中自定义函数 2018-02-03
38 技术:Jupyter实战 2018-02-13
39 技术:美化与定制 2018-02-21
40 技术:数据对比可视化指南 2018-02-22
41 技术:功能体验 2018-02-26
42 技术:高效数据处理 2018-02-27
43 技术:模型优化技巧 2018-03-05
44 技术:原理与应用 2018-03-06
45 技术:模型与可视化 2018-03-08
46 技术:美化与交互指南 2018-03-11
47 技术:高效操作指南 2018-03-14
48 技术:用法与优化技巧 2018-03-17
49 技术:效率提升指南 2018-03-18
50 技术:问题排查技巧 2018-03-18
51 技术:高效操作指南 2018-03-19
52 技术:方法与代码示例 2018-03-21
53 技术:进阶技巧与优化 2018-03-21
54 技术:实战示例 2018-03-22
55 技术:效率与规范指南 2018-03-24
56 技术:dplython包测评 2018-03-25
57 技术:原理与实现 2018-04-02
58 技术:原理与应用解析 2018-04-03
59 技术:实战指南 2018-04-05
60 技术:核心语法与函数整理 2018-04-05
61 技术:复利计算与应用 2018-04-08
62 技术:简单规则模型解析 2018-04-14
63 技术:高效代码设计指南 2018-04-25
64 技术:原理与应用学习笔记 2018-04-29
65 技术:原理与应用 2018-05-01
66 技术:表格格式化指南 2018-05-02
67 技术:原理与应用介绍 2018-05-08
68 技术:高效文本拼接 2018-05-11
69 技术:方法与实践学习笔记 2018-05-12
70 技术:方法与工具 2018-05-12
71 技术:功能解析 2018-05-17
72 技术:高效数据输入 2018-05-21
73 技术:基础模型与方法 2018-05-22
74 技术:功能与使用体验 2018-05-26
75 技术:特征筛选学习笔记 2018-05-29
76 技术:实战技巧 2018-05-30
77 技术:建模思路解析 2018-06-03
78 技术:策略与实战 2018-06-03
79 技术:数据展示指南 2018-06-04
80 技术:包与环境配置指南 2018-07-14
81 技术:高效操作指南 2018-07-19
82 技术:统计建模学习笔记 2018-07-24
83 技术:展示技巧与原则 2018-08-10
84 技术:数据采集实战技巧 2018-08-21
85 技术:建模流程实战 2018-10-01
86 技术:大规模数据探索 2018-10-20
87 技术:文本提取与分析 2018-10-20
88 技术:原理与R实现实战 2018-10-21
89 技术:学习资源获取技巧 2018-10-23
90 技术:深度学习模型实战 2018-10-24
91 技术:实战指南 2018-10-30
92 技术:分析与展示指南 2018-11-03
93 技术:图片编辑与转换 2018-11-03
94 技术:安装与使用基础学习笔记 2018-11-07
95 技术:非结构化数据处理 2018-11-29
96 技术:表格美化技巧 2018-12-13
97 技术:分类数据可视化 2018-12-24
98 技术:流程图绘制技巧 2018-12-24
99 技术:自动化设置 2018-12-28
100 技术:协作与版本控制 2018-12-29
101 技术:pipeline设计 2018-12-30
102 技术:Git历史记录清理 2018-12-31
103 技术:AUC指标对比 2019-01-01
104 技术:时间序列可视化 2019-01-01
105 技术:变量命名工具指南 2019-01-02
106 技术:网页自动化截图 2019-01-02
107 技术:配置与优化 2019-01-03
108 技术:原理与应用 2019-01-07
109 技术:语法与核心概念 2019-01-14
110 技术:R包徽章设计 2019-01-15
111 技术:项目结构设计 2019-01-21
112 技术:文本分类基础任务 2019-01-22
113 技术:线性与非线性模型 2019-01-22
114 技术:有效性验证 2019-01-27
115 技术:评估与应用 2019-01-29
116 技术:循环神经网络入门 2019-01-30
117 技术:长短期记忆网络入门 2019-01-30
118 技术:for循环示例 2019-02-03
119 技术:基础到进阶 2019-02-06
120 技术:查询与整合 2019-02-06
121 技术:方法与案例 2019-02-14
122 技术:R包高效开发指南 2019-02-20
123 技术:解析与操作 2019-02-20
124 技术:训练与预测 2019-02-25
125 技术:原理与代码 2019-02-26
126 技术:GitHub个人访问令牌(PAT)设置 2019-03-04
127 技术:方法与工具 2019-03-07
128 技术:文本特征提取示例 2019-03-08
129 技术:基础任务示例 2019-03-18
130 技术:条形图与表头设计 2019-03-20
131 技术:连续与分类变量差异 2019-03-30
132 技术:思路与方法 2019-04-08
133 技术:方法与工具 2019-04-15
134 技术:多格式读取 2019-04-16
135 技术:方法与工具 2019-05-11
136 技术:Git/GitHub/GitLab 2019-05-13
137 技术:命令与操作 2019-05-19
138 技术:协作与版本控制 2019-05-26
139 技术:语法与实践 2019-06-28
140 技术:功能与API 2019-07-13
141 技术:安装与使用 2019-07-24
142 读《未来简史》:技术与未来 2019-09-14
143 技术:高效数据处理 2019-10-09
144 技术:性能优化技巧 2019-10-12
145 技术:配置与运维 2019-10-29
146 技术:原理与经典模型 2019-12-25
147 技术:构建到发布流程 2019-12-26
148 技术:KS统计量工具 2019-12-27
149 技术:基于物品的推荐系统1.0.0版本发布 2019-12-27
150 技术:方法与案例 2019-12-27
151 技术:conversion-metrics 2.0.0版本发布 2019-12-28
152 技术:命令与自动化 2019-12-30
153 技术:wide-and-deep模型1.0.0版本发布 2020-01-12
154 技术:data-science-bowl-2019 1.0.1版本发布 2020-01-14
155 技术:Pandas数据处理实战指南 2020-01-19
156 技术:特征工程之目标编码学习笔记 2020-01-20
157 技术:文档编写与美化 2020-01-28
158 技术:核心算法与应用 2020-01-29
159 技术:流程图绘制技巧 2020-01-29
160 技术:DataCamp课程笔记 2020-01-31
161 技术:Python实用代码片段合集 2020-01-31
162 技术:自动化构建流程 2020-02-02
163 技术:自动化工作流配置 2020-02-04
164 技术:dynamic_topic_modeling 1.1.0版本发布说明 2020-02-09
165 技术:高效查找代码与项目 2020-02-11
166 技术:代码环境快速部署 2020-02-24
167 技术:USD数据分析论文收录暨GitBook发布 2020-05-02
168 游记西安博物院(5)西汉器物工艺到新莽技术应用 2020-10-01
169 技术:Causal Forest 2021-03-18
170 研究综述:决策学习与优化技术 2023-06-19
171 技术小团队人才培养思考:压力・复盘・沉淀 2024-05-21
172 BJ Fogg模型:从说服技术理论到行为设计实践 2024-11-24
173 管理视角:技术团队的核心交付是什么 2025-02-13
174 研读毛选:核心技术三大特征 2025-03-28
175 技术:数据分析📊 交通违法行为举报记录分析 2025-08-23