欢迎来到我的个人博客!这里是我过去几年在技术学习、数据分析、生活观察与阅读思考的沉淀之地,既是对自己成长的记录,也是与同路人分享交流的窗口。
从2017年开始,我在这里陆续写下了近200篇笔记,内容没有严格的“边界”,但核心围绕“学习与实践” 展开——既有敲代码时的技术细节,也有读完一本书的感悟,还有踩过坑后总结的实用技巧。
对我而言,博客是“第二大脑”:当我在DataCamp学完一个机器学习算法、用R/Python解决了数据处理难题、或是旅行后想整理攻略时,都会在这里留下痕迹。这些笔记或许不够“完美”,但足够“真实”,希望能给路过的你带来一点启发。
我把内容大致分成了4类,方便你快速定位感兴趣的方向:
这是博客的核心内容,聚焦R语言、Python、机器学习与数据分析的具体应用,从基础语法到项目落地都有覆盖:
- 工具指南:比如ggplot2
可视化技巧、Pandas
高效处理数据、Git/GitHub版本控制、R包开发全流程;
- 算法解析:从KNN、XGBoost、LSTM等经典模型,到目标编码、WOE/IV特征筛选、因果森林等进阶方法;
- 项目实战:Kaggle比赛思路(房价预测、欺诈检测)、开源工具开发(如谣言检测工具、动态主题模型包)。
比如《词向量技术详解:Word2Vec原理与应用》《自编码器信用卡欺诈检测实战》等,都附了代码思路和实现细节,适合入门或进阶参考。
主打“实用主义”,记录我在工作学习中总结的效率工具和方法:
- 开发工具:RStudio、PyCharm、VS Code的使用技巧,GitHub高级搜索、Actions自动化配置;
- 系统与环境:Linux命令、Conda环境管理、虚拟机配置、服务器运维;
- 办公辅助:RMarkdown文档编写、交互式仪表盘(flexdashboard)制作、PDF处理与文献管理(BibTeX)。
比如《MyBinder使用指南:代码环境快速部署》《Codelf变量命名工具使用技巧》,帮你少走一些“配置坑”。
不止于技术,还有对书籍、影视、社会议题的思考:
- 读书笔记:从《人类简史》《未来简史》的宏观视角,到《微积分的本质》《Advanced R》的专业书籍,再到《大明王朝的七张面孔》等历史读物;
- 影视解析:《绿皮书》《血观音》等电影的主题探讨,《我们与恶的距离》《Unnatural》等剧集的社会议题分析;
- 话题随笔:巴以冲突背景解析、台湾大选观察、色彩文化(如马尔斯绿)等。
偶尔记录旅行、兴趣与生活小技巧:
- 旅行攻略:青岛、普吉岛、长白山、格鲁吉亚等目的地的行程规划与体验;
- 兴趣点滴:双板滑雪入门、尤克里里学习、心型函数可视化等;
- 日常实用:iPhone/小米设备技巧、微信效率功能、消费者维权指南(如工商局投诉流程)。
这个博客就像我的“学习日记”,从2017年第一次记录Hive 学习笔记
,到后来开发并发布自己的R包、整理机器学习系统性笔记,每一篇都对应着当时的困惑与收获。
如果你的学习路径也涉及数据科学、编程工具,或是单纯喜欢记录与分享,欢迎多停留一会儿——可以按年份归档翻阅,也可以直接搜索关键词。若有疑问或补充,随时留言交流!
技术在更新,世界在变化,我们一起慢慢记录,慢慢成长。