
站点介绍
此站点是用 vitePress 搭建的,里面将会包含正心的全部个人的知识体系至少将会拥有 python 基础、Python tkinter 桌面应用开发、Python 自动化办公、Python 网站开发、Python 数据分析的完整知识体系。
此站点上将会上传系统的课程资料、案例,并且会搭建编程学习的整个知识体系。
使用以下描述生产图片,图片为 19:6 格式。大小需要容纳所有的内容
# 什么是随机森林?
## 输入数据 (Input Data)
+ 绘制一个大的正方形内
+ 正方形四个小的正方形,前三个正方形里面填充天蓝色,第四个正方形里面分为四个部分,分别是橙色、蓝色、绿色、白色。
+ 四个小正方形下面有`身高、体重、年龄文字`
+ 第一个正方形指向第二个正方形,第二个正方形里面显示`数据采集`四个文字,四个文字前面给一个合适的 emoji
+ 第二个正方形指向第三个正方形,正方形内有一个小三角形,里面填充橙色
原始训练数据集
> 矩形框内包含几行带标签的小方块,例如:`[身高, 体重, 年龄] -> [是否健康]`
> 标注文字:“原始训练数据集”。
## 数据采样与特征选择 (Data Sampling & Feature Selection)
- 从“原始训练数据集”向下画出 3 条分叉箭头,每条箭头指向一个独立的“决策树”图标。
- 在每条箭头旁边标注:
- “随机采样 (Bootstrap):有放回地抽取数据子集”
- “随机选择特征:每次分裂只考虑部分特征”
## 多棵决策树 (Multiple Decision Trees)
- 画出 3-5 棵结构各异的决策树(树形图,有根节点、内部节点和叶节点)。
- 每棵树的根节点和内部节点上的判断条件不同,如“身高 > 170cm?”、“体重 < 60kg?”,体现“随机性”。
- 每棵树下方标注:“决策树 1”、“决策树 2”、“决策树 3”等。
## 集成预测 (Ensemble Prediction)
- 从每棵决策树的叶节点(预测结果)画箭头汇聚到一个大的“投票箱”或“求平均”图标。
- “投票箱”图标内可以画几个不同的结果标签(如“健康”、“不健康”)和对应的小票数。
- 从“投票箱”向下画一个箭头,指向最终的预测结果。
- 标注文字:“集成方法:多数投票(分类)或求平均(回归)”。
## 最终输出 (Final Output)
- 画一个大的矩形,里面写着最终的预测结果,例如:“最终预测:健康”。
- 标注文字:“随机森林最终预测”。
## 整体说明文字
在图片一侧或底部用简洁文字总结:
> **随机森林 (Random Forest)** 是一种集成学习算法。
> 1. **随机性**:通过“有放回采样”和“随机选择特征”构建多棵不同的决策树。
> 2. **多样性**:每棵树在不同的数据子集和特征子集上训练。
> 3. **集成**:所有树的预测结果通过“投票”或“平均”得出最终结果,提高准确性和鲁棒性。
## 视觉风格建议
- 使用清晰、简洁的线条和图标。
- 用不同颜色区分不同的决策树和数据流。
- 文字使用清晰易读的中文字体。