news 2026/6/9 22:24:07

day35文件的规范拆分和写法@浙大疏锦行

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
day35文件的规范拆分和写法@浙大疏锦行

day35文件的规范拆分和写法@浙大疏锦行

文件目录

day35_文件的规范拆分和写法/
├── data/
│ └── raw/
│ └── heart.csv # 已替换为 heart.csv 数据集
├── models/ # 用于存放训练好的模型
├── notebook/
│ └── main.ipynb # 主程序 Notebook,演示了完整的调用流程
├── src/ # 源代码目录
│ ├── init.py
│ ├── data/
│ │ ├── init.py
│ │ └── preprocessing.py # 数据加载与预处理(针对 heart.csv 进行了适配)
│ ├── models/
│ │ ├── init.py
│ │ └── train.py # 模型训练、评估与保存逻辑
│ └── visualization/
│ ├── init.py
│ └── plots.py # 可视化绘图(SHAP图、混淆矩阵)
├── README.md # 项目说明文档
└── requirements.txt # 依赖库列表

项目运行

importsysimportos# 将项目根目录添加到系统路径sys.path.append(os.path.abspath(os.path.join(os.getcwd(),"..")))fromsrc.data.preprocessingimportload_data,encode_categorical_features,handle_missing_valuesfromsrc.models.trainimporttrain_model,evaluate_model,save_modelfromsrc.visualization.plotsimportplot_feature_importance_shap,plot_confusion_matrix,set_plot_stylefromsklearn.model_selectionimporttrain_test_split

1. 数据加载与预处理

# 加载数据data_path="../data/raw/heart.csv"data=load_data(data_path)print("原始数据形状:",data.shape)data.head()

# 特征编码data_encoded,_=encode_categorical_features(data)print("编码后数据形状:",data_encoded.shape)data_encoded.head()

编码后数据形状: (303, 24)

agesextrestbpscholfbsthalachexangoldpeakcatargetrestecg_0restecg_1restecg_2slope_0slope_1slope_2thal_0thal_1thal_2thal_3
0631145233115002.3011001000100
1371130250018703.5010101000010
2410130204017201.4011000010010
3561120236017800.8010100010010
4570120354016310.6010100010010

5 rows × 24 columns

# 处理缺失值data_clean=handle_missing_values(data_encoded)print("处理缺失值后数据形状:",data_clean.shape)

处理缺失值后数据形状: (303, 24)

2. 模型训练

# 准备训练数据X=data_clean.drop(['target'],axis=1)y=data_clean['target']X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=42)# 训练模型model=train_model(X_train,y_train)print("模型训练完成")

3. 模型评估

evaluate_model(model,X_test,y_test)

4. 可视化

importmatplotlib.pyplotasplt# 设置中文字体和样式(直接在 Notebook 中设置,避免样式名兼容问题)plt.style.use('ggplot')plt.rcParams['font.sans-serif']=['SimHei','Microsoft YaHei','Arial Unicode MS']plt.rcParams['axes.unicode_minus']=False# 绘制混淆矩阵plot_confusion_matrix(y_test,model.predict(X_test))

importmatplotlib.pyplotasplt# 再次设置中文字体,确保 SHAP 图中文字正常显示plt.style.use('ggplot')plt.rcParams['font.sans-serif']=['SimHei','Microsoft YaHei','Arial Unicode MS']plt.rcParams['axes.unicode_minus']=False# 绘制SHAP特征重要性plot_feature_importance_shap(model,X_test)

5. 保存模型

save_model(model,"../models/heart_disease_rf_model.joblib")

@浙大疏锦行

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 21:20:00

开发者效率革命:重新定义GitHub访问体验

在代码的海洋中航行,每一个开发者都曾经历过这样的时刻:当你满怀期待地点击一个开源项目的下载链接,却只能眼睁睁看着进度条以肉眼可见的速度缓慢爬行。这种等待不仅消耗时间,更消磨着创造的热情。而现在,这一切都将成…

作者头像 李华
网站建设 2026/6/9 16:09:52

Wan2.2-T2V-A14B开源镜像发布:开启AI视频创作新时代

Wan2.2-T2V-A14B开源镜像发布:开启AI视频创作新时代 在影视制作、广告创意和数字内容产业飞速发展的今天,一个曾经遥不可及的设想正悄然变为现实——仅凭一段文字描述,就能自动生成高质量、高分辨率、动作自然的完整视频。这不再是科幻电影中…

作者头像 李华
网站建设 2026/6/10 12:25:30

强力革新:SQL Studio一站式数据库管理工具重塑开发者体验

强力革新:SQL Studio一站式数据库管理工具重塑开发者体验 【免费下载链接】sqlite-studio SQLite database explorer 项目地址: https://gitcode.com/gh_mirrors/sq/sqlite-studio 还在为繁琐的数据库配置和多工具切换而烦恼吗?SQL Studio作为一款…

作者头像 李华
网站建设 2026/6/8 21:53:22

Wan2.2-T2V-A14B模型的权限管理与访问控制方案

Wan2.2-T2V-A14B模型的权限管理与访问控制方案 在AIGC(人工智能生成内容)技术加速落地的今天,文本到视频(Text-to-Video, T2V)模型正成为影视制作、广告创意和虚拟内容生产的核心引擎。阿里巴巴推出的 Wan2.2-T2V-A14B…

作者头像 李华
网站建设 2026/6/10 5:40:59

基于SpringBoot的设备管理系统的设计与实现源码设计与文档

前言基于 SpringBoot 的设备管理系统,直击企业设备管理 “台账分散、维护不及时、故障难预判、数据无支撑” 的核心痛点,依托 SpringBoot 的高效开发与稳定运行优势,构建 “设备全生命周期管控 智能运维 数据可视化” 的一体化管理平台。传…

作者头像 李华
网站建设 2026/6/10 11:31:51

3步解锁Mac隐藏技能:用PlayCover畅玩iOS应用全攻略

3步解锁Mac隐藏技能:用PlayCover畅玩iOS应用全攻略 【免费下载链接】PlayCover Community fork of PlayCover 项目地址: https://gitcode.com/gh_mirrors/pl/PlayCover 为什么你的Mac能运行iOS应用?当你手握Apple Silicon芯片的Mac时,…

作者头像 李华