简介
在现实世界的分析中,洞察力并非来自一张干净的表格。
它们来自数据集的连接、智能地处理缺失值以及提出与业务相关的问题。
本案例研究简要展示了如何使用 Python 和 Pandas 以结构化、专业的方式分析员工绩效和薪酬。
数据集概览
我们使用了三个数据集:
员工— 员工详情和薪资
部门— 部门元数据
绩效——绩效评分和奖金
import pandas as pd import numpy as np import matplotlib.pyplot as pltemployees = pd.DataFrame({ "EmpID": [1, 2, 3, 4, 5, 6, 7], "EmpName": ["Ravi", "Meera", "Kunal", "Aditi", "Soham", "Neha", "Rahul"], "DeptID": [101, 101, 102, 103, 102, 101, 103], "Salary": [70000, 80000, 60000, 90000, 55000, 72000, 85000] }) departments = pd.DataFrame({ "DeptID": [101, 102, 103], "DeptName": ["HR", "Tech", "Finance"], "Location": ["Delhi", "Bangalore", "Mumbai"] }) performance = pd.D