从 csv 等取得训练数据集
import pandas as pddata = pd.read_csv('data.csv')
预处理训练数据集
删除不需要的列
data.drop(['id', 'name'], axis=1, inplace=True)
删除空值
data.dropna(inplace=True)
删除重复值
data.drop_duplicates(inplace=True)