跳转到内容

准备训练数据

数据准备

  1. 从 csv 等取得训练数据集

    import pandas as pd
    data = pd.read_csv('data.csv')
  2. 预处理训练数据集

    • 删除不需要的列

      data.drop(['id', 'name'], axis=1, inplace=True)
    • 删除空值

      data.dropna(inplace=True)
    • 删除重复值

      data.drop_duplicates(inplace=True)