当时做了一个BP神经网络的自定义数据集预测房价的项目,用Jupyter notebook运行,参考GITHUB项目(找不到地址了)爬取北京二手房的数据,也参考了波士顿房价预测的方案,故作此记录:

波士顿房价数据:

  • CRIM–城镇人均犯罪率
  • ZN – 占地面积超过25,000平方英尺的住宅用地比例。
  • INDUS – 每个城镇非零售业务的比例。
  • CHAS – Charles River虚拟变量(如果是河道,则为1;否则为0)
  • NOX – 一氧化氮浓度(每千万份)
  • RM – 每间住宅的平均房间数
  • AGE – 1940年以前建造的自住单位比例
  • DIS加权距离波士顿的五个就业中心
  • RAD – 径向高速公路的可达性指数
  • TAX – 每10,000美元的全额物业税率
  • PTRATIO – 城镇的学生与教师比例
  • B – 1000(Bk – 0.63)^ 2其中Bk是城镇黑人的比例
  • LSTAT – 人口状况下降%
  • MEDV – 自有住房的中位数报价, 单位1000美元

一般抽离MEDV这一层做Y,其余层做X


0 条评论

发表回复

Avatar placeholder

您的电子邮箱地址不会被公开。 必填项已用*标注