当时做了一个BP神经网络的自定义数据集预测房价的项目,用Jupyter notebook运行,参考GITHUB项目(找不到地址了)爬取北京二手房的数据,也参考了波士顿房价预测的方案,故作此记录:
波士顿房价数据:
- CRIM–城镇人均犯罪率
- ZN – 占地面积超过25,000平方英尺的住宅用地比例。
- INDUS – 每个城镇非零售业务的比例。
- CHAS – Charles River虚拟变量(如果是河道,则为1;否则为0)
- NOX – 一氧化氮浓度(每千万份)
- RM – 每间住宅的平均房间数
- AGE – 1940年以前建造的自住单位比例
- DIS加权距离波士顿的五个就业中心
- RAD – 径向高速公路的可达性指数
- TAX – 每10,000美元的全额物业税率
- PTRATIO – 城镇的学生与教师比例
- B – 1000(Bk – 0.63)^ 2其中Bk是城镇黑人的比例
- LSTAT – 人口状况下降%
- MEDV – 自有住房的中位数报价, 单位1000美元
一般抽离MEDV这一层做Y,其余层做X
0 条评论