公共机房内。</p>
齐凡一边翻着书,一边调试着代码。</p>
波士顿房价预测线性回归。</p>
其实就是以线性回归的方式,根据一份波士顿地区的历史房价数据,预测未来的房价走势。</p>
齐凡腹诽,不愧是资本主义国家,即便是举个例子,都是充满了金钱的味道。</p>
其实这所谓的预测房价就是个扯淡,所谓的波士顿房价预测也没有任何意义,不过就是拿这一份数据集来演示线性回归而已。</p>
至于线性回归,齐凡已经了解的差不多了。</p>
它的公式巨简单。</p>
【y=wx+b】</p>
不过,y、w、x、b都是向量,并非是初高中数学多元一次方程中的未知数。</p>
普通的“x”是这样的:x=1。</p>
向量的“x”是这样的:x=[0,1,2,3,4,5,6,7,8,9]。</p>
但向量运算除了有其自身一套规则之外,其实和非向量运算也差不多。</p>
向量本质上不过是将数据升维而已,也可以理解成是数据属性的扩充。</p>
就拿波士顿房价数据集来说。</p>
“x”代表了各项评估指标。</p>
[‘CRIM‘,‘ZN‘,‘INDUS‘,‘CHAS‘,‘NOX‘,‘RM‘,‘AGE‘,‘DIS‘,‘RAD‘,‘TAX‘,‘PTRATIO‘,‘B‘,‘LSTAT‘]</p>
CRIM:城镇人均犯罪率。</p>
ZN:住宅用地超过25000平方英尺的比例。</p>
INDUS:城镇非零售商用土地的比例。</p>
CHAS:查理斯河空变量(如果边界是河流,则为1;否则为0)。</p>
NOX:一氧化氮浓度。</p>
RM:住宅平均房间数。</p>
AGE:1940年之前建成的自用房屋比例。</p>
DIS:到波士顿五个中心区域的加权距离。</p>