第12章 副作用(1 / 2)

 公共机房内。</p>

齐凡一边翻着书,一边调试着代码。</p>

波士顿房价预测线性回归。</p>

其实就是以线性回归的方式,根据一份波士顿地区的历史房价数据,预测未来的房价走势。</p>

齐凡腹诽,不愧是资本主义国家,即便是举个例子,都是充满了金钱的味道。</p>

其实这所谓的预测房价就是个扯淡,所谓的波士顿房价预测也没有任何意义,不过就是拿这一份数据集来演示线性回归而已。</p>

至于线性回归,齐凡已经了解的差不多了。</p>

它的公式巨简单。</p>

【y=wx+b】</p>

不过,y、w、x、b都是向量,并非是初高中数学多元一次方程中的未知数。</p>

普通的“x”是这样的:x=1。</p>

向量的“x”是这样的:x=[0,1,2,3,4,5,6,7,8,9]。</p>

但向量运算除了有其自身一套规则之外,其实和非向量运算也差不多。</p>

向量本质上不过是将数据升维而已,也可以理解成是数据属性的扩充。</p>

就拿波士顿房价数据集来说。</p>

“x”代表了各项评估指标。</p>

[‘CRIM‘,‘ZN‘,‘INDUS‘,‘CHAS‘,‘NOX‘,‘RM‘,‘AGE‘,‘DIS‘,‘RAD‘,‘TAX‘,‘PTRATIO‘,‘B‘,‘LSTAT‘]</p>

CRIM:城镇人均犯罪率。</p>

ZN:住宅用地超过25000平方英尺的比例。</p>

INDUS:城镇非零售商用土地的比例。</p>

CHAS:查理斯河空变量(如果边界是河流,则为1;否则为0)。</p>

NOX:一氧化氮浓度。</p>

RM:住宅平均房间数。</p>

AGE:1940年之前建成的自用房屋比例。</p>

DIS:到波士顿五个中心区域的加权距离。</p>