线性回归
简介
线性回归是一种用于建立变量之间线性关系的统计学习方法。它通过拟合一个线性模型来预测一个或多个自变量与因变量之间的关系。具体地说,线性回归模型假设自变量和因变量之间存在一个线性关系,即因变量可以通过自变量的线性组合来表示。
在线性回归中,我们通常使用最小二乘法来估计模型参数。最小二乘法的基本思想是通过最小化残差平方和来拟合数据,其中残差是预测值与实际值之间的差异。通过最小化残差平方和,我们可以找到一组最优的模型参数,使得模型能够最好地拟合数据。
线性回归算法在许多领域都有广泛的应用,如金融、医疗、工业等。它可以用于预测股票价格、疾病发生率、产品销售额等。
算法参数及说明
注意:线性回归的目标属性和特征属性必须都是数值类型参数 | 说明 |
---|---|
拟合截距 | 默认true |
正则化 | 默认false |
案例
案例数据下载:iris.xlsx
案例介绍:Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
- Sepal.Length(花萼长度),单位是cm;
- Sepal.Width(花萼宽度),单位是cm;
- Petal.Length(花瓣长度),单位是cm;
- Petal.Width(花瓣宽度),单位是cm;
- 种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)。
制作流程:
-
选择iris数据集;
-
在智能分析图表中选择线性回归;
-
在设置中的基础配置中选择状态为成功的线性回归模型,** 注意:数据集字段必须包含已选择的线性回归模型所使用的训练集字段 **;
如果模型列表中没有模型,需要创建模型,创建模型的链接:机器学习模型管理
-
进行数据探索,结果以表的方式展示