智慧投资者

带你掌握机器学习的基础算法

Rose 0

机器学习是人工智能的一种,其本质上讲,就是计算机可以在无需编程的情况下自己学习概念。这些计算机程序一旦接触新的数据,就将会改变它们的「思考」(或者输出)。为了实现机器学习,算法是必需的。算法被写入计算机并在其剖析数据时给与其需要遵循的规则。

机器学习算法经常被用于预测分析,预测是一种基于输入变量来估计输出变量的过程。在商业中,预测分析可以用于告诉企业未来最有可能发生什么。例如,使用预测分析算法,在线T恤零售商可以使用当前的数据来预测下个月他们将会售出多少T恤。

机器学习基础算法:

线性模型算法

线性模型使用简单的公式通过一组数据点来查找最优拟合线。通过已知的变量方程(比如,原料),可以求出你想要预测的变量(比如,烘烤蛋糕需要多长时间)。为了求出预测量,输入已知的变量得到答案。

不同的形式,有着不同的线性模型算法:

线性回归

线性回归,也称为最小二乘回归,是线性模型的最标准的形式。对于回归问题,线性回归是最简单的线性模型。

逻辑回归

逻辑回归是为分类问题进行简单调整过的线性回归,由于其构造,逻辑回归非常适合于分类问题

线性回归和逻辑回归的缺点

两者都具有过拟合的趋势,这意味着模型太适应于数据而牺牲了推广到先前未知的数据的能力,这意味着它们有一定的惩罚以防止过拟合。另一个线性模型的缺点是,因为它们太简单了,所以往往不能预测更复杂的行为。

树型模型

树型模型有助于探索数据集,并可视化预测的决策规则。当你听到关于树型模型的东西时,可以将其想成是决策树或分支操作序列。树型模型高度精确、稳定且更易于解释。与线性模型相反,它们可以映射非线性关系以求解问题。

决策树

决策树是一种使用分支方法来显示决策的每个可能结果的图。为了创建或者训练决策树,可以采用过去训练模型的数据,并找出哪些属性可以最佳分割目标训练集。然后绘制出所有可能满足要求的结果

随机森林

随机森林非常容易训练,且它表现良好,是许多决策树的平均,每个决策树都用数据的随机样本训练。森林中的每个独立的树都比一个完整的决策树弱,但是通过将它们结合,可以获得更高的整体表现。

梯度提升

梯度提升和随机森林类似,都是由弱决策树构成的。最大的区别是,在梯度提升中树是被一个接一个相继训练的,每个随后的树主要用被先前树错误识别的数据进行训练,这使得梯度提升更少地集中在容易预测的情况并更多地集中在困难的情况。

神经网络

生物学中的神经网络是互相交换信息的相互连接的神经元。这个想法已经适用于机器学习的世界,被称为人工神经网络(ANN)。人工神经网络包含了许多可以学习类似人脑的认知能力的模型,它需要很长时间来训练模型,且需要很多的能量。

VR交互手套

动作捕捉系统

全身动作捕捉系统

相关内容