您的浏览器版本过低,为保证更佳的浏览体验,请点击更新高版本浏览器

以后再说X

欢迎访问绘芯科技网站!

全国订购热线:
027-87052087 13329706647

知识库

党建滑轨屏 数学建模中最重要的算法有哪些?

作者:hxceshi 发布时间:2021-11-26 16:32 次浏览

接下来,依次对这几大类中所涵盖的算法做详细的剖析。其中,决策树归纳是经典的分类算法。同时,NBC模型所需估计的数据很少,对缺失数据不太敏感,算法也比较简单。Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。聚类算法一般采用k-Means算法,至于还有无其他聚类算法,还正在探讨之中。所有算法中依然是至关重要的。

对这些经典算法进行归队,其中数据挖掘算法大致可概括为以下几大类:分类算法、聚类算法、关联算法、统计算法、链接挖掘算法、袋装与推进算法。接下来,依次对这几大类中所涵盖的算法做详细的剖析。

分类算法:愈加细分

在商业上应用最多的当属分类算法,分类算法在很多领域都有应用:例如可以通过客户分类构造一个分类模型来对银行贷款进行风险评估;当前的市场营销中很重要的一个特点是强调客户细分,客户类别分析的功能也在于此,采用数据挖掘中的分类技术,可以将客户分成不同的类别,比如呼叫中心设计时可以分为:呼叫频繁的客户、偶然大量呼叫的客户、稳定呼叫的客户、其他,协助呼叫中心寻找出这些不同种类客户之间的特征,这样的分类模型可以让用户了解不同行为类别客户的分布特征;其他分类应用如文献检索和搜索引擎中的自动文本分类技术;安全领域有基于分类技术的入侵检测等等。机器学习、专家系统、统计学和神经网络等领域的研究人员已经提出了许多具体的分类预测方法。在众多的分类模型中,应用最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBC)。

一.C4.5 决策树

其中,决策树归纳是经典的分类算法。它采用自顶向下递归的各个击破方式构造决策树。树的每一个结点上使用信息增益度量选择测试属性。可以从生成的决策树中提取规则。其中典型的是C4.5算法。C4.5主要在市场营销决策分析及把控、营销盈亏分析应用较多。C4.5 算法有如下优点:产生的分类规则易于理解,准确率较高。但也有相应的缺点:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。

二. Naive Bayes

朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的数据很少做预测用什么算法,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。 但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。在属性个数比较多或者属性之间相关性较大时,NBC模型的分类效率比不上决策树模型。而在属性相关性较小时,NBC模型的质量最为良非常好。

三. CART

CART(Classification and Regression Trees)也是一种决策树算法,相对于一个节点下面有多个子树的多元分类,CART只是分类两个子树,这样实现起来稍稍简便些。所以说CART算法生成的决策树是结构简约的二叉树。在分类树下面有两个关键的思想。第一个是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。

四. kNN

K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最类似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

KNN方法虽然从原理上也依赖于极限定理,但在类别决策时,只与极少量的相邻样本有关。因而,采用这种方法可以较非常好地避免样本的不平衡问题。另外,由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因而对于类域的交叉或堆叠较多的待分样本集来说,KNN方法较其他方法更为适合。

聚类算法

聚类算法一般采用k-Means算法,至于还有无其他聚类算法,还正在探讨之中。k-Means算法做预测用什么算法,一般在对市场客户分析,和客户聚类行为分析上采用。例如滑轨技术,电信客户当中,客户消费人群采用的不同产品及不同兴味;以及对低端客户当中,查找电信类客户的虚假开户、代理商欺诈行为分析。

上一篇:互动电视 初学机器学习必备10大算法

下一篇:没有了

客服