使用Matlab建立决策树

综述

除了神经网络模型以外,树模型及基于树的集成学习模型是较为常用的效果较好的预测模型。我们以下先构建一个决策树模型。

决策树算法的优点如下:1、 决策树易于理解和实现,用户在学习过程中不需要了解过多的背景知识,其能够直接体现数据的特点,只要通过适当的解释,用户能够理解决策树所表达的意义。2、 速度快,计算量相对较小,且容易转化成分类规则。只要沿着根节点向下一直走到叶子节点,沿途分裂条件是唯一且确定的。决策树算法的缺点则主要是在处理大样本集时,易出现过拟合现象,降低分类的准确性。

在MATLAB 中,为方便用户对决策树算法的使用,MATLAB 中针对分类决策树和回归决策树分别封装了两个函数:fitctree 和 fitrtree。由于分类决策树和回归决策树两者具有极大的相似性,因此 fitctree 和 fitrtree 两者的使用方法也基本一致。

分类决策树 fitctree 函数在决策树进行分支时,采用的是 CART 方法。其使用方法为 TREE = fitrtree(TBL,Y),其中,TBL 为样本属性值矩阵,Y 为样本标签。利用 MATLAB 中自带的统计3种鸢尾属样本数据 fisheriris。Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

Step 1: 打开matlab,新建脚本

在MATLAB 中,输入以下代码

运行后显示结果如图:

Step 2: 查看属性

MATLAB 命令行窗口显示结果

分别单击上述 MATLAB 命令行窗口中的 Properties 和 Methods 超链接,在窗口中分别显示如下所示。单击 Properties 超链接显示的类 Classification Tree 的所有(可理解为生成决策树)属性,是指通过 fitctree 训练得到的树的所有属性,部分属性值可在 fitctree 函数调用时进行定义,如上述程序中的 PredictorNames(描述各属性的名称)等,另外一部分则是对形成的树的具体属性描述,如 NumNodes(描述各属性的名称)等。由于各属性是属于训练成的决策树,因此当需要观测和调用属性值时,可采用 t.XXX 调用,其中 t 表示训练生成的树的名称,XXX 表示属性名称。

单击 Methods 超链接显示的是类 Classification Tree(可理解为生成的决策树)的操作方法。

对于属性和方法的具体含义及使用方法,可通过 help XXX 查询,XXX 为属性或方法名。

Step 3: 对决策树进行剪枝操作

下面介绍决策树的剪枝方法(Prune)和观测方法(View)的基本使用方法。

其中,t1 表示原决策树,t2 表示剪枝后的新决策树,‘level’ 表示按照层进行剪枝,levelvalue 表示剪掉的层数。‘nodes’ 表示按照借点剪枝,nodes 表示剪掉该结点后的所有枝。view(t2,‘Model’,‘graph’)表示以图形化方式显示 t2 决策树。

针对上述的决策树,进行剪枝。在 MATLAB 命令行窗口中输入:

经过裁剪后的决策树如下图所示:

Step 4: 利用已建好的决策树进行预测

经过上述对决策树的剪枝等操作后,就形成了一个具有使用价值的决策树,在 MATLAB 命令行窗口中输入:

运行后输出结果如下:

上图表示通过决策树分类后,属性值为[1 0.2 0.4 2] 的鸢尾属植物 setosa。

%% CART决策树算法Matlab实现
clear all;
close all;
clc;
load fisheriris % 载入样本数据
t = fitctree(meas, species, 'PredictorNames', {'SL' 'SW' 'PL' 'PW'}) % 定义四种属性显示名称
view(t) % 在命令行窗口用文本显示决策树结构
view(t, 'Mode', 'graph') % 图形显示决策树结构

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/9139.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

LangGPT结构化提示词编写实践

基础任务 如果直接询问大模型strawberry有几个r,大模型会给出错误的答案: 这里我们引入思维连Chain of Thought,我们让大模型遍历一遍单词,每次累加得到最终结果 之前怎么都做不对的题,让大模型一步一步思考&#xf…

开源ISP(Infinite-ISP)介绍

ISP(Image Signal Processor)我介绍了很多了,大家可以先看下面的文章,了解基本概念: ISP算法及架构分析介绍 谈谈FPGA工程师如何做ISP 图像信号处理器和 Infinite-ISP ISP从图像传感器获取 RAW 像素,并将其…

如何在c++侧编译运行一个aclnn(AOL)算子?

1 AOL算子库 CANN(Compute Architecture for Neural Networks)提供了算子加速库(Ascend Operator Library,简称AOL)。该库提供了一系列丰富且深度优化过的高性能算子API,更亲和昇腾AI处理器,调…

三分钟学会Docker基本操作,快速入门容器技术!

如果您时常遭遇以下困境: 被繁琐的应用安装依赖与环境配置耗尽了宝贵时间与精力? 即便严格遵循安装指南,仍频遇障碍,导致应用无法启动,让您倍感挫败与焦虑? 向研发团队反馈安装难题,却只换来“…

快速入门Zookeeper

Zookeeper ZooKeeper作为一个强大的开源分布式协调服务,扮演着分布式系统中至关重要的角色。它提供了一个中心化的服务,用于维护配置信息、命名、提供分布式同步以及提供组服务等。通过其高性能和可靠的特性,ZooKeeper能够确保在复杂的分布式…

uniapp—android原生插件开发(3Android真机调试)

本篇文章从实战角度出发,将UniApp集成新大陆PDA设备RFID的全过程分为四部曲,涵盖环境搭建、插件开发、AAR打包、项目引入和功能调试。通过这份教程,轻松应对安卓原生插件开发与打包需求! 一、打包uniapp资源包: 打包…

Windows 11开发环境配置与应用开发

📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言 Windows 11是微软发布的新一代操作系统,它不仅在视觉和用户体验上进行了革新,还为开发者提供了更…

停车共享小程序ssm+论文源码调试讲解

2 系统关键技术 2.1 微信小程序 微信小程序,简称小程序,英文名Mini Program,是一种全新的连接用户与服务的方式,可以快速访问、快速传播,并具有良好的使用体验。 小程序的主要开发语言是JavaScript,它与普…

【MRAN】情感分析中情态缺失问题的多模态重构和对齐网络

abstract 多模态情感分析(MSA)旨在通过文本、视觉和声音线索识别情感类别。然而,在现实生活中,由于各种原因,可能会缺少一到两种模式。当文本情态缺失时,由于文本情态比视觉和听觉情态包含更多的语义信息&…

通过 Windows IIS 服务访问腾讯云 CFS 文件系统

互联网信息服务(IIS)可以像访问本地数据一样访问文件存储(Cloud File Storage,CFS)系统上的数据,并提供 Web 服务,实现网站存储与计算分离。本文介绍如何配置 IIS 访问 CFS 文件系统。 背景信息…

L7.【LeetCode笔记】相交链表

1.题目 . - 力扣(LeetCode) 给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点,返回 null 。 图示两个链表在节点 c1 开始相交: 题目数据 保证 整个链式结…

Java开发插件:JRebel热部署(最佳实践+激活方式)

使用场景: 在庞大的项目,我们启动项目的时间较长,尤其每次修改完代码要进行测试,就要重新编译启动项目,耗时且繁琐,热部署插件通过设置更新操作,就可以实现快速启动项目,开发效率显…

2024Python安装与配置IDE汉化集活的全套教程

【一】Python解释器下载【运行环境】 【1】Python官网 包含编程资料、学习路线图、源代码、软件安装包等!【[点击这里]】! [https://www.python.org](官网进不去的可以点击点击领取,100%免费!安装包) 【2…

【OD-支持在线评测】数字涂色(100分)

📎 在线评测链接 https://app5938.acapp.acwing.com.cn/contest/11/problem/OD1081 🍓 OJ题目截图 🍿 最新机试E卷,全、新、准,题目覆盖率达 95% 以上,支持题目在线评测,专栏文章质量平均 94 分 🌍 评测功能需要 ⇒ 订阅专栏 ⇐ 后私信联系解锁~ 文章目录 📎…

JAVA学习接口案例实例

要求: 结果: 测试类: package Z; public class Test {public static void main(String[] args) {ClassMnger p new ClassMnger();p.Students();p.Studentall();p.studentavg();} } 实体数据类 public class ClassAll {//存入班级全部学…

远程连接服务器

1、远程连接服务器 1.1 远程连接服务器------通过文字或图形接口方式来远程登录系统,让你在远程终端前登录linux主机以取得可操 作主机接口(shell),而登录后的操作感觉就像是坐在系统前面一样。 1.2 功能------分享主机的运算能…

1分钟教你利用ai工具免费制作10W+情感视频,自动化批量操作,效率提升10倍!

觉得风之馨的文章对你有用的话,记得点赞、关注加星标哦! 今天刷到这种人生感悟号,很容易唤起大家的共鸣。转眼间一年即将过去,摸摸口袋没剩下几个钱。内心突然间就伤感起来了,生活不易,且行且珍惜。 评论出大神,有出来拉仇恨的&a…

CISCO产品介绍

思科防火墙是由全球领先的网络解决方案提供商思科(Cisco)公司研发和生产的一系列网络安全设备。 思科的产品和服务涵盖了多个领域,包括但不限于: 网络硬件:思科的路由器和交换机是其核心产品,广泛应用于企…

Python | Leetcode Python题解之第547题省份数量

题目: 题解: class Solution:def findCircleNum(self, isConnected: List[List[int]]) -> int:def find(index: int) -> int:if parent[index] ! index:parent[index] find(parent[index])return parent[index]def union(index1: int, index2: i…

如何优化Elasticsearch查询以提高性能?

为了优化Elasticsearch查询以提高性能,以下是一些实用的策略和技巧: 节点负载均衡: 通过调整副本数来实现负载均衡。确保分片和副本的总数与节点数量相匹配,以均匀分配查询请求。 慢查询处理: 开启慢查询日志&#xf…