CDA LEVEL 2考试大纲

​编辑返回首页

CDA LEVELⅡ考试大纲

一、总体目标

CDA(Certified Data Analyst),即“CDA 数据分析师”,是在数字经济大背景和人工智能时代趋势下,面向全行业的专业权威国际资格认证,旨在提升全球用户数字技能,助力企业数字化转型,推动行业数字化发展。「CDA 人才考核标准」是面向全行业数据相关岗位的一套科学化、专业化、国际化的人才技能准则,CDA 考试大纲规定并明确了数据分析师认证考试的具体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人才。

二、考试形式与试卷结构

考试方式:线下考试,上机答题

考试题型:客观选择题(单选100题+多选20题+内容相关15题+案例分析15题)

考试时间:150分钟

考试成绩:分为A、B、C、D四个层次,A、B、C为通过考试,D为不通过

考试要求:闭卷上机答题,请勿携带与考试无关的用品。

三、知识要求

针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。

1.领会:考生能够了解规定的知识点,并能够了解规定知识点的内涵与外延,了解其内容要点之间的区别与联系,并能做出正确的阐述、解释和说明。

2.熟知:考生须掌握知识的要点,并能够正确理解和记忆相关理论方法,能够根据不同要求,做出逻辑严密的解释、说明和阐述。此部分为考试的重点部分。

3.应用:考生须学会将知识点落地实践,并能够使用相关数据分析工具(如Excel, Python等)进行实操。能够根据具体要求,给出问题的具体实施流程和策略。

四、考试科目

PART 1 数据采集与处理(占比9%)

a.数据采集方法(占比1%)

b.市场调研和数据录入(占比 3%)
   市场调研流程
   样本选取
   问卷设计及录入

c.数据探索与可视化(占比2%)

d.数据预处理方法(占比3%)

PART 2 指标体系(占比3%)

a.指标标准

b.指标体系的定义和意义

c.构建指标库

PART 3 数据治理与数据模型管理(占比6%)

a.数据治理(占比3%)
   数据治理的驱动因素
   数据治理体系
   数据应用域

b.数据模型管理(占比3%)
   数据分类
   关系模型
   数据仓库体系和 ETL

PART 4 标签体系与用户画像(占比5%)

a.标签体系设计原理(占比 3%)

b.标签的加工方式(占比 1%)

c.用户画像(占比 1%)

PART 5 统计分析(占比25%)

a.抽样估计(占比 5%)

b.假设检验(占比 5%)

c.方差分析(占比 5%)

d.一元线性回归分析(占比 10%)

PART 6 数据分析模型(占比40%)

a.主成分分析法、因子分析法(占比 10%)

b.多元回归分析法
   多元线性回归(占比 10%)
   逻辑回归(占比 10%)

c.聚类分析法
   系统聚类法(占比 2%)
   K-Means 聚类法(占比 3%)

d.时间序列(占比 5%)

PART 7 数字化工作方法(占比 12%)

a.业务探查与问题定位(占比 3%)

b.问题诊断
   近因分析(占比 3%)
   根本原因分析(占比 2%)

c.业务策略优化和指导
   业务目标设定原则(占比 1%)
   知识库,策略库,流程分析(占比 1%)
   线性和整数规划(占比 1%)
   二次优化(占比 1%)

五、科目内容

PART 1 数据采集与处理

1、数据采集方法
【领会】

一手数据与二手数据来源渠道
优劣势分析
使用注意事项

【熟知】

一手数据采集中的概率抽样与非概率抽样的区别与优缺点

【运用】

概率抽样方法,包括简单随机抽样、分层抽样、系统抽样、分段抽样明确每种抽样的优缺点
根据给定条件选择最可行的抽样方式
计算简单随机抽样所需的样本量

2、市场调研和数据录入
【熟知】

市场调研的基本步骤(提出问题、理论推演、收集材料、构建模型、归因分析)
样本选取方式的适应性及优缺点
问卷设计原理,问卷题型设置以及每类题型的数据编码及录入

3、数据探索与可视化
【领会】

数据探索的目的与意义
常用数据可视化工具软件(EXCEL BI、SPSS、PYTHON等)

【熟知】

数据探索与数据预处理之间的关系
数据探索常用数据描述方法:集中趋势分析、离中趋势分析、数据分布关系、图分析
数据探索常用数理统计方法:假设检验、方差检验、相关分析、回归分析、因子分析

【应用】

能够通过使用数据可视化工具(EXCEL BI、SPSS、PYTHON 等)来完成相关数据分析项目的数据探索任务。(说明:考试中不会考核该部分工具和软件的使用方法)。

4、数据预处理方法
【熟知】

数据预处理的基本步骤,包括数据集成(不同数据源的整合)、数据探索、数据变换(标准化)、数据归约(维度归约技术、数值归约技术),这部分内容不涉及计算,只需要根据需求明确可选的处理技术即可。

【应用】

数据清洗,包括填补遗漏的数据值(根据业务场景使用常数、中位数、众数等方法,不涉及多重查补的方法)、平滑有噪声数据(移动平均)、识别或除去异常值(单变量根据中心标准化值,多变量使用快速聚类),以及解决不一致问题(熟知概念即可),查重(只考核 SQL 的语句,不涉及其它语言)。

PART 2 指标体系

【领会】

指标标准
构建指标体系的意义

【熟知】

指标体系的定义和概念
构建指标库

PART 3 数据治理与数据模型管理

1、数据治理
【领会】

数据治理的驱动因素
数据治理、数据管理、数据应用的概念
数据治理域、数据管理域、数据应用域各自包含的内容及工作

【熟知】

元数据、主数据、交易数据的概念
数据质量要求

2、数据模型管理
【领会】

数据和信息的概念
数据库建模中概念、逻辑、物理模型之间的关系
数据库范式的概念、数据仓库和数据集市、ETL过程

【熟知】

关系模型与维度模型的使用场景

PART 4 标签体系与用户画像

1、标签体系设计原理
【领会】

区分标签和指标的概念
精准营销的概念
消费者决策进程
用户分群发展历程

【熟知】

分层标签和分群标签
马斯洛需求层次理论
用户标签和用户画像的关系

2、标签的加工方式
【领会】

标签的时态角度分类

【熟知】

基础、统计、模型标签

3、用户画像
【领会】

细分市场和STP模型
用户画像的概念
标签在数据科学的作用

【熟知】

用户细分的方法
用户分群的精准营销
用户画像在EDIT模型中的作用和应用

PART 5 统计分析

1、抽样估计
【领会】

随机试验、随机事件、随机变量的概念
总体与样本的概念
抽样估计的理论基础
正态分布及三大分布的图像形式
三大分布的构造原理

【熟知】

随机事件的概率
点估计与区间估计方法的特点与优缺点
总体与样本
参数和统计量
重复抽样与不重复抽样
常见的抽样分布

【应用】

随机变量及其概率分布
根据不同的场景,选择合适的统计量进行总体的参数估计

2、假设检验
【领会】

假设检验的基本概念
其基本思想在数据分析中的作用
假设检验的基本步骤
假设检验与区间估计的联系
假设检验中的两类错误

【熟知】

检验统计量、显著性水平及对应临界值(Critical Value)的基本定义
P 值的含义及计算
如何利用 P 值进行检验
z 检验统计量
t 检验统计量
F 检验统计量
𝜒2检验统计量

【应用】

实现单样本 t 检验
实现配对样本 t 检验
两独立样本 t 检验的步骤和检验中使用的统计量与原假设
两种检验应用的数据分析场景

3、方差分析
【领会】

方差分析的相关概念
单因素方差分析的原理
多因素方差分析的原理
方差分析的统计量构造过程

【熟知】

单因素方差分析的基本步骤
总离差平方和(SST)的含义及计算
组间离差平方和(SSA)的含义及计算
组内离差平方和(SSE)的含义及计算
单因素方差分析的原假设
多因素方差分析的种类
列联表检验的原理

【应用】

实现单因素方差分析的步骤
实现多因素方差分析的步骤
对方差分析表的解读

4、一元线性回归分析
【领会】

相关分析散点图的绘制与作用
相关系数的计算公式

【熟知】

相关分析的概念与特点
相关关系与函数关系的区别与联系
相关关系的种类及意义
一元线性回归系数的最小二乘估计
一元线性回归模型的检验

【应用】

计算相关系数与回归系数
回归分析与相关分析的区别与联系

PART 6 数据分析模型

总体要求

领会模型基本原理,数值模型操作流程,懂得模型应用场景,能够完成数据建模分析报告。

1、主成分分析
【领会】

矩阵分析法的基本思想
主成分分析的原理
主成分分析的计算步骤

【熟知】

适用于主成分分析的变量类型
主成分的个数的保留原则

【应用】

在深入理解主成分的意义的基础之上,在遇到业务问题时,有能力决定是否使用主成分分析方法
明确主成分分析的适用场景

2、因子分析
【领会】

了解因子分析模型设置,只需要关注主成分法的计算步骤

【熟知】

适用于因子分析的变量度量类型,通过分析结果,选取合适的因子个数
常用因子旋转的方法
主成分分析与因子分析的联系与区别

【应用】

在遇到业务问题时,有能力决定使用因子分析还是主成分分析
有能力根据原始变量在各因子上的权重明确每个因子的意义
在聚类前对数据进行描述,发现理想的聚类方式和数量

3、回归分析
【领会】

多元线性回归的原理

【熟知】

使用最小二乘法计算多元回归模型的结果
明确线性回归的 6 个经典假设
明确违反上述假设后出现的问题以及解决方法
明晰横截面和时间序列数据在回归建模上的差异
模型评估、模型检验、系数检验

【应用】

结合业务构建回归模型并且解释回归系数
根据业务场景与变量分布情况进行函数转换
解释变量为分类变量时的处理方法

4、分类分析
【领会】

卡方检验计算原理与公式
二分类逻辑回归的计算公式

【熟知】

分类变量是否存在相关关系的描述方法和检验方法,涉及列联表分析、卡方检验与 Logit 转换
二分类逻辑回归模型构建与变量筛选
模型评估的方法,涉及混淆矩阵、ROC 曲线、由混淆矩阵衍生出来的评估指标

【应用】

结合业务构建分类模型并且解释回归系数
根据模型结果进行新样本预测
进行客户流失预测、信用评级、精准营销等模型的基本步骤与注意事项

5、聚类分析
【领会】

用户细分与聚类的关系
聚类分析的基本概念

【熟知】

聚类模型的评估方法
聚类方法的基本逻辑,涉及层次聚类、kmeans聚类
层次聚类和 K-Means 聚类的基本算法和优缺点
层次聚类的计算步骤,包括两点距离、两类合并的计算方法
K-Means 聚类的基本算法
聚类分析变量标准化的原因和计算方法
变量需要进行主成分分析的原因
距离的计算

【应用】

结合客户画像、客户细分、商品聚类、离群值检验(欺诈、反洗钱)等业务运用场景,选取合适的聚类方法与步骤。
聚类事后分析,根据聚类后变量分布情况获取每类的特征。

6、时间序列
【领会】

时间序列分析原理

【熟知】

时间序列分析的方法
明确趋势分解法、ARMA方法、ARIMA 方法差异和适用场景
ARIMA方法的建模流程

【应用】

结合业务(业绩预测、预警),选取合适的分析方法
进行业务时间序列预测等模型的基本步骤与注意事项

PART 7 数字化工作方法

1、业务探查与问题定位
【领会】

异常事件严重度评估准则。
业务流程等事件还原工具。

【熟知】

业务流程图的绘制。

2、问题诊断
【领会】

近因分析的头脑风暴法与量化分析分析工具的选取。
根本原因分析中的5WHY分析法,原因型和对策型因果图。

【熟知】

通过帕累托分析识别要点。
通过散点图、关联图、亲和图进行关联分析。
通过漏斗分析、用户画像、留存分析、跟踪数字足迹进行探查。
绘制原因型因果图。

3、业务策略优化和指导
【领会】

业务目标设定原则
线性规划的组成部分、标准形式。
整数规划与去尾法线性规划的差异性。
二次规划的组成部分、标准形式。
知识库的类型和组成部分。
策略库的类型和组成部分。

【熟知】

线性规划的建模步骤。
二次规划的建模步骤。
流程优化的分析方法和工具。

【应用】

根据题目要求给出目标函数和约束条件。

六、推荐学习书目

说明:推荐学习书目中,部分书籍结合软件,但考试中不考查软件操作使用,考生可根据自身需求选择性学习。参考书目不需全部学完,根据考纲知识点进行针对性学习即可。

[1] 常国珍等.商业策略数据分析.电子工业出版社,2023.(必读)
[2] 赵仁乾,常国珍等.金融商业算法建模:基于python和SAS[M].机械工业出版社,2021.(必读)
[3] 比约恩等.根原因分析-简化的工具和技术(第2版)[M].中国人民大学出版社,2011.(必读)
[4] 常国珍等.Python数据科学:技术详解与商业实践 [M].机械工业出版社,2018.(必读)
[5] 贾俊平,何晓群,金勇进.统计学(第8版)[M].中国人民大学出版社,2021.(选读)
[6] 金勇进,杜子芳等.抽样技术(第5版).中国人民大学出版社,2021.(选读)
[7] 数据管理协会(DAMA国际).DAMA数据管理知识体系指南(原书第2版)[M].机械工业出版社,2020.(选读)
[8] 韩伯棠,管理运筹学(第5版)[M].高等教育出版社,2020.(选读)
[9] 任寅姿,季乐乐等.标签类目体系[M].机械工业出版社,2021.(选读)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/15614.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

基于STM32的智能家居系统:MQTT、AT指令、TCP\HTTP、IIC技术

一、项目概述 随着智能家居技术的不断发展,越来越多的家庭开始使用智能设备来提升生活质量和居住安全性。智能家居系统不仅提供了便利的生活方式,还能有效地监测家庭环境,保障家庭安全。本项目以设计一种基于STM32单片机的智能家居系统为目标…

微信小程序-prettier 格式化

一.安装prettier插件 二.配置开发者工具的设置 配置如下代码在setting.json里: "editor.formatOnSave": true,"editor.defaultFormatter": "esbenp.prettier-vscode","prettier.documentSelectors": ["**/*.wxml"…

3D编辑器教程:如何实现3D模型多材质定制效果?

想要实现下图这样的产品DIY定制效果,该如何实现? 可以使用51建模网线上3D编辑器的材质替换功能,为产品3D模型每个部位添加多套材质贴图,从而让3D模型在展示时实现DIY定制效果。 具体操作流程如下: 第1步:上…

SQL集合运算

集合论是SQL语言的根基。 1 集合运算 注意事项: 1)SQL能操作具有重复行的集合,可以通过可选项ALL来支持。 如果直接使用UNION或INTERSECT,结果里不会出现重复的行。如果想在结果里留下重复行,可以加上可选项ALL。写…

【PGCCC】Postgresql 存储设计

架构图 用户查询指定 page 的数据 首先查询该 page 是否在缓存中,通过 hash table 快速查找它在缓存池的位置 如果存在,那么从缓存池读取返回 如果不存在需要从磁盘读取数据,并且放入到缓存池中,然后返回 postgresql 存储单位 …

CTFHub每日练习

文章目录 技能树CTF Web信息泄露目录遍历PHPINFO备份文件下载网站源码bak文件vim缓存.DS_Store Git泄露Logstash index方法一方法二 密码口令弱口令 技能树 CTF Web 信息泄露 目录遍历 PHPINFO 备份文件下载 网站源码 当开发人员在线上环境中对源代码进行了备份操作&#x…

pycharm分支提交操作

一、Pycharm拉取Git远程仓库代码 1、点击VCS > Get from Version Control 2、输入git的url,选择自己的项目路径 3、点击Clone,就拉取成功了 默认签出分支为main 选择develop签出即可进行开发工作 二、创建分支(非必要可以不使用&#xf…

SkyWalking-安装

SkyWalking-简单介绍 是一个开源的分布式追踪系统,用于检测、诊断和优化分布式系统的功能。 支持 ElasticSearch、H2、MySQL、PostgreSql 等数据库 基于 ElasticSearch 的情况 ElasticSearch(ES) 安装 1、下载并解压 https://www.elastic…

【MySQL基础刷题】总结题型(三)

十题左右,便于复习 1.查询结果的质量和占比2.每月交易I3.销售分析III4.只出现一次的最大数字5.买下所有产品的客户6.员工的直属部门7.指定日期的产品价格 1.查询结果的质量和占比 avg大神啊… SELECT query_name, ROUND(avg(rating / position), 2) as quality, …

PyEcharts | 通过分析奥迪车购买数据来学习柱状折线复合图像的绘制方法

柱状折线复合图像效果 实现步骤 df pd.read_csv(3汽车之家-奥迪汽车数据.csv) df.head()print(df.shape) df.info()注意所有 列字段 对应的数据类型,同时注意绘图所需要的汽车销售数量和价格 df1 df.copy() df1 df1[~df1[百公里油耗].str.contains(百公里电耗…

Spring Data Redis常见操作总结

我列出来的都是最常用的&#xff0c;其他的你要自己去搜搜 1. 列表类型数据 Autowired private RedisTemplate<String ,Object> redisTemplate;public void f1() {String k "key";ListOperations<String, Object> list redisTemplate.opsForList();r…

【linux】如何扩展磁盘容量(VMware虚拟机)-转载

如何扩展磁盘容量(VMware虚拟机) 一、前置准备工作 扩展虚拟机磁盘前&#xff0c;需要先把虚拟机关机才能进行扩展磁盘操作 1.选择虚拟机设置&#xff0c;如下图所示 2.输入你想扩展的磁盘容量&#xff0c;以本次实操为例&#xff0c;我这里输入的30G&#xff08;具体按照实…

本机ip地址和网络ip地址一样吗

在数字化时代的浪潮中&#xff0c;IP地址作为网络设备身份的象征&#xff0c;扮演着举足轻重的角色。然而&#xff0c;当我们谈论IP地址时&#xff0c;常常会听到“本机IP地址”与“网络IP地址”这两个术语&#xff0c;它们之间是否存在差异&#xff1f;又该如何准确理解并区分…

Cacheable注解导致线程block

优质博文&#xff1a;IT-BLOG-CN 环境&#xff1a;jdk8/tomcat7 一、问题现象 应用系统再一次发布回退时&#xff0c;cpu util突然徒增到100%以上&#xff0c;与此同时&#xff0c;服务响应时间大幅度增加&#xff0c;依赖该服务的应用接连抛出超时异常&#xff0c;发生熔断。…

【数据分享】中国证券期货统计年鉴(2001~2023)

数据介绍 一、《中国证券期货统计年鉴(2023)》(中英文)收录了2022年证券期货市场的统计数据以及与证券期货市场相关的部分宏观经济数据&#xff0c;是一部全面反映中华人民共和国证券期货市场发展情况的资料性年刊。 二、年鉴分为概况、股票、债券、基金、期货、上市和挂牌公…

IDEA 2024.3正式版发布,速览新功能!

0 前言 IntelliJ IDEA 2024.3 引入了一系列可以提升您的开发体验的强大新功能。 IDE 现在提供代码逻辑结构的表示&#xff0c;简化了 Kubernetes 应用程序的调试体验&#xff0c;引入了集群范围的 Kubernetes 日志访问。 1 关键亮点 1.1 Structure工具窗口中的 Logical代码结…

Docker 基础命令介绍和常见报错解决

介绍一些 docker 可能用到的基础命令&#xff0c;并解决三个常见报错&#xff1a; 权限被拒绝&#xff08;Permission Denied&#xff09;无法连接到 Docker 仓库&#xff08;Timeout Exceeded&#xff09;磁盘空间不足&#xff08;No Space Left on Device&#xff09; 命令以…

【大语言模型】ACL2024论文-10 CSCD-IME: 纠正拼音输入法产生的拼写错误

【大语言模型】ACL2024论文-10 CSCD-IME: 纠正拼音输入法产生的拼写错误 目录 文章目录 【大语言模型】ACL2024论文-10 CSCD-IME: 纠正拼音输入法产生的拼写错误目录摘要研究背景问题与挑战如何解决创新点算法模型1. 错误检测模型2. 伪数据生成模块3. n-gram语言模型过滤4. 多任…

前端(2)——快速入门CSS

参考&#xff1a; 罗大富 CSS 参考手册 | 菜鸟教程 CSS 参考手册 1. CSS CSS全名是层叠样式表&#xff0c;中文名层叠样式表。用于定义网页样式和布局的样式表语言。 通过 CSS&#xff0c;你可以指定页面中各个元素的颜色、字体、大小、间距、边框、背景等样式&#xff0c;…

电阻测试流程

1.外观检查 &#xff08;1&#xff09;样品上丝印与规格书中相符&#xff0c;0402以上封装电阻要有标称电阻值&#xff0c;丝印清晰。 &#xff08;2&#xff09;检验外观&#xff0c;主要包含以下几点&#xff1a; a) 电阻器本体饱满&#xff0c;有光泽&#xff0c;不允许有气…