sheng的学习笔记-【中文】【吴恩达课后测验】Course 2 - 改善深层神经网络 - 第二周测验

课程2_第2周_测验题

目录:目录

第一题

1.当输入从第8个mini-batch的第7个的例子的时候,你会用哪种符号表示第3层的激活?

A. 【  】 a [ 3 ] { 8 } ( 7 ) a^{[3]\{8\}(7)} a[3]{8}(7)

B. 【  】 a [ 8 ] { 7 } ( 3 ) a^{[8]\{7\}(3)} a[8]{7}(3)

C. 【  】 a [ 8 ] { 3 } ( 7 ) a^{[8]\{3\}(7)} a[8]{3}(7)

D. 【  】 a [ 3 ] { 7 } ( 8 ) a^{[3]\{7\}(8)} a[3]{7}(8)

答案:

A.【 √ 】 a [ 3 ] { 8 } ( 7 ) a^{[3]\{8\}(7)} a[3]{8}(7)

第二题

2.关于mini-batch的说法哪个是正确的?

A. 【  】mini-batch迭代一次(计算1个mini-batch),要比批量梯度下降迭代一次快

B. 【  】用mini-batch训练完整个数据集一次,要比批量梯度下降训练完整个数据集一次快

C. 【  】在不同的mini-batch下,不需要显式地进行循环,就可以实现mini-batch梯度下降,从而使算法同时处理所有的数据(矢量化)

答案:

A.【 √ 】mini-batch迭代一次(计算1个mini-batch),要比批量梯度下降迭代一次快

第三题

3.为什么最好的mini-batch的大小通常不是1也不是m,而是介于两者之间?

A. 【  】如果mini-batch的大小是1,那么在你取得进展前,你需要遍历整个训练集

B. 【  】如果mini-batch的大小是m,就会变成批量梯度下降。在你取得进展前,你需要遍历整个训练集

C. 【  】如果mini-batch的大小是1,那么你将失去mini-batch将数据矢量化带来的的好处

D. 【  】如果mini-batch的大小是m,就会变成随机梯度下降,而这样做经常会比mini-batch慢

答案:

B.【 √ 】如果mini-batch的大小是m,就会变成批量梯度下降。在你取得进展前,你需要遍历整个训练集

C.【 √ 】如果mini-batch的大小是1,那么你将失去mini-batch将数据矢量化带来的的好处

第四题

4.如果你的模型的成本随着迭代次数的增加,绘制出来的图如下,那么:
在这里插入图片描述

A. 【  】如果你正在使用mini-batch梯度下降,那可能有问题;而如果你在使用批量梯度下降,那是合理的。

B. 【  】如果你正在使用mini-batch梯度下降,那看上去是合理的;而如果你在使用批量梯度下降,那可能有问题。

C. 【  】无论你在使用mini-batch还是批量梯度下降,看上去都是合理的。

D. 【  】无论你在使用mini-batch还是批量梯度下降,都可能有问题。

答案:

B.【 √ 】如果你正在使用mini-batch梯度下降,那看上去是合理的;而如果你在使用批量梯度下降,那可能有问题。

第五题

5.假设一月的前三天卡萨布兰卡的气温是一样的:

  • 一月第一天: θ 1 = 10 \theta_1 = 10 θ1=10
  • 一月第二天: θ 2 = 10 \theta_2 = 10 θ2=10

假设您使用 β = 0.5 \beta = 0.5 β=0.5的指数加权平均来跟踪温度: v 0 = 0 , v t = β v t − 1 + ( 1 − β ) θ t v_0=0,v_t=\beta v_{t-1}+(1-\beta)\theta_t v0=0,vt=βvt1+(1β)θt。如果 v 2 v_2 v2是在没有偏差修正的情况下计算第2天后的值,并且 v 2 c o r r e c t e d v_2^{corrected} v2corrected是您使用偏差修正计算的值。 这些下面的值是正确的是?

A. 【  】 v 2 = 10 , v 2 c o r r e c t e d = 10 v_2=10,v_2^{corrected}=10 v2=10,v2corrected=10

B. 【  】 v 2 = 10 , v 2 c o r r e c t e d = 7.5 v_2=10,v_2^{corrected}=7.5 v2=10,v2corrected=7.5

C. 【  】 v 2 = 7.5 , v 2 c o r r e c t e d = 7.5 v_2=7.5,v_2^{corrected}=7.5 v2=7.5,v2corrected=7.5

D. 【  】 v 2 = 7.5 , v 2 c o r r e c t e d = 10 v_2=7.5,v_2^{corrected}=10 v2=7.5,v2corrected=10

答案:

D.【 √ 】 v 2 = 7.5 , v 2 c o r r e c t e d = 10 v_2=7.5,v_2^{corrected}=10 v2=7.5,v2corrected=10

第六题

6.下面哪一个不是比较好的学习率衰减方法?

A. 【  】 α = 1 1 + 2 ∗ t α 0 \alpha = \frac{1}{1+2*t}\alpha_0 α=1+2t1α0

B. 【  】 α = 1 t α 0 \alpha=\frac{1}{\sqrt{t}}\alpha_0 α=t 1α0

C. 【  】 α = 0.9 5 t α 0 \alpha=0.95^t\alpha_0 α=0.95tα0

D. 【  】 α = e t α 0 \alpha=e^t\alpha_0 α=etα0

答案:

D.【 √ 】 α = e t α 0 \alpha=e^t\alpha_0 α=etα0

第七题

7.您在伦敦温度数据集上使用指数加权平均, 使用以下公式来追踪温度: v t = β v t − 1 + ( 1 − β ) θ t v_t=\beta v_{t-1}+(1-\beta)\theta_t vt=βvt1+(1β)θt。下图中红线使用的是 β = 0.9 \beta=0.9 β=0.9来计算的。当你改变 β \beta β时,你的红色曲线会怎样变化?(选出所有正确项)
在这里插入图片描述

A. 【  】减小 β \beta β,红色线会略微右移

B. 【  】增加 β \beta β,红色线会略微右移

C. 【  】减小 β \beta β,红线会更加震荡

D. 【  】增加 β \beta β,红线会更加震荡

答案:

B.【 √ 】增加 β \beta β,红色线会略微右移

C.【 √ 】减小 β \beta β,红线会更加震荡

第八题

8.下图中的曲线是由:梯度下降,动量梯度下降( β = 0.5 \beta=0.5 β=0.5)和动量梯度下降( β = 0.9 \beta=0.9 β=0.9)。哪条曲线对应哪种算法?
在这里插入图片描述

A. 【  】(1)是梯度下降;(2)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9);(3)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5

B. 【  】(1)是梯度下降;(2)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(3)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9

C. 【  】(1)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(2)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9);(3)是梯度下降

D. 【  】(1)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(2)是梯度下降;(3)是动量梯度下降($\beta=0.9
$)

答案:

B.【 √ 】(1)是梯度下降;(2)是动量梯度下降( β = 0.5 \beta=0.5 β=0.5);(3)是动量梯度下降( β = 0.9 \beta=0.9 β=0.9

第九题

9.假设在一个深度学习网络中,批量梯度下降花费了大量时间时来找到一组参数值,使成本函数 ( J ( W [ 1 ] , b [ 1 ] , … , W [ L ] , b [ L ] ) (J(W^{[1]},b^{[1]},…,W^{[L]},b^{[L]}) J(W[1],b[1],,W[L],b[L])小。以下哪些方法可以帮助找到 J J J值较小的参数值?

A. 【  】令所有权重值初始化为0

B. 【  】尝试调整学习率

C. 【  】尝试mini-batch梯度下降

D. 【  】尝试对权重进行更好的随机初始化

E. 【  】尝试使用 Adam 算法

答案:

B.【 √ 】尝试调整学习率

C.【 √ 】尝试mini-batch梯度下降

D.【 √ 】尝试对权重进行更好的随机初始化

E.【 √ 】尝试使用 Adam 算法

第十题

10.关于Adam算法,下列哪一个陈述是错误的?

A. 【  】Adam结合了Rmsprop和动量的优点

B. 【  】Adam中的学习率超参数 α \alpha α通常需要调整

C. 【  】我们经常使用超参数的“默认”值 β 1 = 0 , 9 , β 2 = 0.999 , ϵ = 1 0 − 8 \beta_1=0,9,\beta_2=0.999,\epsilon=10^{-8} β1=0,9,β2=0.999,ϵ=108

D. 【  】Adam应该用于批梯度计算,而不是用于mini-batch

答案:

D.【 √ 】Adam应该用于批梯度计算,而不是用于mini-batch

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/149181.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录 Day11 二叉树 LeetCode T144,145,94 前中后序遍历 (递归解法)

题解及更详细解答来自于:代码随想录 (programmercarl.com) 前言: 递归三要素 确定递归函数的参数和返回值: 确定哪些参数是递归的过程中需要处理的,那么就在递归函数里加上这个参数, 并且还要明确每次递归的返回值是什么进而确定递归函数的返…

【Redis】基础数据结构-skiplist跳跃表

有序集合Sorted Set zadd zadd用于向集合中添加元素并且可以设置分值,比如添加三门编程语言,分值分别为1、2、3: 127.0.0.1:6379> zadd language 1 java (integer) 1 127.0.0.1:6379> zadd language 2 c (integer) 1 127.0.0.1:6379…

【Java-LangChain:使用 ChatGPT API 搭建系统-2】语言模型,提问范式与 Token

第二章 语言模型,提问范式与 Token 在本章中,我们将和您分享大型语言模型(LLM)的工作原理、训练方式以及分词器(tokenizer)等细节对 LLM 输出的影响。我们还将介绍 LLM 的提问范式(chat format…

【图像处理】使用各向异性滤波器和分割图像处理从MRI图像检测脑肿瘤(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

实验3.2 分期付款计算器

目录 实验目的‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬ 实验内容‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬…

20231005使用ffmpeg旋转MP4视频

20231005使用ffmpeg旋转MP4视频 2023/10/5 12:21 百度搜搜:ffmpeg 旋转90度 https://zhuanlan.zhihu.com/p/637790915 【FFmpeg实战】FFMPEG常用命令行 https://blog.csdn.net/weixin_37515325/article/details/127817057 FFMPEG常用命令行 5.视频旋转 顺时针旋转…

python爬虫基于管道持久化存储操作

文章目录 基于管道持久化存储操作scrapy的使用步骤1.先转到想创建工程的目录下:cd ...2.创建一个工程3.创建之后要转到工程目录下4.在spiders子目录中创建一个爬虫文件5.执行工程setting文件中的参数 基于管道持久化存储的步骤:持久化存储1:保…

集合(容器)-List接口及实现类

容器的特征:①数据长度可变;②数据保存方式不同。 集合体系概述:JAVA的集合框架是由很多接口、抽象类、具体类组成。都位于java.util包中。 Java中集合类中默认可以存储任意数据类型,Java中的集合提供泛型机制,在定义…

李沐深度学习记录3:11模型选择、欠拟合和过拟合

通过多项式拟合探索欠拟合与过拟合 import math import numpy as np import torch from torch import nn from d2l import torch as d2l#生成数据集 max_degree 20 # 多项式的最大阶数 n_train, n_test 100, 100 # 训练和测试数据集大小 true_w np.zeros(max_degree) # …

园林园艺服务经营小程序商城的作用是什么

园林园艺属于高单价服务,同时还有各种衍生服务,对企业来说,多数情况下都是线下生意拓展及合作等,但其实线上也有一定深度,如服务售卖或园艺产品售卖等。 基于线上发展可以增强获客引流、品牌传播、产品销售经营、会员…

很普通的四非生,保研破局经验贴

推免之路 个人情况简介夏令营深圳大学情况机试面试结果 预推免湖南师范大学面试结果 安徽大学面试结果 北京科技大学笔试面试结果 合肥工业大学南京航空航天大学面试结果 暨南大学东北大学 最终结果一些建议写在后面 个人情况简介 教育水平:某中医药院校的医学信息…

STL-stack、queue和priority_queue的模拟实现

目录 一、容器适配器 (一)什么是适配器 (二)stack和queue的底层结构 二、Stack 三、queue 四、deque双端队列 (一)优点 (二)缺陷 五、优先级队列 (一&#xff…

成都建筑模板批发市场在哪?

成都作为中国西南地区的重要城市,建筑业蓬勃发展,建筑模板作为建筑施工的重要材料之一,在成都也有着广泛的需求。如果您正在寻找成都的建筑模板批发市场,广西贵港市能强优品木业有限公司是一家值得关注的供应商。广西贵港市能强优…

华为云云耀云服务器L实例评测|Ubuntu云锁防火墙安装搭建使用

华为云云耀云服务器L实例评测|Ubuntu安装云锁防火墙对抗服务器入侵和网络攻击 1.前言概述 华为云耀云服务器L实例是新一代开箱即用、面向中小企业和开发者打造的全新轻量应用云服务器。多种产品规格,满足您对成本、性能及技术创新的诉求。云耀云服务器L…

基于阴阳对优化的BP神经网络(分类应用) - 附代码

基于阴阳对优化的BP神经网络(分类应用) - 附代码 文章目录 基于阴阳对优化的BP神经网络(分类应用) - 附代码1.鸢尾花iris数据介绍2.数据集整理3.阴阳对优化BP神经网络3.1 BP神经网络参数设置3.2 阴阳对算法应用 4.测试结果&#x…

数据结构与算法--算法

这里写目录标题 线性表顺序表链表插入删除算法 一级目录二级目录二级目录二级目录 一级目录二级目录二级目录二级目录 一级目录二级目录二级目录二级目录 一级目录二级目录二级目录二级目录 线性表 顺序表 链表 插入删除算法 步骤 1.通过循环到达指定位置的前一个位置 2.新建…

VS的调式技巧你真的掌握了吗?

目录 什么是bug? 调式是什么?有多重要? 调试是什么? 调试的基本步骤 debug和release的介绍 windows环境调试介绍 1.调试环境的准备 2.学会快捷键 F11 VS F10 F9 & F5 3.调试时查看程序当前信息 查看临时变量的值 查看内存信…

【物联网】STM32的中断机制不清楚?看这篇文章就足够了

在嵌入式系统中,中断是一种重要的机制,用于处理来自外部设备的异步事件。STM32系列微控制器提供了强大的中断控制器,可以方便地处理各种外部中断和内部中断。本文将详细介绍STM32中断的结构和使用方法。 文章目录 1. 什么叫中断2. 中断优先级…

<学习笔记>从零开始自学Python-之-常用库篇(十二)Matplotlib

Matplotlib 是Python中类似 MATLAB的绘图工具,Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建2D图表和一些基本的3D图表,可根据数据集(DataFrame,Series)自行定义x,y轴,绘制图…

IntelliJ IDEA配置Cplex12.6.3详细步骤

Cplex12.6.3版IntelliJ IDEA配置详细步骤 一、Cplex12.6.3版下载地址二、Cplex安装步骤三、IDEA配置CPLEX3.1 添加CPLEX安装目录的cplex.jar包到项目文件中3.2 将CPLEX的x64_win64文件夹添加到IDEA的VM options中 四、检查IDEA中Cplex是否安装成功卸载Cplex 一、Cplex12.6.3版下…