数据处理与统计分析篇-day03-python数据分析介绍与环境搭建

概述

python优势

Python作为当下最为流行的编程语言之一

  1. 可以独立完成数据分析的各种任务

  2. 数据分析领域里有海量开源库

  3. 机器学习/深度学习领域最热门的编程语言

  4. 在爬虫,Web开发等领域均有应用

常用开源库

numpy

NumPy(NumericalPython) 是 Python 语言的一个扩展程序库。是一个运行速度非常快的数学库,主要用于数组计算

包含:

  1. 一个强大的N维数组对象 ndarray

  2. 广播功能函数

  3. 整合 C/C++/Fortran 代码的工具

  4. 线性代数、傅里叶变换、随机数生成等功能

pandas

Pandas是一个强大的分析结构化数据的工具集, 它的使用基础是Numpy(提供高性能的矩阵运算), 用于数据挖掘和数据分析,同时也提供数据清洗功能

  1. Pandas利器之 Series,是一种类似于一维数组的对象

  2. Pandas利器之 DataFrame,是Pandas中的一个表格型的数据结构

matplotlib

Matplotlib 是一个功能强大的数据可视化开源Python库

  1. Python中使用最多的图形绘图库

  2. 可以创建静态, 动态和交互式的图表

seaborn

Seaborn是一个Python数据可视化开源库

  1. 建立在matplotlib之上,并集成了pandas的数据结构

  2. Seaborn通过更简洁的API来绘制信息更丰富,更具吸引力的图像

  3. 面向数据集的API,与Pandas配合使用起来比直接使用Matplotlib更方便

Anaconda

前面笔记中有安装过程

Anaconda简介

Anaconda 是最流行的数据分析平台,全球两千多万人在使用

  1. Anaconda 附带了一大批常用数据科学包

  2. Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的

  3. 可以帮助你在计算机上安装和管理数据分析相关包

  4. 包含了虚拟环境管理工具

Anaconda使用

通过命令行创建虚拟环境

conda env list # 显示所有沙箱(虚拟环境)

conda create -n 虚拟环境名字 python=python版本 #创建虚拟环境

conda activate 虚拟环境名字 #进入虚拟环境

conda deactivate 虚拟环境名字 #退出虚拟环境

conda remove -n 虚拟环境名字 --all #删除虚拟环境

Jupyter Notebook使用

启动

通过终端启动 Jupyter Notebook

conda activate 虚拟环境名字

jupyter notebook

基本使用

快捷键

命令模式,按ESC进入
  1. Y,cell切换到Code模式

  2. M,cell切换到Markdown模式

  3. A,在当前cell的上面添加cell

  4. B,在当前cell的下面添加cell

  5. 双击D:删除当前cell

编辑模式,按Enter进入
  1. 多光标操作:Ctrl键点击鼠标(Mac:CMD+点击鼠标)回退:Ctrl+Z(Mac:CMD+Z)

  2. 重做:Ctrl+Y(Mac:CMD+Y)

  3. 补全代码:变量、方法后跟Tab键

  4. 为一行或多行代码添加/取消注释:Ctrl+/(Mac:CMD+/)

两种模式通用快捷键

Shift+Enter,执行本单元代码,并跳转到下一单元

Ctrl+Enter,执行本单元代码,留在本单元

cell行号前的 * ,表示代码正在运行

掌握Markdown标题和缩进

pycharm连接jupyter

连接本地

开启本地jupyter notebook服务

新建pycharm项目, 在新项目下新建jupyter文件.

建好后设置

设置连接应用后, 提示输入密码或者token, 在命令行中粘贴token

测试执行, 输出路径为本地则连接成功

连接虚拟机

连接虚拟机的方式与上述步骤一致, 只需要将步骤3中的地址换为虚拟机的即可

pycharm连接远程环境

添加SSH

删除远程环境

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1542892.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

#面试系列-腾讯后端一面

03.腾讯后端一面 项目相关 面试官可能是 Go 方向的,我面试的是 Java 方向的,所以面试官也没有问我简历上的项目,主要问了实验室中做的项目,哪个项目比较有技术挑战? 面试主要问了计算级网络相关,以及如果让…

通信工程学习:什么是TLS传输层安全协议

TLS:传输层安全协议 TLS(Transport Layer Security)传输层安全协议是一种用于在两个通信应用程序之间提供保密性、数据完整性以及真实性的安全协议。它是SSL(Secure Sockets Layer)协议的后继者,继承并增强…

数据结构与算法——Java实现 8.习题——移除链表元素(值)

祝福你有前路坦途的好运,更祝愿你能保持内心光亮 纵有风雨,依然选择勇敢前行 —— 24.9.22 203. 移除链表元素 给你一个链表的头节点 head 和一个整数 val ,请你删除链表中所有满足 Node.val val 的节点,并返回 新的头节点 。 示…

黎巴嫩BP机爆炸事件启示录:我国应加快供应链安全立法

据报道,当地时间9月17日下午,黎巴嫩首都贝鲁特以及黎巴嫩东南部和东北部多地都发生了BP机爆炸事件。当时的统计数据显示,爆炸造成9人死亡,约2800人受伤。9月18日,死亡人数上升到11人,受伤人数超过4000。 目…

计算机毕业设计 基于 Hadoop平台的岗位推荐系统 SpringBoot+Vue 前后端分离 附源码 讲解 文档

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点…

知乎:从零开始做自动驾驶定位; 注释详解(二)

这个个系统整体分为: 数据预处理 前端里程计 后端优化 回环检测 显示模块。首先来看一下数据预处理节点做的所有事情: 数据预处理节点 根据知乎文章以及代码我们知道: 节点功能输入输出数据预处理1.接收各传感器信息2.传感器数据时间同步 3.点云运动畸变补偿 4.传…

c++类与对象一

C类与对象(一) 面向对象初步认识 在c语言中,编程是面向过程编程,注重求解问题列出过程,然后调用函数求解问题。 在日常生活中。我们经常会遇到面向过程的问题 手洗衣服就是面向过程 而C是基于面向对象的。关注的是对象,把事情…

html实现TAB选项卡切换

<!DOCTYPE html> <html> <head> <title>选项卡示例</title> <style> .tabs { overflow: hidden; /* 防止选项卡溢出容器 */ border: 1px solid #ccc; background-color: #f1f1f1; } .tab-links { margin: 0; padding: 0; l…

DataX-Web项目的Windows环境部署及基本使用

一,datax-web是什么? DataX Web 是一个在 DataX 基础上开发的分布式数据同步工具,它提供了一个简单易用的操作界面,旨在降低用户使用 DataX 的学习成本,缩短任务配置时间,并减少配置过程中的错误。DataX Web 支持多种数据源,包括 RDBMS、Hive、HBase、ClickHouse、Mongo…

yarn : 无法加载文件 C:\Users\Rog\AppData\Roaming\npm\yarn.ps1,因为在此系统上禁止运行脚本

yarn : 无法加载文件 C:\Users\Rog\AppData\Roaming\npm\yarn.ps1&#xff0c;因为在此系统上禁止运行脚本 设置命令行窗口默认以管理员身份运行&#xff0c;在此基础上输入以下代码&#xff0c;应该就好使了&#xff0c;切记&#xff0c;以下代码才是关键&#xff0c;我基本上…

<刷题笔记> 力扣236题——二叉树的公共祖先

236. 二叉树的最近公共祖先 - 力扣&#xff08;LeetCode&#xff09; 题目解释&#xff1a; 我们以这棵树为例&#xff0c;来观察找不同的最近公共祖先有何特点&#xff1a; 思路一&#xff1a; 除了第二种情况&#xff0c;最近公共祖先满足&#xff1a;一个节点在他的左边&am…

犀牛数据爬虫逆向分析

目标网站 aHR0cHM6Ly93d3cueGluaXVkYXRhLmNvbS9pbmR1c3RyeS9uZXdlc3Q/ZnJvbT1kYXRh 一、抓包分析 请求参数和响应数据都有加密 二、逆向分析 1、请求参数 请求参数生成位置 数据解密涉及到一个异步栈 解密后的数据形式 剩下的就是扣取代码了&#xff0c;很简单&#xff0c;…

Class path contains multiple SLF4J bindings.

最近由于要改kafka成datahub&#xff0c;于是在pom文件上引入了 <dependency><groupId>com.aliyun.datahub</groupId><artifactId>aliyun-sdk-datahub</artifactId><version>2.25.1</version> </dependency> 然后让我去测试…

Linux 进程间通信(管道)

目录 一.理解进程间通信 1.进程间通信的意义 2.进程间如何实现通信呢&#xff1f; 二.匿名管道 1.匿名管道的底层原理 引用计数的应用 2.匿名管道代码实现 a.代码的整体框架 b.写接口 c.读接口 d.子进程资源回收 3.匿名管道的官方接口 4.*匿名管道四种情况和五种特…

【算法业务】互联网风控业务中的续贷审批模型(融合还款意愿分层的逾期风险识别模型)

1、背景说明 本文旨在提出一种针对风控催收受限情况下&#xff0c;如何提升风控审批模型的风险识别能力&#xff0c;以缓解贷后催收的压力&#xff0c;降低贷款资金坏账的风险。这篇工作依然是很早期的项目&#xff0c;分享的目的一方面做笔记&#xff0c;另一方面则是希望其中…

多类别物体检测系统源码分享

多类别物体检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer V…

YOLO航拍车辆和行人识别

YOLO航拍车辆和行人识别 图片数量9695&#xff0c;标注为xml和txt格式&#xff1b; class&#xff1a;car&#xff0c;pedestrian&#xff0c;truck&#xff0c;bus 用于yolo&#xff0c;Python&#xff0c;目标检测&#xff0c;机器学习&#xff0c;人工智能&#xff0c;深度学…

LeetCode 热题 100 回顾18

干货分享&#xff0c;感谢您的阅读&#xff01;原文见&#xff1a;LeetCode 热题 100 回顾_力code热题100-CSDN博客 一、哈希部分 1.两数之和 &#xff08;简单&#xff09; 题目描述 给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标…

洛谷P5740——结构体运用

简单的结构体&#xff0c;但是要注意这个排序还有求和重复 时的特判 AC代码附在后面 #include<bits/stdc.h> using namespace std; struct Node{string name;int a,b,c,sum;//语文&#xff0c;数学&#xff0c;英语 }node[1000]; bool cmp(Node a,Node b){return a.sum…

三端全隔离压接端子485中继器磁耦隔离数据双向透传工业级2口信号放大器抗干扰防雷

美思联压接端子485中继器磁耦隔离工业级2口信号放大器抗干扰防雷https://item.taobao.com/item.htm?ftt&id736247434823 MS-H312S是一款专为工业自动化通信而生解决RS-485总线星型结构组网&#xff0c;解决复杂电磁场环境下RS-485大系统要求而设计的RS-485总线分割集线器(…