选择python进行数据分析的理由和优势

yipeiwu_com5年前Python基础

1、python大量的库为数据分析提供了完整的工具集

2、比起MATLAB、R语言等其他主要用于数据分析语言,python语言功能更加健全

3、python库一直在增加,算法的实现采取的方法更加创新

4、python能很方便的对接其他语言,比如c、java等

什么是IPython?

IPython是一个python的交互式的shell (它默认的python shell要好用的多、强大的多)

1、支持代码的自动补全、自动缩进,已经支持bash shell

2、Jupyter NoteBook(以前称为IPython NoteBook),它提供了一个用户和IPython内核交互的一个界面,同时它又是一个交互式的笔记本(可以保存你的源代码、运行结果),集文本(markdown)、代码、图像、公式与一体的python的web界面

3、支持交互式数据可视化与其他图形用户界面

4、支持高性能的并行计算

运行环境

数据分析以及机器学习都有许许多多的程序库,这些程序库(比如:numpy、pandas、sckilearn、TensorFlow等),如果我们单独去配置安装比较麻烦,而且有的程序包(如:scipy)依赖的库比较多;官方提供了一个集成的数据分析、机器学习的开发工具,即anaconda安装:官网下载最新版,windows下安装就行

打开:

方式一、用命令

用cmd命令行或者linux终端嵌入命令:jupyter notebook将会运行起来两个程序:IPython的服务程序和jupyter notebook的web界面,然后代码就可以在界面中写

注意】IPython服务端是程序运行的地方,jupyter notebook仅仅提供了一个交互界面,如果你把IPython的服务程序关掉(终端中ctrl+c)jupyter notebook就没什么用了

几个基本操作:

双击D:删除当前的cell

单击M:将当前cell转成markdown文档

jupyter构造:由一个个的cell构成,每个cell的执行时互不影响的,但是数据是共享的

方式二、用anaconda界面打开

方式三、用pycharm打开

【注意】编译器一定要选择anaconda目录下的python编译器,不然无法打开IPython的服务程序

相关文章

使用pandas实现连续数据的离散化处理方式(分箱操作)

Python实现连续数据的离散化处理主要基于两个函数,pandas.cut和pandas.qcut,前者根据指定分界点对连续数据进行分箱处理,后者则可以根据指定箱子的数量对连续数据进行等...

Python numpy中矩阵的基本用法汇总

Python numpy中矩阵的基本用法汇总

Python矩阵的基本用法 mat()函数将目标数据的类型转化成矩阵(matrix) 1,mat()函数和array()函数的区别 Numpy函数库中存在两种不同的数据类型(矩阵ma...

老生常谈python之鸭子类和多态

一、 什么是多态 <1>一种类型具有多种类型的能力 <2>允许不同的对象对同一消息做出灵活的反应 <3>以一种通用的方式对待个使用的对象 <4&...

详解Python Qt的窗体开发的基本操作

详解Python Qt的窗体开发的基本操作

本文章采用的是Qt4,是python(x,y) 套件中集成的,为啥不集成Qt5呢,懒得装啊:) 正文: 首先看成品: 这个程序的功能是输入原价和降价的百分比,计算出最后的价格。 设计器...

pytorch自定义二值化网络层方式

任务要求: 自定义一个层主要是定义该层的实现函数,只需要重载Function的forward和backward函数即可,如下: import torch from torch.aut...