对Python进行数据分析_关于Package的安装问题

yipeiwu_com5年前Python基础

一、为什么要使用Python进行数据分析?

python拥有一个巨大的活跃的科学计算社区,拥有不断改良的库,能够轻松的集成C,C++,Fortran代码(Cython项目),可以同时用于研究和原型的构建以及生产系统的构建。

二、Python的优势与劣势:

1.Python是一种解释型语言,运行速度比编译型数据慢。

2.由于python有一个全局解释器锁(GIL),防止解释器同时执行多条python字节码,所以python不适用于高并发、多线程的应用程序。

三、使用Python进行数据分析常用的扩展包。

目前初始阶段的学习主要涉及4个包的安装:numpy、scipy、pandas、matplotlib

我笔记本里安装的是Python2.7版本,在安装了pip和setuptools工具,关于pip和setuptools工具的安装详见相关笔记。

最初使用的安装命令很简单:

pip install pandas
pip install numpy
pip install scipy
pip install matplotlib

但是只安装成功了numpy和matplotlib两个包,pandas和scipy安装失败,查阅了相关资料发现可能是版本问题或者包的依赖相关。

最终在stack overflow发现了一个很棒的Python包提供网址:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy

--这里要Mark一下,后边争取写一个爬虫,搞下来所有的包防止丢失。

以上网址是加州大学欧文分校提供的Python相关库的下载地址,修改#后边的名字可以进去其他包的下载页面,此页面中提供了安装某个包需要依赖的前置包的说明,非常友好。

依赖包说明类似:

Pandas, a cross-section and time series data analysis toolkit.
Requires numpy, dateutil, pytz, setuptools, and optionally numexpr, bottleneck, scipy, matplotlib, pytables, lxml, xarray, blosc, backports.lzma, statsmodels, sqlalchemy and other dependencies.

然后就是一堆的pandas下载地址。

最终根据各个包的相关性先安装了numpy+mkl的whl文件,然后是安装scipy最后是pandas。

安装的方法如下:

1.下载对应的4个包放在D:\目录下(很奇怪我笔记本是AMD64位的但是安装amd64版本的包报不支持的platform的错误,安装了32位的可以正常import)

2.cmd命令行进入D:\目录执行:pip install <包的全名>进行安装。(如果已安装了其他错误的版本,使用pip uninstall卸载)

最后使用如下类似命令查看包的安装位置:

 

以上这篇对Python进行数据分析_关于Package的安装问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持【听图阁-专注于Python设计】。

相关文章

Django 表单模型选择框如何使用分组

Django 表单模型选择框如何使用分组

起步 Django 表单中有两种字段类型可以使用选择框: ChoiceField 和 ModelChoiceField 。 对于 ChoiceField 的基本使用是: class...

Python3实现的判断环形链表算法示例

本文实例讲述了Python3实现的判断环形链表算法。分享给大家供大家参考,具体如下: 给定一个链表,判断链表中是否有环。 方案一:快慢指针遍历,若出现相等的情况,说明有环 # Def...

PyCharm代码整体缩进,反向缩进的方法

如下所示: 整体缩进:鼠标拉选住代码块,按下tab键。 反向缩进:鼠标拉选住代码块,按下tab+shift键。 以上这篇PyCharm代码整体缩进,反向缩进的方法就是小编分享给大家的全部...

Python实现去除列表中重复元素的方法总结【7种方法】

这里首先给出来我很早之前写的一篇博客,Python实现去除列表中重复元素的方法小结【4种方法】,感兴趣的话可以去看看,今天是在实践过程中又积累了一些方法,这里一并总结放在这里。 由于内容...

python3实现在二叉树中找出和为某一值的所有路径(推荐)

python3实现在二叉树中找出和为某一值的所有路径(推荐)

请写一个程序创建一棵二叉树,并按照一定规则,输出二叉树根节点到叶子节点的路径。 规则如下: 1、从最顶端的根结点,到最下面的叶子节点,计算路径通过的所有节点的和,如果与设置的某一值的相同...