在MAC上搭建python数据分析开发环境

yipeiwu_com6年前Python基础

最近工作转型到数据开发领域,想在本地搭建一个数据开发环境。自己有三年python开发经验,马上想到使用numpy、scipy、sklearn、pandas搭建一套数据开发环境。

ubuntu的环境,百度中文章比较多,搭建起来非常顺利。MAC环境的资料比较少,百度出来的,已经不对了,那我就来补充一篇吧。

MAC自带python,python的安装我就不多说了。

安装pip

我喜欢用pip安装python库,非常方便,pip的安装只能用源码了。

#下载源代码
https://pypi.python.org/pypi/pip 我去下载的时候是 8.0.2版本
#解压
tar xvzf pip8.0.2.tar.gz

#安装
cd pip-1.4.1
python setup.py install

安装numpy

numpy是基础,是scipy等其它库等基础,没什么依赖,安装起来相对简单。

pip install numpy

安装brew

numpy安装之后,就是安装scipy了,为什么插了一竿子呢?它依赖fortran库,fortran库的安装需要用到MAC的包管理工具homebrew

#下载brew
curl -LsSf http://github.com/mxcl/homebrew/tarball/master 
sudo tar xvz -C/usr/local --strip 1

安装scipy

scipy 是sklearn的基础,但它依赖gfortran库,gfortran已经融入到gcc库中,安装gcc就好了,有了brew安装什么包都变得非常简单了。

#安装gcc库
brew install gcc

#安装scipy
pip install scipy
后面的安装,就按步就班了

#安装matplotlib,方便把数据绘图显示出来
pip install matplotlib

#安装sklearn,我理解这个安装必须在pandas之前
pip install -U numpy scipy scikit-learn

#安装pandas
pip install pandas

到这里环境就搭建好了,开搞吧,其实搭起来也非常简单。提醒下,安装时注意权限,如果需要权限就在前面加个sudo。

相关文章

处理python中多线程与多进程中的数据共享问题

之前在写多线程与多进程的时候,因为一般情况下都是各自完成各自的任务,各个子线程或者各个子进程之前并没有太多的联系,如果需要通信的话我会使用队列或者数据库来完成,但是最近我在写一些多线程与...

浅谈python字典多键值及重复键值的使用

浅谈python字典多键值及重复键值的使用

在python中使用字典,格式如下: dict={ key1:value1 , key2;value2 ...} 在实际访问字典值时的使用格式如下: dict[key] 多键值 字典的...

python读取txt文件并取其某一列数据的示例

菜鸟笔记 首先读取的txt文件如下: AAAAF110 0003E818 0003E1FC 0003E770 0003FFFC 90 AAAAF110 0003E824 0003E2...

Python中创建二维数组

Python中创建二维数组

二维数组 二维数组本质上是以数组作为数组元素的数组,即“数组的数组”,类型说明符 数组名[常量表达式][常量表达式]。二维数组又称为矩阵,行列数相等的矩阵称为方阵。对称矩阵a[i][j]...

Python中使用SAX解析xml实例

SAX是一种基于事件驱动的API。利用SAX解析XML文档牵涉到两个部分:解析器和事件处理器。解析器负责读取XML文档,并向事件处理器发送事件,如元素开始跟元素结束事件;而事件处理器则负...