FakeOrange
预计阅读时间:1分钟19秒

数据分析1.1 —— 环境配置与简介

小白友好Python数据分析全攻略1.1

0
0

环境安装与简介

首先下载必备软件与环境。 这里早先不推荐使用普通Python编辑器,若使用付费版本Pycharm 可以兼容Jupyter请自选。由于在数据分析中很重要的一环是数据可视化,所以以个人经验而言,能快速的得到每一行代码的逻辑反馈也是进行高效学习的重要一环。


软件Anaconda

社区版为免费安装使用,请尽量使用正版以免不必要麻烦,下载地址: Anaconda,链接地址:https://www.anaconda.com/download/success(具体地址,超链接已插入。)Mac版与Windows版在其中都有涵盖,请不同平台的用户自选。


安装中地址可随意,其他使用默认选项即可。


Pip 环境管理工具说明及注意事项

在数据分析的编程中请理解Python为工具使用的操作台,我们会使用Python去操作很多的工具,通常称作为“调包” (package) 。其中pip为一个不同“包”的管理系统,用于安装和卸载,统称环境管理工具。pip install xxxxx是一个常用指令,其中pip为一个不同“包”的管理系统。


如果使用anaconda可在Jupyter Notebook的cell中直接运行pip指令或在主界面使用管理工具,如:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/60e2ae77-3bd4-4b90-ab5d-67b31ea1a013image.png

data/78df2c1f-e442-415d-a382-fa7925af0c4b/7f74663c-ed0d-4d93-b296-9db62703abdeimage.png

如果使用编辑器如PyCharm请在terminal(控制台)运行,如:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/2101bf48-bf75-43fe-b66a-49ed4e5223daimage.png


pip install xxx 为安装包, pip uninstall xxx 为卸载,pip ls 为罗列所有已安装的包,pip freeeze > requirements.txt 为在当前文件夹生成当前已安装的所有包集合,生成文件名为 requirements.txt,后期迁移使用 pip install -r requirements.txt 一键安装。


常用“包”

对于数据分析的探索阶段我们常用的几种包有, pandas,numpy,matplotlib。分别用于,展示读取表格,数字类型的运算,与图表数据的可视化。

例如:

data/78df2c1f-e442-415d-a382-fa7925af0c4b/1293bc46-6ccc-44c2-a104-6dad84751b2dimage.png

data/78df2c1f-e442-415d-a382-fa7925af0c4b/981736bb-e772-4f16-a61f-99eaf876b799image.png


当涉及到具体应用时,我们会使用到机器学习,深度学习等技巧去执行分类,预测或提取文字图像分析。其中常用的“包”为pytorch,scikit-learn,scikit-image,tensorflow等。复杂的内容将会在后面的内容中一一为大家阐述。


在此,我将使用太空泰坦尼克号数据集,以直观的方式带大家学习数据分析与机器学习。


其中不会很详细的涉及到不同机器学习算法的原理,不过我会将材料贴给大家。更多的我是涉及到应用与工业化的技巧。


如果有感兴趣的朋友想要具体了解原理的讲解请给我评论~

评论
Copyright Created by DataER | 沪ICP备2024052789号-5 | 沪公网安备31010402336337号