数据挖掘知识

免费体验
当前位置: 首页 > 知识库 > 数据挖掘知识 >

Python基础知识汇总

分享到:
时间:2018-02-09 19:18来源: 作者:
中国统计网(www.itongji.cn),是由大数据资深从业人员创办的大数据门户网站

1.Anaconda的安装


百度Anaconda的官网,下载左边的Python3.X版本



然后是设置路径,最后给出Jupyter notebook。具体参考:


猴子:初学python者自学anaconda的正确姿势是什么??


不过平时练习的时候我个人习惯用Enthought Canopy,但比起Anaconda有些中文字符的编写不兼容。下载链接如下:Canopy | Scientific Python Packages & Analysis Environment | Enthought


2.Python的四个关键点


2.1数据


python常用数据类型有5类:


(1) 字符串(String)


在python中字符串用“”或者‘’分隔



(2) 数字类型:整数 ,浮点数



(3) 容器 :列表、集合、字典、元祖


① 列表(List):列表是可变的,方便增加、修改和删减数据。列表有许多方便的函数,例如:



在函数中使用列表时为防止循环的同时使列表发生改变,可以使用


L1=L[:]


从而复制列表,保持原列表L不变。


② 元组(Tuple):元祖是不可变的,使用(),只有一个元素的元祖要加逗号:


(9,)


③ 集合(Sets):中学的知识里我们知道,youtube推广,集合的三个特性是:无序性,互异性,确定性。即集合中不会存在重复元素,在python中用{}表示集合。集合也有很多相关函数:

创建空集:



交集并集与做差:



判断子集:



清空:



删除元素:



替换:



增加元素:



④ 字典(Dictionary):字典最大的特征是键值对应。键值对用冒号(:)分割,整个字典用{}隔开。字典是一个很好用的工具,我们可以通过字典利用增加内存来降低算法的复杂度。



(4) 布尔值 :True、False(注意大小写)


(5) None


2.2条件判断


if语句可以通过判断条件是否成立来决定是否执行某个语句



if-else语句就是在原有的if成立执行操作的基础上,当不成立的时候,也执行另一种操作



if-elif-else语句例子:



2.3循环


循环有for循环while循环两种,我们常用的是for循环


while True:


可以用来开启循环。


来看一个用循环输出字典中存储的数据的例子:



continue用于跳出当前循环(继续执行接下来的循环),break用于退出整个循环(接下来的循环不再执行)



2.4函数


函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。我们使用def语句来定义函数。



这个函数是使用递归计算x的n次方。


Python的作用域一共有2种:全局作用域,局部作用域。定义在函数内部的变量拥有一个局部作用域,定义在函数外的拥有全局作用域。 局部变量只能在其被声明的函数内部访问,而全局变量可以在整个程序范围内访问。


3.模块和包


模块是扩展名为.py的文件,包含所有你定义的函数和变量的文件。模块可以被别的程序引入,以使用该模块中的函数等功能。


导入模块常用的导入方法是写一条import语句并在其中指定模块名,或者使用from...import...as...就可以程序中使用该模块中的所有函数。


下面是一些最常用的模块:


import osimport collections import Iterable   #可迭代对象from PIL import Image   #图像处理import numpy as np   #Numpy库import math          #math模块import pandas as pd  #pandas库


4.数据结构


4.1栈


栈是先入后出,后入先出的。新来的数据加在栈的最前面。



4.2队列


不同于栈,队列是先入先出的,新来的数据加到队列最后。



4.3计数器


计数器用于追踪值的出现次数



4.4排序字典


排序字典能够按照字典中插入key的顺序,对字典进行排序。对字典里的数据进行迭代,按插入的顺序访问key值,利用collections中的OrderedDict



5.一些需要注意的地方


学习代码最重要的是多加练习,这里给出几个非常不错的学习网站。


菜鸟教程python基础训练100题:


廖雪峰python入门:


MIT计算机科学和Python编程导论:


End.

(整理:英文推广TuiGuang123.com)
分享到:
------分隔线----------------------------

联系信息

 

 地址:深圳南山保利广场B区二层51#

 手机:18123763721,400-879-3881

 微信:18123763721

 联络:费先生、雁狸

 办公:9:00~22:00

 网址:http://www.tuiguang123.com

银行账户

 

银行:招商银行深圳水榭花都支行

户名:深圳市亿推信息技术有限公司

帐号:7559 2777 4410 601

重点方案

 

国外媒体发稿

社交媒体KOL

区块链海外推

英文外链推广

跨境电商特惠

微信咨询

 

COPYRIGHT·深圳市亿推信息技术有限公司 版权所有 粤ICP备17150804号-2