Pandas安装简单使用
的有关信息介绍如下:Pandas是一个开源Python库,使用其强大的数据结构提供高性能数据操作和分析工具。Pandas这个名字源自Panel Data - 来自多维数据的计量经济学。
2008年,开发人员Wes McKinney在需要高性能,灵活的数据分析工具时开始开发大熊猫。
在Pandas之前,Python主要用于数据整理和准备。它对数据分析的贡献很小。熊猫解决了这个问题。使用Pandas,我们可以完成数据处理和分析中的五个典型步骤,无论数据来源如何 - 加载,准备,操作,建模和分析。
Pandas用于广泛的领域,包括学术和商业领域,包括金融,经济,统计,分析等。
pandas的安装
可以直接pip安装它:
pip install pandas
安装成功后,可以直接import导入直接使用
pandas处理三个数据结构 -系列(Series) 数据帧(DataFrame) 面板(Panel)
pandas创建DataFrame ,
创建一个空的dataframe
import pandas as pd
df = pd.DataFrame()
print df
使用单个列表或列表列表创建DataFrame。
# -*- coding: UTF-8 -*import pandas as pddata = [1,2,3,4,5]df = pd.DataFrame(data)print df
输出结果如图二所示
Lists的Dict创建一个DataFrame
import pandas as pddata = {'user1':['Tom'],'user2':['Cindy']}df = pd.DataFrame(data)print df
index参数为每一行分配一个索引字典的键
从Dicts列表创建一个DataFrame
import pandas as pddata = [{'key1': 1, 'key2': 2},{'name1':'zhangsan','name2':'lixi'}]df = pd.DataFrame(data)print df
输出:
key1 key2 name1 name2
0 1.0 2.0 NaN NaN
1 NaN NaN zhangsan lixi
从Dict of Series创建一个DataFrame
import pandas as pdd = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}df = pd.DataFrame(d)print df
输出
one two
a 1.0 1
b 2.0 2
c 3.0 3
d NaN 4