您的位置首页生活百科

Pandas安装简单使用

Pandas安装简单使用

的有关信息介绍如下:

Pandas安装简单使用

Pandas是一个开源Python库,使用其强大的数据结构提供高性能数据操作和分析工具。Pandas这个名字源自Panel Data - 来自多维数据的计量经济学。

2008年,开发人员Wes McKinney在需要高性能,灵活的数据分析工具时开始开发大熊猫。

在Pandas之前,Python主要用于数据整理和准备。它对数据分析的贡献很小。熊猫解决了这个问题。使用Pandas,我们可以完成数据处理和分析中的五个典型步骤,无论数据来源如何 - 加载,准备,操作,建模和分析。

Pandas用于广泛的领域,包括学术和商业领域,包括金融,经济,统计,分析等。

pandas的安装

可以直接pip安装它:

pip install pandas

安装成功后,可以直接import导入直接使用

pandas处理三个数据结构 -系列(Series) 数据帧(DataFrame) 面板(Panel)

pandas创建DataFrame ,

创建一个空的dataframe

import pandas as pd

df = pd.DataFrame()

print df

使用单个列表或列表列表创建DataFrame。

# -*- coding: UTF-8 -*import pandas as pddata = [1,2,3,4,5]df = pd.DataFrame(data)print df

输出结果如图二所示

Lists的Dict创建一个DataFrame

import pandas as pddata = {'user1':['Tom'],'user2':['Cindy']}df = pd.DataFrame(data)print df

index参数为每一行分配一个索引字典的键

从Dicts列表创建一个DataFrame

import pandas as pddata = [{'key1': 1, 'key2': 2},{'name1':'zhangsan','name2':'lixi'}]df = pd.DataFrame(data)print df

输出:

key1 key2 name1 name2

0 1.0 2.0 NaN NaN

1 NaN NaN zhangsan lixi

从Dict of Series创建一个DataFrame

import pandas as pdd = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']), 'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}df = pd.DataFrame(d)print df

输出

one two

a 1.0 1

b 2.0 2

c 3.0 3

d NaN 4