在Python中,pandas库(简称pd)用于数据处理和分析,支持数据结构如DataFrame和Series。
创新互联公司执着的坚持网站建设,小程序设计;我们不会转行,已经持续稳定运营十余年。专业的技术,丰富的成功经验和创作思维,提供一站式互联网解决方案,以客户的口碑塑造品牌,携手广大客户,共同发展进步。
Python中的pandas(简称pd)是一个功能强大的数据处理库,它提供了大量用于数据清洗、转换、分析和可视化的方法,本文将详细介绍pd的基本用法,包括数据结构、数据读取、数据筛选、数据统计和数据可视化等方面的内容。
1、DataFrame
DataFrame是pd中最常用的数据结构,它是一个二维表格型数据结构,类似于Excel表格或SQL表,DataFrame可以存储多种类型的数据,如数值、字符串等,并且具有很多方便的数据操作方法。
创建一个DataFrame:
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print(df)
2、Series
Series是pd中的另一种数据结构,它是一个一维数组,类似于NumPy的数组,Series可以存储单一类型的数据,如数值或字符串。
创建一个Series:
import pandas as pd data = [1, 2, 3, 4, 5] s = pd.Series(data) print(s)
1、读取CSV文件
使用pd.read_csv()方法可以读取CSV文件,并将其转换为DataFrame。
import pandas as pd df = pd.read_csv('file.csv') print(df)
2、读取Excel文件
使用pd.read_excel()方法可以读取Excel文件,并将其转换为DataFrame。
import pandas as pd df = pd.read_excel('file.xlsx') print(df)
3、读取SQL数据库
使用pd.read_sql()方法可以读取SQL数据库中的数据,并将其转换为DataFrame。
import pandas as pd import sqlite3 conn = sqlite3.connect('database.db') query = 'SELECT * FROM table_name' df = pd.read_sql(query, conn) print(df)
1、选择某一列
使用df[‘column_name’]可以选择DataFrame中的某一列。
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print(df['A'])
2、选择多列
使用df[[‘column1’, ‘column2’]]可以选择DataFrame中的多列。
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print(df[['A', 'C']])
3、根据条件筛选数据
使用df[df[‘column_name’] > value]可以根据条件筛选数据。
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print(df[df['A'] > 1])
1、计算平均值
使用df[‘column_name’].mean()可以计算某一列的平均值。
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print(df['A'].mean())
2、计算总和
使用df[‘column_name’].sum()可以计算某一列的总和。
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print(df['A'].sum())
3、计算唯一值个数
使用df[‘column_name’].nunique()可以计算某一列的唯一值个数。
import pandas as pd data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) print(df['A'].nunique())
1、绘制折线图
使用df.plot()可以绘制DataFrame的折线图。
import pandas as pd import matplotlib.pyplot as plt data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) df.plot() plt.show()
2、绘制柱状图
使用df[‘column_name’].plot(kind=’bar’)可以绘制某一列的柱状图。
import pandas as pd import matplotlib.pyplot as plt data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]} df = pd.DataFrame(data) df['A'].plot(kind='bar') plt.show()
相关问题与解答:
1、如何在Python中使用pd读取CSV文件?
答:使用pd.read_csv()方法可以读取CSV文件,并将其转换为DataFrame。df = pd.read_csv('file.csv')
。
2、如何根据条件筛选DataFrame中的数据?
答:使用df[df[‘column_name’] > value]可以根据条件筛选数据。df[df['A'] > 1]
。
3、如何使用pd计算某一列的平均值?
答:使用df[‘column_name’].mean()可以计算某一列的平均值。df['A'].mean()
。
4、如何使用pd绘制DataFrame的折线图?
答:使用df.plot()可以绘制DataFrame的折线图。df.plot()
。
网站栏目:python中pd的用法
文章位置:http://www.shufengxianlan.com/qtweb/news1/401151.html
网站建设、网络推广公司-创新互联,是专注品牌与效果的网站制作,网络营销seo公司;服务项目有等
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联