python读取data数据画图(python读取图像的几种方法)|仙踪小栈

小仙 2023年5月2日07:58:50 发表评论 3

python气象绘图windrose

#导入包

import numpy as np

import pandas as pd

from matplotlib import pyplot as plt

from matplotlib.ticker import FuncFormatter

import matplotlib as mpl

mpl.rcParams[\'font.sans-serif\'] = [\'SimHei\'] #设置简黑字体

mpl.rcParams[\'axes.unicode_minus\'] = False #设置负号正常显示

#----获取数据DataFrames，index*columns。index表示不同值范围，columns表示十六个风向

data = pd.DataFrame(wind_d_max_num_per,

index=[\'15\', \'15~25\', \'25~35\', \'35~45\',\"≥45\"],

columns=\'N NNE NE ENE E ESE SE SSE S SSW SW WSW W WNW NW NNW\'.split())

N = 16 # 风速分布为16个方向

theta = np.linspace(0, 2*np.pi, N, endpoint=False) # 获取16个方向的角度值

width = np.pi / 4 * 0.4 # 绘制扇型的宽度，可以自行调整0.5时是360，充满，有间隔的话小于0.5即可

labels = list(data.columns) # 自定义坐标标签为 N ， NSN， ……# 开始绘图

plt.figure(figsize=(6,6),dpi=600)

ax = plt.subplot(111, projection=\'polar\')

#----自定义颜色

mycolor =[\'cornflowerblue\',\'orange\',\'mediumseagreen\',\'lightcoral\',\'cyan\']

#----循环画风玫瑰图

i=0

for idx in data.index:

print(idx)

# 每一行绘制一个扇形

radii = data.loc[idx] # 每一行数据

if i == 0:

ax.bar(theta, radii, width=width, bottom=0.0, label=idx, tick_label=labels,

color=mycolor[i])

else:

ax.bar(theta, radii, width=width, bottom=np.sum(data.loc[data.index[0:i]]), label=idx, tick_label=labels,

color=mycolor[i])

i=i+1

#此种画法，注意bottom设置，第一个bottom为0，后续bottom需要在前一个基础上增加。

ax.set_xticks(theta)

ax.set_xticklabels(labels,fontdict={\'weight\':\'bold\',\'size\':15,\'color\':\'k\'})

ax.set_theta_zero_location(\'N\') #设置零度方向北

ax.set_theta_direction(-1) # 逆时针方向绘图

#----设置y坐标轴以百分数显示

plt.gca().yaxis.set_major_formatter(FuncFormatter(lambda s, position: \'{:.0f}%\'.format(100*s)))

plt.legend(loc=4, bbox_to_anchor=(0.05, -0.25),fontsize=12) # 将label显示出来，并调整位置

#----保存图片

plt.savefig(\"./windrose1.svg\")

用python对txt数据进行绘图

## 绘制该文件中的数据

## 需要引入pylab库，里面用到的函数和MATLAB里的非常类似

def plotData(X, y):

length = len(y)

pylab.figure(1)

pylab.plot(X, y, \'rx\')

pylab.xlabel(\'Population of City in 10,000s\')

pylab.ylabel(\'Profit in $10,000s\')

pylab.show()#让绘制的图像在屏幕上显示出来

python读取data数据画图(python读取图像的几种方法)

Python气象数据处理与绘图(1)：数据读取

python很多库支持了对nc格式文件的读取，比如NetCDF4，PyNio(PyNio和PyNgl可以看做是NCL的Python版本)以及Xarray等等。

我最初使用PyNio，但是由于NCL到Python的移植并不完全，导致目前远不如直接使用NCL方便，而在接触Xarray库后，发现其功能强大远超NCL(也可能是我NCL太菜的原因)。

安装同其它库一致：

我这里以一套中国逐日最高温度格点资料(CN05.1)为例，其水平精度为0.5°X0.5°。

可以看到，文件的坐标有时间，经度，纬度，变量有日最高温

我们将最高温数据取出

这与Linux系统中的ncl_filedump指令看到的信息是类似的

Xarray在读取坐标信息时，自动将时间坐标读取为了datetime64 格式，这对我们挑选目的时间十分方便。Xarray通常与pandas配合使用。

比如我们想选取1979.06.01-1979.06.20时期数据，我们只需

再比如我们想选取夏季数据时，只需

更多的时间操作同python的datetime函数类似。

当我们想选取特定经纬度范围(高度)的数据时，.loc[]函数同样可以解决。

在这里，我选取了40°N-55°N，115°E-135°E范围的数据

甚至，我们还可以套娃，同时叠加时间和范围的选取

这足够满足常用到的数据索引要求。

对于这类简单排列的.txt文件，可以通过np.load读取，用pandas的.read_csv更为方便

读取txt的同时，对每列赋予了一个列名，通过data.a可以直接按列名调用相应数据。

对于较复杂的.txt文件，仍可通过该函数读取

skiprows=5跳过了前5行的文件头，sep=\'\\s+\'定义了数据间隔为空格，这里用的是正则表达。

pd.read_csv函数有很多的参数，可以处理各种复杂情况下的文本文件读取。

grib文件可通过pygrib库读取

import pygrib

f = pygrib.open(\'xxx.grb\')

如何使用python绘制gwas分析中的曼哈顿图和qq图

曼哈顿图和QQ图是两个在全基因组关联（GWAS）分析里面最常出现的图形，基本上已经是GWAS的标配，几乎在每篇GWAS的文章都会见到，它们的作用和所要传达出来的信息我也在上一篇关于GWAS的博文中做了些说明，在这里我们就只集中在如何用Python和geneview将其有效地展现出来。

首先，准备一些数据来作为例子。

我这里用来展现的数据是2011年丹麦人所做过的一个关于年轻人过度肥胖的GWAS研究——GOYA，数据也是从他们所发表的结果中获得，总共有5,373个样本，其中超重的个体（case）有2,633个，正常的个体（control）是2,740个，从样本量上看还算可以。为了方便使用，我对其做了相关的处理，包括从PED和MAP文件到GEN文件的生成，并重复了一次case-control的关联性分析，计算出了芯片上所研究的各个SNP位点与肥胖相关的显著性程度（即p-value），最后又将结果数据抽取出来做成数据集——放在这里供下载（15.6Mb，csv格式）。

【注】以上内容虽提及到了一些领域内术语和相关文件格式，但若不懂也请不必纠结，因为后续处理都是基于这个最终的数据集来完成的。

接着，需要将geneview软件包加入到你的Python中，有多种不同的方式，但推荐直接使用pip，以下是安装比较稳定的发布版，直接在终端命令行下(Linux or Mac)输入：

pip install geneview

或者，也可以直接从github上安装正在开发的版本：

pip install git+git://github.com/ShujiaHuang/geneview.git#egg=geneview

第三种办法就是直接下载源码，然后自行编译，虽然不推荐这种做法（因为还有依赖包必须自行下载安装，过程会比较麻烦低效），但对于某些不能连接外网的集群也只能如此，这三种方式都是可行的。

曼哈顿图

将示例数据下载下来：

wget

先简单地查看一下数据的格式:

chrID,rsID,position,pvalue

1,rs3094315,742429,0.144586

1,rs3115860,743268,0.230022

1,rs12562034,758311,0.644366

1,rs12124819,766409,0.146269

1,rs4475691,836671,0.458197

1,rs28705211,890368,0.362731

1,rs13303118,908247,0.22912

1,rs9777703,918699,0.37948

1,rs3121567,933331,0.440824

一共是4列（逗号分隔），分别为：[1]染色体编号，[2]SNP rs 编号，[3] 位点在染色体上的位置，[4]显著性差异程度（pvalue）。在本例曼哈顿图中我们只需要使用第1,3和4列；而QQ图则只需要第4列——pvalue。

下面先从绘制曼哈顿图开始。我们先将需要的数据读取到一个列表中，可以这样做：

import csv

data = []

with open(\"GOYA.csv\") as f:

f_csv = csv.reader(f)

headers = next(f_csv)

data = [[row[0], int(row[2]), float(row[3])] for row in f_csv]

现在GOYA.csv中的数据就都存放在data列表中了，由于Python在读取文件中数据时，都是以string类型存放，因此对于第3和第4列的数据有必要事先把做点类型转换。

接下来，调用geneview中的曼哈顿图函数。

import matplotlib.pyplot as plt

from geneview.gwas import manhattanplot

ax = manhattanplot(data, xlabel=\"Chromosome\", ylabel=\"-Log10(P-value)\") # 这就是Manhattan plot的函数

plt.show()

只需这样的一句代码就能创建一个漂亮的曼哈顿图，有必要再次指出的是，geneview是以matplotlib为基础开发出来的，所创建的图形对象实际上仍属于matplotlib，geneview内部自定义了很多图形风格，同时封装了大量只属于基因组数据的图表类型，但图形的输出格式以及界面显示都仍和matplotlib一样，因此在这里我们使用matplotlib.pyplot的show()函数(上例中：plt.show())将所绘制出来的曼哈顿图显示出来。如果要将图形保存下来，则只需执行`plt.savefig(\"man.png\")`，这样就会在该目录下生成一个名为『man.png』png格式的曼哈顿图，若是要存为pdf格式，则只需将所要保存的文件名后缀改成『.pdf』（plt.savefig(\"man.pdf\")）就可以了。下面这些格式：emf,

eps, pdf, png, jpg, ps, raw, rgba, svg,

svgz等都是支持的，至于最新的还有多少种，还请参照matplotlib文档中说明。

此外，geneview中的每个画图函数都有着足够的灵活性，我们也可以根据自己的需要做一些调整，比如：

xtick = [\'1\', \'2\',\'3\',\'4\',\'5\',\'6\',\'7\',\'8\',\'9\',\'10\',\'11\',\'12\',\'13\',\'14\',\'16\',\'18\', \'20\',\'22\']

manhattanplot(data,

xlabel=\"Chromosome\", # 设置x轴名字

ylabel=\"-Log10(P-value)\", # 设置y轴名字

xtick_label_set = set(xtick), # 限定横坐标轴上的刻度显示

s=40, # 设置图中散点的大小

alpha=0.5, # 调整散点透明度

color=\"#f28b1e,#9a0dea,#ea0dcc,#63b8ff\", # 设置新的颜色组合

)

实现新的颜色组合、限定x轴上的刻度显示和散点大小的调节。甚至还可以将散点改为线：

manhattanplot(data，

xlabel=\"Chromosome\", # 设置x轴名字

ylabel=\"-Log10(P-value)\", # 设置y轴名字

xtick_label_set = set(xtick), # 限定横坐标轴上的刻度显示

alpha=0.5, # 调整散点透明度

color=\"#f28b1e,#9a0dea,#ea0dcc,#63b8ff\", # 设置新的颜色组合

kind=\"line\"

)

其它方面的调整请查看geneview文档中的相关说明。

Q-Q图

qq图只需用到上例中的pvalue那一列：

import csv

import matplotlib.pyplot as plt

from geneview.gwas import qqplot

pvalue=[]

with open(\"GOYA.csv\") as f:

f_csv = csv.reader(f)

headers = next(f_csv)

pvalue = [float(row[3]) for row in f_csv]

ax = qqplot(pvalue, color=\"#00bb33\", xlabel=\"Expected p-value(-log10)\", ylabel=\"Observed p-value(-log10)\") # Q-Q 图

plt.show()

同样，也可以根据自己的需要对改图进行相关的调整。

以上，便是如何使用Python来制作Manhattan图和QQ图的方法，geneview的集成函数简化了这样的一个过程。

如何用python绘制简单条形图？

如何用python绘制简单条形图呢？这里离不开matplotlib的使用。

条形图是数据可视化图形中很基础也很常用的一种图，简单解释下：条形图也叫长条图（英语：bar chart），亦称条图（英语：bar graph）、条状图、棒形图、柱状图、条形图表，是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值（不同时间或者不同条件），只有一个变量，通常利用于较小的数据集分析。长条图亦可横向排列，或用多维方式表达。

那么一个普通的条形图是长什么样子的呢？

当！当！当！就是下图的这个样子：

图先亮出来啦，接下来研究这个图是怎么画的吧，先看一下原数据长什么样子：

实际画图的流程和画折线图很相近，只是用到的画图函数不一样，绘制条形图的函数plt.bar（）：

由于这只是最简单的一个条形图，实际上条形图的函数plt.bar（）还有不少可以探索的参数设置，和对折线图函数plt.plot()的探索差不多，有兴趣的孩子可以自己去进行探索哦。

按照条形长短进行排序展示的条形图

当然也可以有其他的设置，比如说上图中的线条高低参差不齐，这是因为x轴的数据是按照学校名称进行排序的，那么可不可以按照分数的高低进行排序呢？也就是让所有的长方形按照从高到矮或者从矮到高的顺序进行排列？

当然可以啦！这里需要强调的是，条的高低排列等信息都是来源于原数据的，要想让条形的顺序发生改变，需要对画图的来源数据进行更改呢！

把原数据逆序排序后截取前十名数据赋值给data_yuwen，作为新的数据源传入画图函数plt.bar()，画出来的图自然就不一样了。

先看一眼数据长什么样子：

根据这个数据源绘制出的图形如下，由于用来画图的数据进行了降序排序操作，所以生成条形图的条也会进行降序排序展示：

很多时候，我们常见的条形图还有另一种展现形式，那就是横向的条形图，比较火的那种动态条形图绝大多数也都是横向的条形图，那么横向的条形图如何绘制呢？

理解plt.bar()主要参数

其实也不难，只要清楚plt.bar()函数中主要参数的作用就可以了！条形图函数中有五个主要参数，分别是x，height，width，bottom，orientation。其中x控制的是每个条在x轴上位置，height控制的是每个条的长度，width控制的是每个条的宽度，bottom控制的是每个条在y轴方向的起始位置，orientation控制的是条形的方向，是纵向还是横向，默认是纵向的。

通过一个小例子理解下这几个参数的作用：

上边的几行代码输出的图形如下：

对比着代码和实际输出的条形图，各个主要参数的作用是不是一目了然啦？

横向条形图

理解了这几个参数作用后，纵向的条形图转换成横向的条形图就没什么难度了！

需要设置所有条形在x轴的位置都为0，也就全部从最左侧开始画条形;由于是横向条形图，所以实际上条的宽度显示的是数据大小，将width参数设置成原数据中的语文成绩；bottom控制每个条在y轴方向的起始位置，设置bottom=range（10）设置每个条形在y轴的起始位置各不相同避免有条形重叠；height控制的是每个条在y轴方向上的长度，条形图横向设置后，在y轴上的长度失去了衡量数据的意义，所以直接设置一个常数即可；最后设置条形的方向为横向，即orientation=“horizontal”。

温馨提示：数据和标签一定要匹配，即plt.bar()重点的数据要和plt.yticks()中提取出来的标签一一对应，一旦不匹配，整个图展现的结果就是一个错误的结果！

上述代码生成的条形图如下：

感觉上边这种生成横向条形图的方式有点点绕，和人们的习惯认知有点不大一样，难道画一个横向条形图就非得转变自己的习惯认知这么反人类吗？

当然不是的，实际上有更简单的方法绘制一个横向条形图，之所以没有一开始就直接用这种简单的方法，也是为了让大家体会下条形图参数的灵活设置而已，而且如果比较绕的方法都能理解了，简单的方法理解和运用起来就更没有难度了啊！

不卖关子了，我们来认识下和plt.bar()函数类似的plt.barh()函数。

plt.barh()函数是专门绘制水平条形图的函数，主要的参数有：

y 控制y轴显示的标签来源width 控制横向条形的长度，即用来进行对比的数据源height 条形的宽度需要设置的参数主要就是这三个，比用plt.bar()函数绘制水平条形图简单了很多，具体代码如下：

效果图：

和用plt.bar()函数绘制的横向条形图一毛一样对不对？以后有需求绘制横向条形图，尽量用plt.barh()函数吧，毕竟它是专门绘制这种类型图的，简单好用。

然而实际工作中对于条形图的需求不只是这些，比如例子中只是对各个学校语文成绩的展示，有时候需要各个学科的成绩同时展现在一幅条形图中，有时候也需要绘制堆积条形图对各学科的成绩以及总成绩进行展示，这些图又该如何绘制呢？其实只要理解了各个参数的含义，绘制这些图也不在话下，至于具体怎么画，且看下回分解啊！

历史上的今天

5月

谷歌广告 Google AdSense 西联汇款收款最新流程攻略

正版特惠：微软官方 Office 2019 家庭和学生版仅需248 元！（永久授权）

正版特惠：微软官方 Office 2016 家庭和学生版仅需148 元！（永久授权）

正版优惠：下载神器 IDM 官方永久授权仅需99元

python读取data数据画图(python读取图像的几种方法)

python气象绘图windrose

用python对txt数据进行绘图

Python气象数据处理与绘图(1)：数据读取

如何使用python绘制gwas分析中的曼哈顿图和qq图

如何用python绘制简单条形图？

历史上的今天

发表评论取消回复

python气象绘图windrose

用python对txt数据进行绘图

Python气象数据处理与绘图(1)：数据读取

如何使用python绘制gwas分析中的曼哈顿图和qq图

如何用python绘制简单条形图？

历史上的今天

您可以选择一种方式赞助本站

发表评论取消回复

登录 注册 找回密码

登录注册找回密码