Return to site

ggplot2 & seaborn

数据可视化技术

· 数据分析,数据可视化,R,Python

因兴趣需要, 回顾一些R与Python中的data visualization用的第三方库 -

- R自不必说, 受本科翟老师(统计学院)影响,提前接触到了R语言。 ggplot2是本人现在还在使用 R Studio的唯一原因。

参考书:ggplot2:数据分析与图形艺术

seaborn则是继 numpy\pandas\matplotlib 我的“Python数据分析三剑客”之后新学习的内容。 学习资料也来自于其home网址: https://seaborn.pydata.org

- 如果还没有安装的话, 分别执行

pip install numpy pandas matplotlib seaborn

 

==================================================================

install.packages(“ggplot2")

Simple Plot

本文里我将常规的线、bar、pie、point(scatter)都视作简单图。 通过比较两种工具的展示结果, 以供个人及读者在之后选择时更有侧重。 当然我会给出核心绘图的代码:

项目地址: https://github.com/staticor/seaborn-data

( seaborn提供了一些案例数据集, 在此基础上新增了几个jupyter notebook文件)

如非特别指出, 我将会以 「tips.csv」作为我的首选dataset,它拥有两列浮点变量+多列分组变量, 其结构如下:

tips dataset sample ( first five row)

分类散点图:

>> sns.relplot(x="total_bill", y="tip", data=tip, hue="smoker") #same marker, differ colour

# differ marker differ colour

>> sns.relplot(x="total_bill", y="tip", data=tip, hue="smoker", style="smoker")

# differ range size ( 2,3,4...)

>> sns.relplot(x="total_bill", y="tip", data=tip, size="size", sizes=(15,200) )

>> {r}

library(ggplot2)
# Set color to vary based on state categories.
gg <- ggplot(midwest, aes(x=area, y=poptotal)) +
geom_point(aes(col=state), size=3)

Complicated

Heatmap

```python

>>> flights = sns.load_dataset("flights") >>> flights = flights.pivot("month", "year", "passengers") >>> ax = sns.heatmap(flights)  

```

 

Reference

All Posts
×

Almost done…

We just sent you an email. Please click the link in the email to confirm your subscription!

OKSubscriptions powered by Strikingly