R语言做数据分析:三步搞定销售报表可视化

小王在电商公司做运营,每月初都要手动整理几百行订单ref="/tag/426/" style="color:#8B0506;font-weight:bold;">数据,用Excel画折线图、算同比、导出截图——直到他花一个午休学了三行R代码。

装好R和RStudio,就像装微信一样简单

CRAN官网下载对应系统的R安装包,再装个RStudio(界面清爽,比原生R好上手多了)。装完打开,左下角控制台能敲1+1出结果,就算成功了。

读数据、看分布、画图,三步不拖泥带水

假设你有个叫sales.csv的销售表,含日期、销售额、品类三列。直接这样写:

library(readr)
library(ggplot2)

# 读数据
data <- read_csv("sales.csv")

# 快速看看前6行和数据结构
head(data)
str(data)

# 按月份汇总销售额,画趋势图
data$month <- format(as.Date(data$date), "%Y-%m")
monthly <- aggregate(sales ~ month, data = data, sum)

ggplot(monthly, aes(x = month, y = sales)) + 
  geom_line(color = "#2a5caa") + 
  geom_point() + 
  labs(title = "月度销售额趋势", x = "月份", y = "销售额(万元)")

回车一按,右侧图形窗立刻弹出清晰折线图——不用拖拽、不点右键、不调格式,改个颜色、换种图型,改两三个词就行。

遇到脏数据?R比Excel更“耐造”

比如某天销售额是空值或写了“暂无”,Excel会卡住或报错,R里一句就搞定:

data$sales <- as.numeric(data$sales)  # 自动把非数字转成NA
data <- na.omit(data)  # 直接删掉含NA的行

再比如想快速知道哪个品类卖得最好,不用排序筛选,一行命令:

aggregate(sales ~ category, data, sum) %>% arrange(desc(sales))

结果直接按销售额从高到低排好,连表格都省得手动整理。

不是程序员也能用,关键是“先跑通再优

R的语法像说话:用read_开头就是读数据,plotggplot就是画图,filtergroup_by这些词,基本就是字面意思。别怕报错,多数时候只是少了个引号、拼错了函数名,把错误提示复制到百度,前几条基本就是解法。你不需要背函数手册,记住library()read_csv()ggplot()这仨,已经能干掉日常80%的数据活。