小王在电商公司做运营,每月初都要手动整理几百行订单ref="/tag/426/" style="color:#8B0506;font-weight:bold;">数据,用Excel画折线图、算同比、导出截图——直到他花一个午休学了三行R代码。
装好R和RStudio,就像装微信一样简单
去CRAN官网下载对应系统的R安装包,再装个RStudio(界面清爽,比原生R好上手多了)。装完打开,左下角控制台能敲1+1出结果,就算成功了。
读数据、看分布、画图,三步不拖泥带水
假设你有个叫sales.csv的销售表,含日期、销售额、品类三列。直接这样写:
library(readr)
library(ggplot2)
# 读数据
data <- read_csv("sales.csv")
# 快速看看前6行和数据结构
head(data)
str(data)
# 按月份汇总销售额,画趋势图
data$month <- format(as.Date(data$date), "%Y-%m")
monthly <- aggregate(sales ~ month, data = data, sum)
ggplot(monthly, aes(x = month, y = sales)) +
geom_line(color = "#2a5caa") +
geom_point() +
labs(title = "月度销售额趋势", x = "月份", y = "销售额(万元)")
回车一按,右侧图形窗立刻弹出清晰折线图——不用拖拽、不点右键、不调格式,改个颜色、换种图型,改两三个词就行。
遇到脏数据?R比Excel更“耐造”
比如某天销售额是空值或写了“暂无”,Excel会卡住或报错,R里一句就搞定:
data$sales <- as.numeric(data$sales) # 自动把非数字转成NA
data <- na.omit(data) # 直接删掉含NA的行
再比如想快速知道哪个品类卖得最好,不用排序筛选,一行命令:
aggregate(sales ~ category, data, sum) %>% arrange(desc(sales))
结果直接按销售额从高到低排好,连表格都省得手动整理。
不是程序员也能用,关键是“先跑通再优化”
R的语法像说话:用read_开头就是读数据,plot或ggplot就是画图,filter、group_by这些词,基本就是字面意思。别怕报错,多数时候只是少了个引号、拼错了函数名,把错误提示复制到百度,前几条基本就是解法。你不需要背函数手册,记住library()、read_csv()、ggplot()这仨,已经能干掉日常80%的数据活。