永发信息网

dataframe和 dataset的区别

答案:2  悬赏:30  手机版
解决时间 2021-02-27 06:17
  • 提问者网友:富士山上尢
  • 2021-02-27 00:55
dataframe和 dataset的区别
最佳答案
  • 五星知识达人网友:有你哪都是故乡
  • 2021-02-27 02:19
首先,既然你要画残差(residual)的qqplot那一定要先做回归。你没说明回归自变量和因变量都是什么,假设第二列是因变量pressure[2],第三列是自变量pressure[3]1.回归>lm.fitqqnorm(lm.fit$res)>qqliine(lm.fit$res)提取?就直接write.table()比如你要第二列和第三列>write.table(pressure[c(2,3)],file="c:\test.txt",quote=F,row.names=F,sep="\t")第一个参数pressure[c(2,3)]是你要提取的变量第二个参数file=是你要存放的地址和文件名第三个参数quote=F是你打出来的数字都没有引号(默认是字符型)第四个参数row.names=F是不要行名称(为什么不要?自己试试就知道了)第五个参数sep="\t"每列数据之间空一个tab的距离,也就是8个字节,清晰明了。
全部回答
  • 1楼网友:毛毛
  • 2021-02-27 03:41
rdd:a resilient distributed dataset (rdd), the basic abstraction in spark. rdd是一个分布式的数据集,数据分散在分布式集群的各台机器上 a dataframe is equivalent to a relational table in spark sql, and can be created using various functions in sqlcontext dataframe更像是一张关系型数据表,是一种spark独有的数据格式吧,这种格式的数据可以使用sqlcontext里面的函数
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯