菜单 学习猿地 - LMONKEY

VIP

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练!告别无效练习

接私单赚外块

VIP优先接,累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

入驻
226
0

sample

原创
05/13 14:22
阅读数 29740

sample是在数据源取样。

val data = sc.parallelize(1 to 20)
data.sample(true,0.4).collect

sample第一个参数表示是否是重复抽样,如果是true,则抽象的结果可能会有重复的数字。而false代表抽样的结果是没有重复的。

sample第二个参数表示抽样的数量量,0.4代表是40%

发表评论

0/200
226 点赞
0 评论
收藏
为你推荐 换一批