首页
玄幻
武侠
历史
科幻
轻小说
(美)J.T.沃勒翰
展开
完结作品
(1)
会员
深入大型数据集:并行与分布化Python代码
本书共分3部分,主要介绍如何使用Python语言来处理大型数据集。第1部分介绍map和reduce编程风格,以及Python中基础的map和reduce函数,并介绍如何将对象持久化,通过惰性函数和并行函数来加快大型数据集的处理速度。第2部分介绍Hadoop和Spark框架,以及如何使用mrjob库来编写Hadoop作业,如何实现PageRank算法,如何使用Spark来实现决策树和随机森林的机器学
程序设计
14.1万字
更多作家
醉笑金
夏日丁香
斯人语
不吃青草的山羊
不哭木木
红莲星动
沐杦杦
二白的黄
乌龟与兔
黑狐狸
东方乙
修道仔
悲观的记录者
一只懒可可
凉同侑