Python的Spark:Python的Spark基础(使用PySpark)代码示例 源码
用Python火花 Apache Spark 是技术领域中最热门的新趋势之一。 它是实现大数据与机器学习结合的成果的最大潜力框架。 它运行速度快(由于在内存中进行操作,因此比传统的快100倍,提供健壮的,分布式的,容错的数据对象(称为 ),并通过诸如的补充包与机器学习和图形分析领域完美集成和 。 Spark在上实现,并且主要用 (一种类似于Java的功能性编程语言)编写。 实际上,Scala需要在您的系统上安装最新的Java并在JVM上运行。 但是,对于大多数初学者来说,Scala并不是他们首先学习的语言,它可以涉足数据科学领域。 幸运的是,Spark提供了一个很棒的Python集成,称
用户评论