什么是Spark高性能,基于内存、快速、易扩展的大数据计算框架,它给出了大一统的软件开发栈,适用于不同场合的分布式场景,如批处理、迭代算法、交互式查询、流处理、机器学习和图计算。Spark3.0在20年发布,目前最新的版本是3.3。Spark VS HadoopSpark单机安装Spark语法实例参考