Quelles sont les améliorations apportées par Apache Spark2 par rapport à Apache Spark?
Apache Spark 2.0.0 Les API sont restées largement similaires à 1.X, Spark 2.0.0 a des changements de rupture d'API)
Apache Spark 2.0.0 est la première version de la ligne 2.x. Les principales mises à jour sont Utilisation de l'API, prise en charge de SQL 2003, améliorations des performances, streaming structuré, prise en charge R UDF, ainsi que des améliorations opérationnelles.
Nouveau dans spark 2:
Vous pouvez passer par Spark version 2.0. où les mises à jour dans les points suivants sont expliquées:
Il n'y a pas beaucoup de différence en ce qui concerne l'architecture car la coquille est toujours DAG et RDD, ce qui est la partie la plus importante!
Bien que Spark 2.0 est beaucoup plus optimisé et dispose de DataSet Api qui donne beaucoup plus de puissance aux mains des développeurs. Je dirais donc que l'architecture est la même, c'est juste le Spark 2.0 fournit beaucoup optimisé et dispose d'un riche ensemble d'Api!
Ce sont les principales choses qui sont fournies par Apache Spark 2.0:
Pour plus d'informations, veuillez prendre un coup d'œil ici: https://www.quora.com/What-are-special-features-and-advantages-of-Apache-Spark-2-0-over-earlier-versions