Spark dataframe. Spark dataset rdd dataframe. пайплайн модели машинного обучения. amazon emr архитектура. resilient distributed dataset.