Билеты на следующую конференцию:
Материалы последней конференции:
На видео – четвертая конференция DataStart 27/04/2019 Дмитрий Бугайченко - Big Data Science на практике с Apache Zeppelin и SparkML Описание доклада: Большинство МЛ сегодня происходит с использованием Python, особенно когда речь идет о начинающих специалистах. С другой стороны, для сбора и хранения данных в крупных и не очень компаний используется преимущественно JVM-стек Spark/Hadoop/Kafka и т.д. В результате появлется необходимость "переключения экосистем" при передаче данных в МЛ проработку и внедрению полученных МЛ результатов в бизнес, что, конечно же, приводить к целому букету проблем: разработка идет дольше, результаты часто не удается воспроизвести и они идут "в стол". О том как этого можно избежать и почему Python уже далеко не всегда лучшая альтернатива для начал знакомства с Data Science и пойдет речь Мы в социальных сетях: https://vk.com/datastart
/ datastartconf #data_science #machine_learning #spark #big_data