В Hive запросы даже небольших объемов данных занимают минуты. Предлагаем ознакомиться с основными методами автоматизации, позволяющими достичь существенного увеличения производительности.
Что делать, если у Вас большой лог-файл для построения графа процесса и ваш компьютер очень долго пытается произвести все необходимые вычисления? Есть решение: вы можете использовать Hadoop и библиотеку PM4PY!
Data News
5 августа 2022
12 октября 2022