Digital skills, Саморазвитие

Jupyter — новый Excel

Время прочтения: 5 мин.

Если вы работаете в финансовых службах, Excel – это ваш хлеб. Возможно, вы являетесь экспертом в области сводных таблиц, формул, диаграмм или даже VBA и PowerQuery. Вы можете быстро найти решение, но прежде чем вы это узнаете, ваша электронная таблица расширится на десятки вкладок, тысячи строк — так что его читаемость и обслуживание становится очень плохой. И когда вы осмеливаетесь нажать F9, чтобы обновить результаты, вы можете взять чашку чаю и подождать еще немного (если ваш компьютер не завис)!

Звучит знакомо? Вы, вероятно, горячо киваете.

Как бы полезными они ни были, для обеспечения реального понимания данных, электронные таблицы просто не дадут всех ответов, которые вы ищете. Давайте посмотрим, что делает Excel популярным и где он «проседает», и самое главное, почему вам следует начать использовать ноутбуки Jupyter в качестве альтернативного мощного инструмента.

Excel плюсы:

Несколько факторов сделали Excel ценным, и наиболее примечательным является его простая, но мощная реактивная вычислительная модель со встроенными функциями. Электронная таблица похожа на чистый холст, на котором «программист-любитель» может писать код, используя собственный язык Excel (например, формулы и VBA).

Банки внедряют широкий спектр ИТ-систем для запуска критически важных бизнес-процессов, однако электронные таблицы дополняют эти основные системы и служат стандартными инструментами для новых бизнес-инициатив. Из-за того, что корпоративные системы не настолько гибки, чтобы приспособиться к быстрому выходу на рынок, который требуется в динамичной финансовой среде, Excel приходит и заполняет этот пробел!

Excel минусы:

Попытка использовать электронные таблицы для расширенной, отзывчивой аналитики большого объема данных — это неправильный инструмент для работы.

Каскадные ошибки: Excel печально известен тем, что ошибки распространяются по столбцу, а затем по всей электронной таблице, создавая снежный ком, который превращается в лавину проблем. Страшно, некоторые из них остаются незамеченными, пока не станет слишком поздно. Было опубликовано несколько случаев, когда это приводило к огромным финансовым последствиям.

Масштабируемость: Excel имеет ограничение на количество строк и столбцов, которые он может содержать. С наборами данных, растущими с экспоненциальной скоростью, электронные таблицы исчерпывают память или процессорную мощьность. Когда это происходит, риск повреждения данных возрастает.

Тестирование: почти невозможно проверить правильность электронной таблицы, а затем доказать, что последующие изменения не сломали ничего другого.

Отслеживаемость /отладка. Зачастую даже небольшие изменения могут существенно повредить вашу сложную формулу, что делает ее чрезвычайно трудной для идентификации и исправления.

Данные совмещены с формулами: все данные и расчеты содержатся в файле Excel и запускаются с локального компьютера. Это означает, что совместная работа с файлом ограничена. Контроль версий становиться кошмаром. Кроме того, данные являются статическими – их нужно подменять самостоятельно. Все эти проблемы уже были решены для традиционного программного обеспечения десятилетия назад.

Операционный риск: все электронные таблицы начинаются с небольших / быстрых расчетов, но некоторые превращаются в постоянные решения корпоративного уровня. Они подпитывают ряд бизнес-процессов, но из-за отсутствия видимости всей  картины целостность многих финансовых, операционных и регуляторных процессов находится под угрозой.

Итак, каково решение для финансовых специалистов, которые считают Excel ограничивающим (если не устаревшим)? Изучите Python и используйте Jupyter Notebooks для написания кода!

Python достаточно прост в освоении и очень универсален, и, следовательно, в финансовом сообществе наблюдается его принятие. Теперь это является обязательным условием для многих позиций, наряду с Excel. Он менее сложен, чем другие языки, а это означает, что кривая обучения не такая крутая, а также объем кода существенно меньше (в 5 или 10 раз).

Растущая популярность Python проявляется в огромном количестве библиотек, которые поддерживают практически все, что вам понадобится:

  • чтение, запись, очистка, обработка, нарезка данных
  • математика, статистика и временные ряды
  • финансовый анализ: торговое и количественное финансирование, анализ рыночных данных, анализ фондовых / производных рынков, доступ к данным Bloomberg, механизмы исполнения, бэк-тестирование, анализ рисков и т.д.
  • машинное обучение из коробки (например, прогнозирование рыночных цен)
  •  красивые / интерактивные визуализации
  • поддержка SQL
  • отправка электронных писем
  • просмотр веб-страниц (например, получение рыночных цен онлайн)
  • автоматизация задач / планирование
  • интеграция с Excel (если вам действительно очень нравится Excel)

Jupyter

Кроме того, Jupyter Notebook — это компьютерная среда на основе веб-технологий, которая позволяет создавать документы, которые включают в себя: живой код, графики, виджеты, богатый текст (включая ссылки, уравнения и т. д.), Изображения и т. д. Тут можно редактировать код в браузере, с автоматической подсветкой синтаксиса, отступами и автоматическим анализом кода.

Электронные таблицы по-прежнему лучше всего подходят для следующих случаев:

  • Правильность и точность не является приоритетом
  • Данные не слишком велики (т.е. нет необходимости в масштабируемости)
  • Нет необходимости в обновлениях в реальном времени
  • для быстрого создания прототипа
  • Нет необходимости в длительном обслуживании.

Вам нужно что-то, что позволяет быстро разрабатывать, проверять правильность и расширяемость, сохраняя ту же реактивную модель, что и Excel. И это именно то, что обеспечивают ноутбуки Jupyter.

Нет, Excel не устарел, но ноутбуки Jupyter — лучшие инструменты для анализа данных! Преимущества использования комбинации Python / Jupyter по сравнению с Excel:

  • Мощные манипуляции с данными — в конце концов, это набор инструментов для исследователей данных
  • Управление производительностью — использование преимуществ многопроцессорной обработки
  • Разработка через тестирование – одна из практик позволяющая контролировать качество на всех этапах
  • Доступность открытого исходного кода
  • прослеживаемость ошибок
  • Более простая автоматизация
  • Самодокументирование

Банки начинают находить Python в качестве альтернативы Excel для своих рабочих. Недавно Barclays попал в заголовки газет, пытаясь научить своих трейдеров программировать.

Если вы научитесь обрабатывать данные с помощью Jupyter — вы точно не будете разочарованы!

Ссылка на оригинал статьи

Советуем почитать