Время прочтения: 3 мин.

Сейчас на рынке труда высоко ценятся и хорошо оплачиваются Data Science специалисты. Академия больших данных MADE от Mail.ru Group и hh.ru проанализировали 8000+ CV DS-специалистов и 5500+ вакансий. На основе этих данных был составлен портрет Data Science специалиста. На почетном 2-ом месте находятся навыки по SQL (Structured Query Language).

Оптимистичная статистика для языка, созданного еще в 1970-х в подразделении IBM Research.

Как SQL поможет работать с данными?

Хотя SQL и задумывался как средство работы конечного пользователя в конце концов он стал настолько сложным, что превратился в инструмент программистов. Знание SQL особо актуально, когда вы работаете в ИТ сфере. Если провести сравнение, то обучение SQL сопоставимо изучению линейной алгебры: приложив все эти усилия в этот один предмет, вы знаете, что вы сможете использовать его, чтобы также освоить машинное обучение! Изучи один раз, применяй везде.

Почему технология SQL еще жива и актуальна?

— хранение информации в реляционных СУБД и для доступа к этим данным нужен SQL. SQL соединяется с любой базой данных или даже строит свою собственную локально!

— ее достаточно легко изучить. Вы в короткие сроки сможете написать свой первый запрос.

— иногда SQL запрос более производителен чем написание строчек кода

При этом SQL сегодня применяют даже с deep learning (работает вместе с NLP, пониманием языка и computer vision).

Несмотря на кажущуюся простоту SQL является мощным языком. Разумно пользуясь его элементами можно выполнять очень сложные операции с БД.

Где лучше изучать SQL?

Мы проанализировали ресурсы и книги, предоставляющие обучение по SQL. Делимся своим опытом для прокачки не только базовых, но и продвинутых навыков SQL.

  1. http://www.sql-tutorial.ru/

Что понравилось: Здесь проводится анализ характерных ошибок при решении задач обучающего этапа. Считаем, такая форма обучения значительно эффективнее, чем простое рассмотрение примеров различных конструкцией языка. Этот ресурс помогает сориентироваться в целом с работой СУБД, знакомит как с базовыми функциями, так и с написанием более продвинутых запросов, которые можно применить в своей работе. Так, при помощи коррелирующих подзапросов мы определили длительность процесса в рамках реализации текущих проектов.

Действительно, наши IT-специалисты по работе с большими данными смогли выделить для себя наиболее значимые главы учебника, такие как: функции Transact-SQL для работы со строками и данными типа даты/времени, что помогло в значительной степени ускорить выполнение задач за счет применения к строкам методов унификации для дальнейшей обработки данных.

Также, полезные советы в книге помогли расширить свои знания в области оптимизации запросов. Например, для сравнения производительности нумерации строк с помощью переменных, мы применили способ самостоятельного соединения таблиц, и в результате получили сокращение обработки запроса по времени в десятки раз.

Для продвинутых пользователей БД. Ресурс для тех, кто любит соревноваться в программировании. Задачи ранжированы по темам и сложности. Т.к. ресурс англоязычный, есть возможность потягаться в SQL, Python, Java навыках с ИТ-шниками из других уголков мира. Эксперты из Habr также рекомендуют книгу “Database Management Systems“ авторства R. Ramakrishnan и J. Gehrke

  • Не могли не упомянуть книгу «SQL за 10 минут» Бена Форта. Можно использовать книгу в качестве быстрой подсказки по азам SQL.

В заключение хотелось бы добавить, что AI и ML- это замечательно. Например, Amazon доказал эффективность своего проекта. Но иногда при решении задач можно вспомнить про старый добрый SQL. Кроме того, специалисты по ML/AI стоят недёшево