Parsing / Сбор информации, Анализ данных

Операторы для Google

Время прочтения: 6 мин.

Сами операторы легко запоминаются и существенно помогают при фильтрации ненужной нам информации.

К сведению, Google время от времени удаляет некоторые операторы (список “сломанных” прилагается), поэтому начнём скорее знакомство с теми, которые актуальны на текущий 2020 год.

Оператор «-» (знак минус) – позволяет убрать из запроса определенные слова, т.е. выдаваемые по поиску запросы не будут содержать эти слова. Ниже на скришотах можно увидеть, как это работает.

Допустим, нам крайне необходимо быстро найти научные труды одного автора, мы помним его имя и отчество, которые достаточно редки, а именно Владимир Ильич, но фамилию уточнить нет возможности. По запросу «Книги Владимир Ильич» Гугл нам, конечно, в первую очередь выдаст труды Ленина, ссылки на которые занимают все первые страницы поисковика, но мы искали нечто иное.

Как быть в такой ситуации, как их убрать? Достаточно добавить в запрос знак минус с фамилией Ленин, что бы запрос выглядел так: «Книги Владимир Ильич -Ленин», и тогда Гугл нам покажет книги других авторов, исключая из запроса Ленина, и мы сможем найти необходимого нам автора.

Следующие операторы — «OR» и «AND» — с ними знакомы большинство, часто используются в Excel. Они позволяют расширять запрос и группировать операторы, чтобы сузить диапазон поиска и получить только необходимую нам информацию.

Воспользуемся снова примером с книгами, как самым наглядным.

Допустим, нам необходимо найти книгу с соавторами, по умолчанию Гугл использует оператор AND, поэтому в подобном запросе его можно не писать, он больше необходим для группирования других операторов, оператор OR позволил использовать два оператора «site:» (о которых расскажем подробнее чуть дальше). В итоге мы получили нужные ссылки, содержащие переходы лишь на два сайта, которые указали в поисковом запросе: литрес или озон.

Оператор «» (кавычки) – способен выдать страницы, которые содержат точное совпадение с введенным запросом.

Введем в поисковой запрос Google, фразу без кавычек: Сегодня мы предлагаем рассмотреть один из способов. В результате получим такой результат:

Если добавить кавычки в тот же запрос, то мы получим одну единственную страницу, содержащую данный текст «точь-в-точь». Эта функция помогает находить дубликаты и определять, например, плагиат.

Оператор «allintitle:» — помогает найти страницы с определенным заголовком. Важно: операторы чувствительны к регистру букв, при использовании прописных – работать не будет.

Оператор «filetype:» позволяет искать именно тот тип файла, который указан в запросе.

Например, при запросе «filetype:pdf newtechaudit.ru» — покажет все странички, которые содержат pdf файл. Таким способом удобно искать различную документацию. Важно: иные операторы не приемлют пробела после двоеточия, и если его поставить, то не будут работать как положено.

Оператор «site:» позволяет создать запрос, в котором будут отображаться ссылки только на те страницы, которые принадлежат к сайту, указанному после оператора. Если поставить пробел после двоеточия, то работать не будет.

В настоящее время существует несколько десятков различных операторов, которые не сложно найти на просторах интернета, однако, некоторые совсем не работают. Предлагаем ознакомиться с операторами, которые Google перестал поддерживать. Список «поломанных» операторов:

 «#» — использовался для поиска по хэштегу, когда Google поддерживал свою социальную сеть Google+, которая была закрыта в под конец 2019 года$

«+» — осуществлял поиск только по одному слову, тот же самый эффект, если использовать для одного слова кавычки;

«~» — ранее использовался для поиска синонимов, но теперь эта функция работает по умолчанию, для исключения синонимов – используйте кавычки;

«link:» — использовался для поиска страниц, в которых находилась определенная ссылка на другой сайт;

«info:» — показывал информацию о искомой веб странице т.к. эта функция находится в инструменте проверки URL, то отдельный дублирующий оператор Google упразднил;

«daterange:» — использовался для поиска с определенным диапазоном дат в юлианском формате;

«phonebook:» — мог показывать телефонные номера людей, использовался преимущественно в США, информация бралась из публичного телефонного справочника.

Список полурабочих операторов, которые официально упразднены не были, но очень редко работают, скорее ничего с ними не удастся):

«..» — мог бы показать информацию в с определенным числовым диапазоном, например «новости 2010..2013» — показывал бы новости за 2010 – 2013 года, но в большинстве случаев этот оператор не работает;

«inanchor:» — мог бы показывать список страниц, которые бы имели ссылки, содержащие определенное слово;

«allinanchor:» — работал аналогично предыдущему оператору, но с множеством слов);

«location:» — должен показывать результаты поиска связанные с заданной локацией, но результаты запроса не такие, которые бы ожидали увидеть, проще без самого оператора.

Помимо перечисленного, Google имеет встроенные функции поисковой системы, такие как «Расширенный поиск» по ссылке «https://www.google.com/advanced_search »

Мы познакомили Вас с основными поисковыми операторами системы Google, которые могут существенно облегчить поиск любой информации в открытых источниках. Они пригодятся вам как на работе, так и дома. Данные инструменты, лично для меня, были незаменимы при поиске технических спецификаций устройств, но комбинация из «», «site:» и «filetype:» помогла справится с задачей за считанные минуты, хотя раньше уходило до нескольких часов, чтобы найти нераспространенную информацию в открытых источниках. Поэтому не бойтесь начинать экспериментировать с запросами и поисковыми операторами, ведь не пробуя новых путей, мы часто упускаем более простые и эффективные способы решения задач.

Советуем почитать