О Google


Google (МФА [ɡuːɡl]MWCD /ˈgü-gəl/, рус. Гугл) — крупнейшая поисковая система, принадлежащая корпорации Google Inc.
Первая по популярности (79.65 %), обрабатывает 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %), индексирует более 25 миллиардов веб-страниц, может находить информацию на 191 языке (c 15 октября 2009).
Поддерживает поиск в документах форматов PDFRTF,PostScriptMicrosoft WordMicrosoft ExcelMicrosoft PowerPoint и других.

Содержание

   
  • 1 История создания
  • 2 Индексация сайтов
    • 2.1 Проблемы с авторскими правами
  • 3 Алгоритм ранжирования
    • 3.1 PageRank
  • 4 Поисковые запросы
    • 4.1 Синтаксис запросов
    • 4.2 Поиск в найденном
    • 4.3 Википоиск
    • 4.4 Голосовой поиск
    • 4.5 Google Doodle

История создания

Поисковая система Google была создана в качестве учебного проекта студентов Стэнфордского университета Ларри Пейджа иСергея Брина. Они в 1996 году работали над поисковой системой BackRub, а в 1998 году на её основе создали новую поисковую систему Google.
Хотя корпорация была основана 2 сентября 1998 года, а домен Google.com зарегистрирован 15 сентября 1997 года, поисковик (с 2000 года) иногда отмечает свой день рождения и в другой день: как 7, так и 27 сентября.[8][9]
Название Google произошло от намеренно искажённого Сергеем Брином слова Гугол (Googol), которое означает «десять в сотой степени» — 10100.

Индексация сайтов

Поисковый робот Google имеет User Agent — Googlebot (Поисковый робот), который является основным роботом, сканирующим содержание страницы для поискового индекса. Помимо него существуют ещё несколько специализированных роботов:
  • Googlebot-Mobile — робот, индексирующий сайты для мобильных устройств,
  • Google Search Appliance (Google) gsa-crawler — поисковый робот нового аппаратно-программного комплекса Search Appliance,
  • Googlebot-Image — робот, сканирующий страницы для индекса картинок,
  • Mediapartners-Google — робот, сканирующий контент страницы для определения содержания AdSense,
  • Adsbot-Google — робот, сканирующий контент для оценки качества целевых страниц AdWords.
Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтётсайт готовым из неё выйти.
Также существует обратная теория, называющаяся «бонус новичка», в которой при первоначальной индексации сайта, в силу некоторых аспектов (например нескольких ссылок с авторитетных ресурсов), сайту сразу присваивается высокий PageRank и хорошие места в поисковой выдаче. По истечении некоторого времени, после снятия этого эффекта сайту присваиваются его реальные показатели.

Проблемы с авторскими правами

KaZaA и Церковь саентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах якобы защищённые авторским правом. Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации.
The New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права. Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования посредством файла robots.txt — стандартного механизма, позволяющего администраторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска — или через мета-теги, позволяющие редактору контента указать, можно ли индексировать или архивировать документ и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field v. Google и Parker v. Google.

Алгоритм ранжирования

Метатег Keywords не учитывается при ранжировании сайтов.

PageRank

Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов приранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайтав результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.

Поисковые запросы

Синтаксис запросов

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» выведет все статьи Википедии на всех языках, в заголовке которых встречается слово Google.
Мощный язык запросов в руках хакеров может быть использован для исследования веб-сайтов на уязвимости.

Поиск в найденном

Для результатов поиска Google ранее предоставлял возможность повторного поиска, что позволяло производить поиск более детально. Для более детального поиска пользователям необходимо было указывать дополнительные параметры, по которым происходил отбор результатов, что позволяло сразу отобразить не только запрос, но и контекст, где он применяется. Данная возможность упрощала процедуру поиска, исключив необходимость в открытии каждого результата.

Википоиск

Поисковая технология, позволяющая пользователю настраивать результаты выдачи по поисковым запросам. Пользователь может удалять результаты из списка и поднимать вверх списка. Технология была запущена компанией Google весной 2009 года и проработала до осени. В настоящий момент (4 мая 2010 года), в настройках поиска осталась настройка для включения «Википоиска», но в выдаче соответствующие элементы управления отсутствуют. Другие поисковые системы подобной функциональности пока не предоставляли.

Голосовой поиск

22 сентября 2010 года компания запустила голосовой поиск в России. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер, и браузер выдаст строку с распознанным вашим запросом и результатами поиска по нему.

Google Doodle

По случаю праздника или круглой даты какой-нибудь широко известной личности стандартный логотип Google у некоторых или, реже, у всех региональных доменов может меняться на праздничный, имеющий определённую тематику, смысл, но в стиле Google (англ. Holiday and Events — Google style!). Например, по случаю дня рождения Наполеона Орды 11 февраля 2010 года на логотипе белорусского домена Google появились акварели этого известного художника, 6 июля поздравляли со 121-летием Марка Шагала (логотип был в виде коллажа из фрагментов его работ). После десятилетнего ожидания 22 марта 2011 года Google выиграл патент на «Google Doodle».
Российские:
Интерактивные:
  • Игра Pac-Man (включение/выключение звука, управление передвижением мышкой или клавишами со стрелками клавиатуры).
  • 9 июня 2011 года — логотип, посвящённый 96-й годовщине со дня рождения Леса Пола. Лого предоставляет возможность генерировать звуки (с изображением колеблющейся гитарной струны), записывать и проигрывать мелодии, передавать записанное (как URL)
  • 15 июня — интерактивный логотип, демонстрирующий (с возможностью прокрутки) фазы лунного затмения.
  • 5 сентября — логотип ко дню рождения Фредди Меркьюри, в котором показан мультклип, созданный компанией Google на песню Don’t Stop Me Now группы Queen.
  • 23 ноября — к 60-летию первой публикации Станислава Лема (по мотивам иллюстраций польского художника Даниэля Мрозак Кибериаде).
  • 31 октября — в честь праздника Хэллоуин. В ускоренном темпе на видео показано, как группа сотрудников Google вырезает логотип компании из 6 больших оранжевых тыкв.
  • 9 апреля 2012 года — к 182-летию со дня рождения Эдварда Мейбриджа. Логотип представляет из себя 21 сектор разного цвета, в каждом из которых бежит скаковая лошадь.
  • 23 апреля — к 99-летию со дня получения Гидеоном Сундбэком патента на застёжку-молнию.
  • 1 июня — в честь Международного дня защиты детей

Комментариев нет:

Отправить комментарий

Поиск по этому блогу