...

Поисковая система Google

Google

Название произошло от искаженного «googol» – число, изображаемое как 1 со 100 нулями. Создатель поисковика Сергей Брин просто неправильно написал слово, и эта опечатка плотно вошла в обиход интернет-пользователей.

С чего все началось

Личные сведения размещались в Интернете, занимая при этом память Всемирной паутины, они будто «оседали» в Сети, отчего и возникло название информационной единицы Интернета, site ( букв. перевод. как «сидение»).

Вскоре владельцам сайтов, особенно бизнесменам, захотелось известности в Сети. Сайты рекламировались всевозможными способами, даже путем распространения листовок.

Но, как известно, предложение рождает спрос. Чтобы купить товар, клиент будет долго искать другие варианты, например, более дешевые. Возникла потребность в поиске, и Интернет должен был удовлетворить ее: были разработаны сайты, ориентированные на поиск товаров, услуг, а вскоре и информации. Именно они и получили название поисковых машин или систем, одной из которых стал Google.

Вспышка сверхновой

Ответственными за появление на свет Google являются студенты Стэндфордского университета, Ларри Пейдж и Сергей Брин. Новаторство сошлось с энтузиазмом, в результате чего возник Google, спустя 20 лет занявший место поисковика №1 во всем мире. Домен поисковой системы был зарегистрирован в сентябре 1997 года, а спустя год специально для Google открылась корпорация Google Inc.

Механизмы работы Google

Поисковик непрерывно обрастает все новыми и новыми возможностями по части алгоритмов и функционала.

Любой алгоритм поисковой системы базируется на программных шаблонах, ранжирующих сайты по соответствию запросов результатам выдачи и по уровню значимости. В 1997г. алгоритмы считали количество внешних ссылок на сайт. Большое количество ссылок являлось залогом высоких позиций в выдаче поисковой системы. Со временем стала учитываться и авторитетность сайта, на котором проставлялись внешние ссылки, и был введен термин «вес ссылки».

Google обрел мировую известность , так как всячески улучшал свою навигацию и облегчал поиск информации. Стоило пользователю написать часть слова, как во всплывающем меню появлялись варианты его окончания, на любой из которых можно было кликнуть.

Поисковик сотрудничает со многими социальными сетями, например, Facebook*. Google даже разработал личный браузер Google Chrome и операционную систему Chrome OS.

Google в SEO

Поисковик и поисковое продвижение неразрывно связаны друг с другом, ведь веб-мастер всячески стремится к тому, чтобы повысить свои позиции, но без индексации сайта это невозможно. Поэтому веб-мастер, чтобы привлечь внимание робота Google, оптимизирует свой сайт при помощи белых и незаконных, черных методов SEO . Последних лучше избегать, иначе можно попасть под бан или фильтр.

Каждой странице сайта присваивается некая степень качества, ранг – PR, или Page Rank. Случайное совпадение звучания имени Ларри Пейджа и Page Rank даже привело к тому, что в Интернете бытует мнение о том, что PR базируется на симпатии или антипатии создателя поисковика к тому или иному сайту.

Учитывая авторитет и размах Google, оптимизаторы стараются продвигать свои сайты именно в этом поисковике. Но огромное количество внешних ссылок и запрещенные, черные методы оптимизации вовсе не гарантируют позиций в ТОПе. Прежде всего, тут надо ориентироваться на желания пользователей.

Ссылки

Google (поисковая система)

Лидер поисковых машин интернета, Google занимает более 60 % мирового рынка и индексирует более 8 миллиардов веб-страниц. Google может находить информацию на 186 языках (на 15 октября 2009).

Google поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.

История создания

Поисковая система Google была создана в качестве учебного проекта студентов Стендфорского университета Лари Пейджа и Сергея Брина. Они в 1995 году работали над поисковой системой BackRub, а в 1998 году на её основе создали поисковую систему Google.

Индексация сайтов

Поисковый робот Google имеет User Agent — Googlebot, робот индексирующий сайты для мобильных устройств — Googlebot-Mobile, поисковой робот нового аппаратно-программного комплекса Search Appliance — Google Search Appliance (Google) gsa-crawler [4] .

Существует теория эффекта песочницы, которая утверждает, что сайты, которые имеют новые доменные имена, частые смены владельцев или нэймсерверов, помещаются в «песочницу» (зону ожидания) и пребывают там, пока механизм Google не сочтёт сайт готовым из неё выйти.

Проблемы с авторскими правами

KaZaA и церковь сайентологии использовали Закон об авторском праве в цифровую эпоху (DMCA), чтобы потребовать от Google удалить ссылки на материалы на их сайтах якобы защищённые авторским правом. [5] [6] Google по закону обязан удалить эти ссылки, но вместо того, чтобы убрать результаты поиска, предпочитает связать результаты с жалобами, которые подали эти организации. [6]

New York Times жаловалась на то, что кэширование их содержания поисковым роботом — особенность, используемая поисковиками, в том числе Google Web Search, нарушает авторские права. [7] Google соблюдает стандартные Интернет-приёмы для запросов об отключении кэширования через файл robots.txt, который является механизмом, который позволяет операторам веб-сайта потребовать исключения своего сайта или его части из результатов поиска, или через мета-теги, которые позволяют редактору контента указать, можно ли индексировать или архивировать документ, и можно ли проходить по ссылкам в документе. Окружной суд США штата Невада постановил, что кэши компании Google не нарушают авторских прав согласно американскому законодательству в делах Field v. Google и Parker v. Google. [8] [9]

Алгоритм ранжирования

Мета тег Keywords не учитывается при ранжировании сайтов [10] .

PageRank

Основная статья: PageRank

Google использует алгоритм расчёта авторитетности страницы PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска.

Поисковые запросы

Синтаксис запросов

Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д. Например, поиск «intitle:Google site:wikipedia.org» даст все статьи Википедии на всех языках, в заголовке которых встречается слово Google. [11] [12] [13]

Описание операторов и встроенных функций расширенного поиска: общая страница; операторы и функции расширенного поиска; Advanced Operators (подробное описание операторов на английском); «шпаргалка» по языку поисковых запросов Google;

Поиск в найденном

Для некоторых результатов поиска Google предоставляет повторное поле для поиска, которое позволяет пользователю найти то, что он ищет внутри конкретного вебсайта. Эта идея возникла из того, как пользователи использовали поиск. По словам инженера-программиста Бена Ли (Ben Lee) и менеджера продукта Джека Менцеля (Jack Menzel) «телепортирование» в сети — это как раз то, что помогает пользователям Google завершить свой поиск. Google развил эту концепцию на шаг вперёд, и вместо просто «телепортирования», что значит для поиска нужного сайта пользователю достаточно ввести часть имени вебсайта в Google (необязательно помнить весь адрес), пользователи могут вводить ключевые слова для поиска внутри выбранного сайта. [14] Оказалось, что пользователям часто нелегко найти то, что они ищут внутри корпоративного сайта.

Несмотря на то, что пользователям в новинку этот поисковый инструмент, он вызвал разногласия среди некоторых издательств и дистрибьюторов. На страницах результатов поиска Google отображаются платные (pay per click) рекламные объявления конкурирующих компаний, которые основывают рекламные объявления на брендах. [15] «В то время как сервис мог бы помочь увеличить трафик, некоторые пользователи „сливаются“, так как Google использует известность брендов для продажи рекламных объявлений, как правило, конкурирующим компаниям.» [16] Чтобы сгладить этот конфликт Google предложил отключать эту возможность для желающих компаний. [16]

Примечания

  1. По данным компании Net Applications в декабре 2007 года рыночная доля Google в мире составляла 77,04 %, Yahoo — 12,46 %, MSN — 3,33 %, Microsoft Live Search — 2,57 %, AOL — 2,12 %, Ask — 1,38 %, AltaVista — 0,13 %, Excite — 0,07 %, Lycos — 0,02 %, All the Web — 0,02 %
  2. http://www.comscore.com/press/release.asp?press=2018
  3. http://habrahabr.ru/blog/yandex/34614.html
  4. Роботы Google
  5. Technology News: News: Google Pulls P2P Links Over Kazaa Copyright Claims
  6. 12New Economy; A copyright dispute with the Church of Scientology is forcing Google to do some creative linking. — New York Times
  7. Google cache raises copyright concerns — CNET News.com
  8. Case No. CV-S-04-0413-RCJ-LRL. United States District Court (District of Nevada). Filed on January 19, 2006. Retrieved on July 7, 2006.
  9. Case No. 04-CV-3918. United States District Court (Eastern District of Pennsylvania). March 10, 2006. Retrieved on July 7, 2006.
  10. Google отказался от мета тега Keywords
  11. http://www.google.com/search?q=intitle:google+site:wikipedia.org
  12. Поисковые операторы Google,Таблица операторов Google
  13. Официальный справочник на английском языке
  14. Regan, Keith. “Google’s Search-Within-Search Draws Scutiny”, E-Commerce Times (2008-03-24).
  15. Stamoulis, Nick. “Why Companies Are Upset With Google’s Search-Within-Search”, Search Engine Optimization Journal (2008-03-24).
  16. 12 Tedeschi, Bob. A New Tool From Google Alarms Sites, New York Times (2008-03-24).

См. также

  • elgooG — зеркало Google
  • PageRank
  • LinkRank
  • Эффект песочницы
  • Список поисковых машин
  • Google.by

Ссылки

  • Поисковая система Google
  • Google: технология поиска для нового тысячелетия
  • Один и 100 нулей – история создания слова “Google”

Председатель совета директоров/CEO: Эрик Шмидт • Директор/президент по технологиям: Сергей Брин • Директор/президент по продуктам компании: Лэрри Пэйдж

Adscape • AdSense • Advertising Professional • AdWords • Analytics • Checkout • Click-to-Call • DoubleClick • Insights for Search • Trends

Account • Android • App Engine • Apps • Base • BigTable • Chrome OS • Co-op • Gears • GFS • Health • Mashup • OpenSocial

Code • Gadgets API • GData • Googlebot • Guice • GWS • Highly Open Participation Contest • I/O • Image Labeler • KML • MapReduce • Mediabot • Pinyin • SketchUp Ruby • Sitemaps (index) • Summer of Code • TechTalks • Web Toolkit • Website Optimizer

Alerts • Blogger • Bookmarks • Docs • FeedBurner • iGoogle • Jaiku • Knol • Library Project • Map Maker • Mashup Editor • Notebook • Page Creator • Sites • Video Marketplace • YouTube

Appliance • Audio • Books • Code • Desktop • Finance • GOOG-411 • Images • Maps (Mars • Moon • Ocean • Sky • Street View) • News • Patents • Products • Scholar • SearchWiki • Usenet • Video • Web

Поглощения • Bomb • Цензура • Current • Критика • Earth Outreach • Foundation • Google China • Google.org • Googleplex • История • Hoaxes • I’m Feeling Lucky • Labs • Logo • Lunar X Prize • Список сервисов и инструментов • WiFi • Zeitgeist • Гуглизм

Годовой доход: US$16,59 млрд ( ▲ 56 % FY 2007) • Сотрудники: 19 665 (30 сентября 2009) • Биржевой тикер: ( NASDAQ: GOOG ) • Девиз: Don’t be evil • Веб-сайт: google.com

Wikimedia Foundation . 2010 .

  • Google (фонд)
  • Google C++ Testing Framework

Поисковая система Google

Поисковая система Google — самый популярный сервис в мире, который ежедневно используют около 5,5 миллиардов раз. Для успешного продвижения сайта важно понимать, как работает Google.

Когда была создана поисковая система Google

Google — поисковая система, созданная в 1996 году студентами Стэнфорда Ларри Пейджем и Сергеем Брином, которые изначально разместили этот проект на поддомене сайта своего университета — google.stanford.edu.

Осенью 1997 года создатели поисковой системы официально зарегистрировали отдельный домен, ставший впоследствии самым посещаемым в мире, — Google.com:

Рейтинг Google в мире и посещаемость

4 сентября 1998 года благодаря помощи инвесторов была зарегистрирована компания Google Inc.
История поисковой системы Google

Вначале система носила название «Backrub», затем имя поменяли на Google — название созвучно с числом гугол — 10100. Такое название выбрали, чтобы выразить стремление к оперативному упорядочиванию и систематизации огромного объема информации, выложенной в интернет.

Разработчики положили в основу сервиса понятие PageRank, согласно которому важность веб-страницы с точки зрения поисковой системы определялась исходя из количества ссылок на нее.

В конце лета 1998 года Ларри Пейдж и Сергей Брин получили от соучредителя Sun Microsystem 100 тысяч долларов на развитие проекта. Именно на эти средства была основана их компания.

После получения денег от инвестора бизнесмены переехали из общежития в свой первый офис в Калифорнии — это был гараж, наполненный компьютерами, который принадлежал их подруге Сьюзен Воджиски. Сьюзен и сейчас работает в компании, с 2014 года она занимает пост генерального директора YouTube.

С 2000 года в Google появились платные рекламные объявления, которые отображались в результатах поиска при определенных рекламодателем поисковых запросах. Компания стремительно расширялась и завоевывала популярность, в 2006 году глагол «to google» (гуглить) стал настолько распространенным, что его даже добавили в Оксфордский словарь.

На 2019 год Google по версии Forbes занимает второе место в рейтинге самых дорогих брендов в мире. Это безоговорочный лидер среди поисковых систем, имеющий 92,42% доли общемирового рынка. Согласно статистике Alexa, среднестатистический пользователь просматривает в Google более 10 страниц в день, проводя на сайте около 8 минут.

История алгоритмов Google

Как работают алгоритмы Google

Во многих случаях поисковому запросу пользователя соответствуют миллионы страниц. Чтобы упорядочить предоставление информации и показать наиболее подходящие результаты, используются принципы ранжирования.

Алгоритмы Google основаны на последовательном выполнении нескольких взаимосвязанных процессов — сканировании и индексации страниц, а затем их отображении с учетом релевантности и персонализации.

Сейчас поиск Google позволяет, помимо отображения релевантных веб-страниц, получать информацию из книг, хранящихся в наиболее крупных библиотеках, узнавать расписание транспорта, общеизвестные факты и многое другое. Такие возможности появились благодаря построению Сети Знаний:

Как работает сеть знаний Гугла

Сканирование страниц Google-ботами

Сканирование веб-страниц называют еще краулингом — это процесс выявления новых страниц в интернете и обновления информации о тех, которые уже проиндексированы, выполняемый Google-ботами. Основой для сканирования служит Sitemap — файл, содержащий все страницы сайта, созданный для поисковых систем.

Google-бот или краулер — это программа, которая находит и скачивает веб-страницы, а затем сжимает их и передает на сервера Google. При этом краулер переходит по ссылкам, которые размещены на странице, сканируя и их.

При сканировании в первую очередь обрабатываются страницы высшего уровня, так как предполагается, что именно они наиболее значимые на сайте. Затем Google-бот поэтапно переходит на более низкие уровни.

Google-бот учитывает настройки на сайте и обрабатывает те страницы и ссылки, которые не запрещены для индексации. Однако даже если запрет на индексацию определенной страницы прописан в файле robots.txt, она все равно может попасть в результаты выдачи Google. Поэтому для более надежного закрытия от индексации предпочтительнее добавить в HTML-код страницы атрибут noindex либо прописать заголовок noindex в запросе HTTP.

Частота сканирования Google-ботом определяется им самостоятельно, процесс занимает от нескольких дней до нескольких недель. Можно запрашивать повторное сканирование для отдельных страниц либо всего сайта.

При подготовке материала использовались источники:
https://wiki.rookee.ru/google/
https://dic.academic.ru/dic.nsf/ruwiki/1268816
https://serpstat.com/ru/blog/kak-ustroen-poisk-google/