Архивы метки: индексация

Как Google индексирует страницы?

go-google-300x286Чтобы продвинуть сайт в верхние позиции в Google, хорошо бы знать, как Google индексирует ваши веб-страницы. Мы не будем сейчас говорить о PageRank, а рассмотрим саму индексацию.
Итак, индексация под микроскопом.

Для чего нужны индексы
Каждое слово, которое вы набираете в строке поиска, содержится в сотнях, а то и в миллионах документах, — это зависит от популярности самого слова. Если бы не индексация, то даже на самых современных серверах на работу по отбору документов, в которых это слово встречается, ушли бы часы работы. Поэтому главной задачей индексации, или построения индексов, является увеличение скорости поиска. Чтобы понять принцип индексации, проведем аналогию с библиотекой. Итак, вы пришли в библиотеку, и вам надо найти нужную книгу. Если перебирать все книги подряд, книга за книгой, на это уйдет очень много времени. Другой вариант — обратитьcя к картотеке (к индексу) — буквально за минуты вы найдете нужную книгу, ее расположение на полке.  Читать далее →

Топ 1000 способов увеличения производительности SQL (часть 2)

myadsИ так обещаное продолжение статьи: 1000 способов увеличения производительности SQL (часть 1).

Способы улучшения производительности SQL:

  1. Проводить тестирование (benchmarking);
  2. Поскольку Ваши данные данные добавляются, индексация может измениться (количество элементов и изменение селективности):
  3. Структурирование может хотеть измениться. Сделайте свою схему столь же модульной. Сделайте свою схему данных способным измериться; Читать далее →

Google начнет индексировать аудиофайлы как текст?

Google в ближайшем будущем, возможно, начнет индексировать аудиофайлы. Такой топик был накануне заведен на форуме WebmasterWorld его администратором Tedster’ом.
Такое предположение он основывает на недавнем заявлении Google о том, что он научился аутоматически транскрибировать из потока речи в текст и индексировать этот контент.

Правда, Google говорил только о видеороликах кандидатов в президенты США. Команда Google разработала технологии распознавания речи, благодаря которым автоматически транскрибировала их в текст и индексировала. Таким образом, стал возможным поиск не только по содержимому title и description видеороликов, но и по самому контенту. Причем эта технология даже позволяет не просматривать все видео, а сразу оказываться на наиболее релевантных запросу частях ролика.

Но если Google начнет применять эту технологию по отношению к аудиофайлам, MP3, любому видео и мультимедиа-контентнту, это станет настоящим козырем в руках поискового гиганта.

Распознаванием голоса Google вплотную занялся еще в апреле 2007 года, когда была запущена технология распознавания голоса по телефону Google Voice Local Search. Пользователи могли получить справочную информацию о различных локальных (по США) объектах или услугах.
Преимущество технологии в том, что пользователю не нужен компьютер и интернет, достаточно сделать бесплатный звонок на указанный Google номер и его соединят с нужными людьми или скинут SMS-сообщение с подробной информацией или даже картой местности.

Google давно уже делает шаги к улучшению возможностей индексации нетекстового контента. Так, около полугода назад компания запатентовала технологию поиска по тексту в изображениях — “Recognizing Text In Images”. Новая технология может как распознавать ключевые слова на изображении, так и выделять группы связанных слов и сопоставлять их с описанием картинки.

Top