| | | No. 310-базовый
| | | ЯНДЕКС ПРИОБРЕЛ ТЕХНОЛОГИЮ ПОНИМАНИЯ СМЫСЛА ТЕКСТА | | | | | ОТ РЕДАКТОРА | | Здравствуйте, уважаемые читатели!
Вчера, 29 января, отмечался Международный день защиты персональных данных. "Именно в этот день в 2008 году прошла первая конференция Data Privacy Day, в рамках которой обсуждалось внедрение образовательных программ, помогающих простым пользователям разобраться во всех сложностях использования интернета. В 2009 году правительство США объявило 28 января Международным днем защиты персональных данных", - сообщает Infox.ru. | | Google отметил этот праздник публикацией в корпоративном блоге принципов обращения с приватными данными пользователей, которых придерживается компания. Google заявил, что использует такую информацию с целью разработки ценных и полезных продуктов, продукты эти, в свою очередь, работают так, чтобы данные были в безопасности, сам процесс сбора данных является прозрачным для пользователя, причем последний может настроить ограничения на сбор информации.
Поисковые системы – в частности, Google и Яндекс - собирают персональные данные пользователей для множества целей, но среди них для нас самые интересные – это таргетинг рекламы, а также персонализация и качество поиска. Используются для этого как поведенческие, так и демографические данные о пользователях. Среди источников персональных данных присутствуют - тулбары, устанавливаемые пользователем, а также другой софт (Google Chrome)
- системы статистики, которые принадлежат сервису или с которыми он заключил договоренность
- профайлы пользователей, зарегистрированных в «социальных» сервисах портала
- аналогичная информация, купленная у других социальных сервисов
- история поисковых запросов, переходов с поиска и веб-серфинга
В прошлом номере рассылки мы упоминали, что информация о поведении пользователя на странице с текстом может использоваться для понимания качества текста, для определения, является ли он «текстом для людей» или «seo-текстом». Это тоже пример использования поведенческих данных для работы над качеством поиска. На одном из семинаров представители Яндекса рассказывали о том, как компания использует поведенческие данные. Семинар проходил полтора года назад, с того момента Яндекс мог продвинуться дальше в изучении пользовательского поведения. Однако, не стоит упускать из внимания тот факт, что если поведенческие факторы и используются в ранжировании страниц, то достаточно сложным и неочевидным образом, в совокупности с большим количеством других факторов. Что касается персонализации поиска и использования для этого демографических и поведенческих данных – активности Яндекса на этом направлении пока не замечено. Что, конечно, не говорит о том, что ее нет, а говорит скорее о различных политиках коммуникации. У Яндекса тоже есть сервис записи и просмотра истории поисковых запросов. Google активно рассказывает о своих экспериментах в области персонализации поиска (в частности, недавно мы писали о том, что персонализация результатов стала работать и для пользователей, не залогиненных в Google) – однако, западные SEO-специалисты считают, что персонализация не слишком сильно влияет на облик поисковой выдачи, у разных людей персонализированная выдача по одному запросу различается не очень значительно. Буквально на днях Google сделала еще один шаг к персонализации выдачи на основе личной интернет-активности. Технология Google Social Search перешла в стадию открытого тестирования. Теперь в выдаче пользователей, залогиненных в Google, внизу появится еще один блок – «Results from people in your social circle». В нем будут содержаться соответствующие запросу посты из блогов и микроблогов «френдов» пользователя на разных сервисах. При поиске по картинкам тоже будут находиться изображения из блогов друзей. «Социальный круг» в глазах Google – это контакты из Твиттера, Facebook, Google Reader, Gmail, а также из тех сервисов, которые пользователь сам добавит в свой Google-профайл. Персональные данные собирают и используют не только поисковики и рекламные системы, но и многие другие сайты и сервисы, например, электронные магазины. Они оперируют в основном личными данными – имя, фамилия, электронный и физический адрес пользователя и т.д. Использование такой информации в нашей стране регулируется законом РФ « О персональных данных» от 27 июля 2006 года. В 2009 году к нему был принят ряд поправок, а в 2010 депутат Анатолий Аксаков собирается предложить новые изменения. «Пока в законе недостаточно регламентировано или не прописано вовсе получение ПД от третьих лиц, трансграничная передача ПД и использование web-технологий», - считает он. О том, какие последствия для интернет-магазинов вытекают из законодательства о персональных данных, рассказывал в 2009 году на конференции «Электронная торговля» Михаил Яценко. Презентацию можно посмотреть здесь. То, что сервисы научились использовать поведенческую, личную, социально-демографическую информацию о пользователях для собственного развития и улучшения – это скорее благо для Интернета в целом. Однако, мы рекомендуем вам не слишком щедро делиться с сайтами персональной информацией. И в свою очередь экологично использовать чужие данные, если у вас есть сервис, который их собирает. | | | НОВОСТИ: ГЛАВНОЕ ЗА НЕДЕЛЮ | | Яндекс приобрел синтаксический анализатор текста Компания Cognitive Technologies объявила о том, что Яндекс приобрел у нее программный комплекс, включающий возможности синтаксического анализа текста. «Анализатор позволяет определить, какими синтаксическими отношениями связаны слова предложения. Это может звучать неожиданно, но для понимания текста эта информация гораздо важнее, чем значение отдельных слов», – сообщается в пресс-релизе Cognitive Technologies. «Использование синтаксического анализатора для больших корпусов текста позволяет определять и изучать статистические закономерности языка (встречаемость слов и конструкций). Такого рода закономерности могут быть использованы, в частности, при разрешении неоднозначностей (например «ключ упал на пол» и «в камнях забил ключ»), возникающих во время синтаксического разбора, а также при построении статистических моделей языка для распознавания слитной речи».
Среди продуктов Cognitive Technologies есть система определения авторства документа, работающая на основе этого программного комплекса. Можно предположить, что его приобретение поможет Яндексу приблизиться к решению ряда проблем качества поиска. Rambler стал кроссовками-пустословами Дизайнер Рикардо Насименто создал модель кроссовок со встроенным датчиком давления на подошве и назвал их Rambler. Кроссовки автоматически постят в Твиттер своего владельца слово tap, если он делает шаг, и точку, если стоит на месте. Идея кроссовок иронически обыгрывает тот факт, что большинство сообщений в микроблогах представляют собой мало кому интересную информацию о повседневно-бытовой активности владельца. Слово «Rambler» имеет несколько вариантов перевода, среди них – «турист», «бродяга», «болтун», «пустослов». ROMIR исследовал онлайн-торговлю По итогам 2009 года количество россиян, приобретавших товары онлайн, возросло на 8% и составило 70% посетителей сайтов Интернет-магазинов, - сообщает исследовательский холдинг ROMIR, выпустивший на этой неделе сразу два исследования, посвященные покупкам в Интернете. 90% людей, которым был задан вопрос «планируете ли вы в будущем приобретать товары через Интернет», ответили на него положительно. Основным преимуществом интернет-магазинов 68% опрошенных считают возможность сэкономить время, 60% - возможность найти товар, отсутствующий в оффлайновых магазнах, 54% уверены, что цены в Интернете ниже, а 52% ценят доставку на дом. Интересно, что в 2008 году важность ценового фактора отметили на 11% больше респондентов (65% от общего числа). Что касается недостатков интернет-магазинов – половине опрошенных не хватает информации о товаре, а каждый третий остался недоволен доставкой. Владельцам интернет-магазинов стоит обратить внимание на эти цифры. | | | РЕКОМЕНДУЕМ ПРОЧЕСТЬ | | Александр Люстик пишет о получении с "Яндекс.Карт" целевого коммерческого трафика по адресам компаний. Получить такой трафик поможет вкладка "Адреса и Организации" в сервисе Яндекс.Вебмастер: указанная в ней контактная информация используется при поиске организаций в "Яндекс.Картах". ***** В русскоязычном блоге Google опубликован перевод рассказа Стивена Бейкера о том, как Google узнает, обрабатывает и использует при поиске синонимы слов. Синонимы влияют на выполнение 70% поисковых запросов, осуществляемых на сотне языков, поддерживаемых Google. Когда инженеры компании проанализировали точность подбора синонимов, оказалось, что на каждые 50 запросов, для которых использование синонимов существенно улучшало результаты поиска, только в одном случае наблюдался отрицательный эффект. ***** Интернет-магазин внутри баннера: описание технологии на Хабрахабре ***** Дэнни Салливан дает Биллу Гейтсу советы по поисковой оптимизации его блога. Салливан считает, что отсутствие этого блога в десятке Google и Bing по запросу "bill gates blog" - это повод принять меры: прописать title для всех страниц, description, добавить в название слово "официальный" (чтобы пользователям было понятно, что именно это - настоящий, правильный блог Гейтса), поменять описание в каталогах, убрать дубликаты страниц, и так далее. | | | КАК ЗАДАТЬ ВОПРОС ЭКСПЕРТАМ? | | Cтатьи, исследования, экспертные ответы в рассылке "Продвижение сайта. Профессиональные советы экспертов" будут посвящены, прежде всего, тому, что больше интересует вас, наших подписчиков.
Присылайте свои вопросы и пожелания по адресу subscribe@ashmanov.com. Успехов вам! Выпуск подготовила Кудрявцева Людмила "Ашманов и Партнеры" | | | СПИСОК ЭКСПЕРТОВ | АРХИВ журнала "Продвижение сайтов" | СБОРНИКИ ДОКЛАДОВ Copyright 2003-2009 'Ашманов и Партнеры' При копировании или цитировании материалов обязательна ссылка на www.optimization.ru/subscribe. Компания 'Ашманов и Партнеры' - услуги, проекты, статьи Семинары по оптимизации и продвижению сайтов Сайт-Аудитор: бесплатная программа для поисковой оптимизации
| | | |