Социализируемся

Я в Google+ Я в Twitter Я в Facebook

Tuesday, December 21, 2010

Семантическая разметка. Инструменты. Микроформаты в жизни.

Яндекс.Вебмастер представил валидатор микроразметки

2010-12-20 12:27

Яндекс.Вебмастер сообщил о появлении нового инструмента – валидатора микроразметки, предназначенного для того, чтобы облегчить владельцам сайтов работу с разметкой страниц микроформатами. С помощью нового инструмента можно проверить, как поисковый робот Яндекса видит и обрабатывает семантическую разметку той или иной страницы, а также выяснить, есть ли в коде разметки ошибки, которые могут помешать корректной обработке данных.

Микроформаты – это стандарт семантической разметки, разработанный специально для структурирования информации на странице для программ-обработчиков. Микроформаты позволяют указать поисковому роботу на смысловое значение отдельных фрагментов страницы и используются для передачи сведений об организации, товарах, отзывах, рецептах.

Сейчас Яндекс поддерживает четыре вида микроформатов:

  •  hCard - формат разметки контактной информации (адресов, телефонов и т.д. Довольно старый и хорошо зарекомендовавший себя стандарт. Входит в состав рекомендованных к использованию консорциумом W3C для Semantic Web. Полезен для указания на странице контактной информации о фирме и т.п.

  •  hRecipe - формат для описания кулинарных рецептов. Стандарт довольно новый. Используется очень редко (по моим наблюдениям ИМХО). В состав рекомендованных к использованию консорциумом W3C для Semantic Web не входит, хотя стандарты, пополняющие список рекомендаций консорциума, становятся стандартами "де факто". Поэтому при определенной популярности он таковым может стать. Гугл его поддерживает, но для рецептов он также поддерживает еще ряд стандартов.



Также поддерживается microdata – международный стандарт семантической разметки, позволяющий с помощью атрибутов описать смысл информации, содержащейся в HTML-коде страниц. Такие атрибуты позволяют роботам-обработчикам находить и извлекать нужные данные. Про этот стандарт слышу впервые...Погуглив немного выясняем - микроданные как стандарт де-юре еще не приняты - на сайте консорциума W3C есть документ от 19 октября 2010 года - Рабочий проект HTML Microdata, поэтому мной ранее не рассматривались. Будет принят по всей видимости "де-факто".

(Подробнее про микроданные для Google-Yahoo!-Bing июнь 2011.)

В настоящий момент в Яндексе микроданные используются для разметки словарных и энциклопедических статей, терминов и определений.

Подробнее узнать о том, какие данные можно передать Яндексу, можно на странице «Передача данных о содержимом сайта». А о микроформатах и микроданных можно прочесть в разделе Помощи.

Ссылка про все микроформаты (eng).

По этому поводу следует заметить, что Google уже давно поддерживает микроформаты, а также семантическую разметку RDFa, и по своему движению более приближен к общей тенденции Semantic Web. Рано или поздно Яндекс перейдет на поддержку и RDFa. Подробнее об использовании микроформатов для индексатора Гугл можно прочитать в его справке, а проверить страницы можно при помощи Google Web Master Tools. Список микроформатов, используемых роботами Google несколько отличается от Яндекса и более широк.

Проблема же заключается в том, что когда сайт создается "ручками", внедрить микроформаты просто, однако очень трудоемко. На сегодняшний день пока нет инструментария для автоматизированного добавления микроформатов в текст html-кода. Вторая проблема - большинство веб-разработчиков пользуется CMS, что естественно облегчает работу, однако не позволяет работать с html-кодом, либо внедрение микроформатов еще более усложняется. Поэтому большинство разработчиков с микроформатами "не заморачивается".

О пользе использования микроформатов и RDF говорить не приходится - используя их уже лет семь-восемь, могу сказать, что сайт и раскручивается быстрее, и повышается релевантность поиска, позиционирование его в результатах.

Стоит также дополнить список микроформатов, которые следует использовать веб-мастерам для улучшения позиционирования и распознавания поисковыми роботами своего сайта (в свете движения к Semantic Web):
  • - основа основ - стандарт Dublin Core
  • - очень широко используемый стандарт Topic Maps (XMT) – стандарт ISO (ISO/IEC 13250:2003) для представления и обмена знаниями с точки зрения поиска информации
  • vCard - аналог hCard
  • - формат FOAF - информация о людях и их "дружественных отношениях".
  • - ну и главный формат описания ресурсов - RDF - RDFa. Надо добавить, что поддержка RDFa включена в стандарт HTML5

Подробнее про общий принцип построения Semantic Web и увидеть более полный перечень микроформатов можно в разделе 5. Метаданные в статье "SEMANTIC WEB КАК НОВАЯ МОДЕЛЬ ИНФОРМАЦИОННОГО ПРОСТРАНСТВА ИНТЕРНЕТ" (см. в Разделе "Публикации" блога за 2008 г.).

За саму новость спасибо сайту searchengines.ru   Дополнения-размышлизмы мои :).

Даешь RDF в массы! Автоматизацию семантической разметки - в каждый компьютер! Все дружно на построение светлого Semantic Web будущего! :))


    

Регистрация кириллических доменов!

Сегодня, 21 декабря 2010 года, началась свободная регистрация кириллических доменов com.ua/kiev.ua. Это значит, что такие домены могут зарегистрировать все желающие, а процесс регистрации ничем не будет отличаться от процесса регистрации обычных латинских доменов com.ua и kiev.ua.

Читать дальше

    

Saturday, December 18, 2010

Новый вид фильтрации у Google

И снова вспоминается классика - идеи летают в воздухе, их надо только быстро подхватить...

Идея и алгоритм, которую так долго обговаривали и прорабатывали у нас - гугл взял да и реализовал... Правда частично, но они на правильном пути. Им, естественно это проще...


Google фильтрует результаты по уровню читаемости


2010-12-14 12:37


Google добавил новый фильтр для поисковых результатов, который может помочь расположить результаты в соответствии с уровнем сложности текста. По словам представителя Google, этот фильтр может быть полезен различным категориям пользователей, в частности, учителям, которые хотят найти материалы различного уровня сложности.

(Про  уровни читабельности-сложности текстов написано в статье Рогушиной Ю.В. "ИСПОЛЬЗОВАНИЕ КРИТЕРИЕВ ОЦЕНКИ УДОБОЧИТАЕМОСТИ ТЕКСТА ДЛЯ ПОИСКА ИНФОРМАЦИИ, СООТВЕТСТВУЮЩЕЙ РЕАЛЬНЫМ ПОТРЕБНОСТЯМ ПОЛЬЗОВАТЕЛЯ", источник eprints.isofts.kiev.ua/235/1/Рогушина_1.doc, и поскольку я принимала участие в тестировании этих критериев, могу сказать, что гугл поленился - их решение слишком упрощенное... А идея очень хорошая и дает неплохие результаты. Статья 2-х или даже 3-х годичной давности.)

Кроме фильтрации сайтов, инструмент позволяет пользователям сравнить уровень читаемости различных документов, выбрав опцию «указать уровень читаемости» ("annotate results with reading levels") и введя имя домена в форму.

Технология, позволяющая делить весь контент на три категории: от «базовой» до «продвинутой», была разработана при участии педагогов, которые разделили тексты на три категории и создали определенную базу, на основании которой была выведена статистическая модель и алгоритм определения сложности текста.

По материалам CNet News

Жаль, что у нашей науки средств на это нету... :(

Friday, December 10, 2010

Обучение программированию

В области образования хорошие 2 статьи:

Do We Need A New Teaching Programming Language

Four Key Concepts of Computer Programming

Особенно стоит прочитать комментарии, где более полно охвачены вопросы важных аспектов в программировании, ну и узнать про опыт других....

 

chrome-os-and-Android-news

Технологические новости:

1. Про Google Chrome OS, новый ноут от гугла, Андроид. Вопрос про работу Chrome OS без интернета - продемонстрировали работу Google Docs в оф-лайне. Также часть ПО с Chrome Web Store работает без интернет-соединения. "Chrome OS & Android: what next? Chrome OS and Android: Questions, Questions, and More Questions" Читать оригинал (анг.)

2.Android vs iOS: A Developer’s Perspective

Антивирусная защита

После последней недавней борьбы с вирусом продолжаю уделять внимание антивирусной защите. Нашла еще один антивирус: eScan Antivirus (AV). Есть куча продаваемых версий (кстати, цена не очень высокая в сравнении с Нортон-антивирусом). Замечательно, что есть бесплатная утилита, которую можно загрузить и проверить компьютер в случае необходимости.

По рейтингу антивирусного ПО этот производитель занимает неплохие позиции, уровень доверия к нему велик.
Free eScan AntiVirus Toolkit Utility (MWAV) производит сканирование на предмет наличия вирусов, шпионского ПО и чистки. Не требует инсталляции на комп, запускается с USB Drive или CD ROM, не зависит от установленного уже на компе антивирусного ПО. Поддерживает Windows Vista, Windows 7 & Windows 2008 (32 & 64 bit OS compatible), Microsoft Windows 2000, XP.
------------------------------------
К сожалению, не существует глобальной системы оповещения пользователей об опасности тех или иных сайтов, хотя есть много систем, которые ведут рейтинги безопасности сайтов. Их "аудитория" - в основном пользователи специальных плагинов для браузеров (например, siteadvisor или mywot) и пользователи некоторых браузеров (наиболее полноценную защиту обеспечивают firefox и chrome, поскольку используют технологию google safebrowsing, проверяющую сайты и на вирусы с эксплоитами и на фишинг, остальные браузеры в основном проверяют лишь на фишинг). Плагины более практичны поскольку дают больше информации, хотя пользование вышеупомянутыми браузерами тоже очень повышает уровень безопасности. В общем очень полезно пользоваться чем-нибудь из вышеупомянутого и соответственно туда сообщить об найденных вами опасных сайтах.

Также, сообщить о противоправном содержании сайтов можно в Центр Безопасного Рунета http://www.saferunet.ru/hotline/content.php

Бороться со спамом в е-мейлах тоже можно. Хорошую рекомендацию дают тут: Куда посылать жалобу на спам?

Кстати, недавно плагин mywot спас и меня от посещения одного сайта, распространяющего вирусы. На сайт зайти - зашла, он был "новенький" - т.е. с незапятнанной репутацией, поэтому броузер меня пустил. А закрыть окно броузера я уже не смогла - вываливались скрипты, любая попытка закрыть броузер сопровождалась джаваскриптовыми "предупреждениями" о том, что покидать этот сайт нельзя - "у Вас вирусы". Выкрутилась - поставила сайту "красный" рейтинг при помощи плагина mywot, и он меня спас - дал возможность закрыть окно броузера с этим сайтом.

------------------------------------
И еще про безопасность можно почитать тут

SEO-analysis

Совершенно случайно попала на несколько ресурсов по раскрутке и анализу сайтов.
Времени изучать пока нету, оригиналы на анг. языке:
http://www.aboutus.org/Learn/Search-Engine-Optimization
на сайте есть он-лайн Online Visibility Audit, море рекомендаций, можно посмотреть Site Metrics. Дан набор Free SEO Tools

Статьи:
Will your sales page convert?
Find out if your sales page converts as it should or if it should be improved drastically - see 5 basic questions to guide you on this matter.

Design your website for conversion
If you consciously design your site to turn these visitors into customers, you can dramatically increase the number of visitors who 'convert' – that is, make a purchase or perform some other action you desire.

Sunday, December 5, 2010

OSTIS-2011

Открытые семантические технологии проектирования интеллектуальных систем – OSTIS-2011

Источник: http://shcherbak.net/2010/11/otkrytye-semanticheskie-texnologii-proektirovaniya-intellektualnyx-sistem-ostis-2011/

10-12 февраля 2011 года пройдет международная научно-техническая конференция "Open Semantic Technologies for Intelligent Systems – OSTIS-2011" в Минске, Республика Белорусь.

ВАЖНО - до 1 декабря подача тезисов!!! Участие бесплатное


Организаторы мероприятия довольно лояльны, так что в принципе, еще можно успеть зарегистрироваться.

По организационным вопросам можно обращаться к  Щербаку Сергею по почте: ontolog[@]gmail.com, так и непосредственно к организаторам на сайте OSTIS.

Тема конференции
Разработка комплекса согласованных технологий, ориентированных на проектирование различных компонентов и различных классов практически полезных интеллектуальных систем, имеющих как можно более длительный жизненный цикл и большее количество пользователей. При этом указанный комплекс технологий должен обеспечивать:
  • совместимость и интегрируемость проектируемых интеллектуальных систем и их компонентов;
  • сокращение сроков проектирования интеллектуальных систем на основе библиотек типовых совместимых компонентов;
  • ориентацию на семантическое представление знаний;
  • независимость технологий от функциональности интеллектуальных систем и областей их применения;
  • независимость технологий от многообразия платформ реализации проектируемых интеллектуальных систем;
  • открытый характер и доступность технологий для широкого круга разработчиков, что должно обеспечить возможность быстрого прототипирования интеллектуальных систем силами экспертов без участия специалистов в области искусственного интеллекта;
  • совместимость и интегрируемость самих технологий, входящих в состав комплекса;
  • открытый характер не только использования технологий, но и их развития в рамках открытого проекта.
Вопросы, выносимые на обсуждение
  • Проблема интеграции интеллектуальных систем и их компонентов, решение которой лежит в основе создания технологии компонентного (модульного) проектирования интеллектуальных систем. Семантические сети как формальная основа решения проблемы интеграции интеллектуальных систем.
  • Проблема независимости технологий проектирования интеллектуальных систем от различных платформ и вариантов их реализации, включая использование специальных компьютеров. Абстрактные модели интеллектуальных систем, являющиеся инвариантами различных способов их реализации.
  • Состав комплекса совместимых технологий компонентного проектирования интеллектуальных систем.
  • Технология компонентного проектирования баз знаний на основе семантических сетей.
  • Технология компонентного проектирования программ различных языков программирования, ориентированных на обработку семантических сетей.
  • Технология компонентного проектирования нейронных сетей, ориентированных на обработку баз знаний, представленных семантическими сетями.
  • Программная и аппаратная реализация языков программирования, ориентированных на обработку семантических сетей на разных платформах.
  • Технология компонентного проектирования средств навигации и интеллектуального поиска в семантическом пространстве.
  • Технология компонентного проектирования интеллектуальных решателей задач, построенных на основе семантических сетей.
  • Технология компонентного проектирования гипермедийных пользовательских интерфейсов интеллектуальных систем, основанных на семантических сетях.
  • Проблема совместимости и интеграции самих технологий, ориентированных на проектирование различных компонентов или различных классов интеллектуальных систем.
  • Прикладные интеллектуальные системы, построенные на основе семантических сетей.
  • Инфраструктура и менеджмент открытого проекта по созданию комплексной массовой технологии компонентного проектирования интеллектуальных систем, основанных на семантических сетях.

Цель конференции
Организовать конструктивное сотрудничество, направленное на создание комплекса согласованных технологий, ориентированных на проектирование интеллектуальных систем, не зависящих от функциональности и областей применения проектируемых систем и позволяющих в ближайшей, а не в далекой перспективе быстро создавать не только прототипы практически полезных интеллектуальных систем, но и сами эти системы, имеющие как можно более длительный жизненный цикл и как можно большее количество пользователей.

Формат и организация проведения конференции

В соответствии с указанной целью конференция будет проводиться следующим образом.
  • Конференция не разбивается на секции. Предполагаются пленарные и стендовые доклады;
  • Конференция будет проходить в стиле круглого стола. В основе программы конференции лежит последовательность принятых к обсуждению вопросов, по некоторым из которых планируется заслушивание пленарных докладов;
  • Конференция начинается с обсуждения уточнения программы конференции, и заканчивается обсуждением перспектив и направлений сотрудничества;
  • Труды конференции будут розданы во время регистрации, но авторы опубликованных докладов дополнительно получат электронные варианты трудов за 2 недели до начала конференции для того, чтобы подготовиться к обсуждению опубликованных докладов;
  • Участие в конференции бесплатное;
  • Объем принимаемых к публикации докладов не ограничивается;
  • Рабочие языки конференции русский и английский.
Регистрация участников конференции
осуществляется на сайте по ссылке.

Требования к оформлению и представлению докладов
смотрите на сайте конференции по ссылке.

Основные даты

  • Прием докладов до 1 декабря 2010
  • Отбор докладов до 1 января 2011
  • Рассылка приглашений на конференцию до 15 января 2011
  • Формирование программы конференции до 1 февраля 2011
  • Публикация трудов конференции до 10 февраля 2011

Saturday, December 4, 2010

Зима іде - свята веде

Як завжди, перед святами, ми згадуємо про наш найулюбленіший сімейний відпочинок - у музеї українського народного декоративного мистецтва, а там вже і розклад на сайті є:



Національний музей українського народного декоративного мистецтва запрошує на
щосуботні майстер-класи за програмою:

"Зима іде - свята веде"

План-графік майстер-класів на грудень 2010 року:


4.12.10 -       «Бісерні фантазії зими»
   Проводить Оксана Садіоглу.
5.12.10 -       «Бісерні фантазії зими»
   Проводить Оксана Садіоглу.
11.12.10 -       «Святий Миколайчик». Витинанка.
   Проводить Валерія Скок.
18.12.10 -       «Зірочка». Соломка.
   Проводить Мирослава Татарчук.
25.12.10 -       «Зимові візерунки на склі».
   Проводить Мирослава Татарчук.
           Обов’язковий попередній запис за телефоном: 280-36-93.



Наші координати: 01015, Київ, вул. Лаврська, 5, корпус 29
(У приміщенні Національного музею українського народного декоративного мистецтва);
e-mail: novmuz@ukr.net
Їхати від ст.м. “Арсенальна” трол. №38, авт №24 до зупинки “Києво-Печерський заповідник”


Музей працює з 10-00 до 18-00
Вихідний день – вівторок
Перший понеділок місяця – день відкритих дверей



Джерело: http://mundm.kiev.ua/MISCELL/MCSHEDL.HTM

Час готуватися до новорічних свят!

Популярное

Использование материалов сайта

Информация, представленная на сайте, может свободно использоваться и распространяться при обязательном указании активной прямой ссылки на сайт http://in-search-of-semantics.blogspot.com/, а тексты научных статей – при указании авторства и ссылки на бумажную публикацию.

При размещении текстов статей на своих сайтах, блогах и пр., пожалуйста, присылайте ссылки.
Комментарии перед публикацией предварительно модерируются.

Хотите сказать спасибо автору? Не откажусь :) - Поставьте ретвит на пост, или другую социальную закладку. Спасибо.