Социализируемся

Я в Google+ Я в Twitter Я в Facebook

Showing posts with label Information Retrieval. Show all posts
Showing posts with label Information Retrieval. Show all posts

Tuesday, May 22, 2012

Социальные сети как источник информации

    Презентация "Социальные сети как источник информации для пополнения онтологий и персонализации семантического поиска"
XІI международная научная конференция ИАИ -2012 им.Т.А.Таран


Monday, May 21, 2012

About Google Knowledge Graph

    Итак, Гугл анонсировал Граф Знаний от Гугла - Google Knowledge Graph, знакомьтесь:

Для нас (в рунете) увы пока еще эту опцию не включили, но уже можно ознакомиться по картинкам в презентации и статье Майка Бергмана, каким теперь будет страница с поисковыми результатами.



Ну и на закуску:
Deconstructing the Google Knowledge Graph Майка Бергмана - разбор Графа Знаний (на англ)

Как видим, страница поиска будет расширена добавлением блоков результатов по сущностям, выделенным из поискового запроса, из Википедии, Freebase, Factbook и еще нескольких источников.

Майк Бергман выделил пока только такой скудный список базовых сущностей (типов):

Entity types that I observed were in these categories:
  • People
  • Chemical Compounds
  • Directors
  • Some Companies
  • Some National Parks
  • Places
  • Musicians/Musical Groups
  • Actors
  • Some Government Agencies
  • Many Local Businesses
  • Animals
  • Movies
  • Albums
  • Notable Landmarks
  • Who Knows What Else

Entity types that I expected to see, but did not find include:
  • Products
  • Most Companies
  • Who Knows What Else
  • Songs
  • Most Government Agencies
  • Concepts
  • Non-government Organizations

Пока оценить такую страницу можно только пройдя по этой ссылке:

Полностью поддерживаю Майка Бергмана в его мнении:
Welcome to the semantic technology space, Google! I look forward to learning much from you.

Добро пожаловать, Гугл, в мир семантических технологий! С нетерпением жду, чтобы побольше изучить и узнать у тебя! :)

Ну и попроще объяснение про Google Knowledge Graph для бизнеса и SEO. (тоже англ)

Google Translate вам в помощь, guys! :)

Thursday, October 27, 2011

SEO Conferences materials

В последнее время многое поменялось в SEO, и об этом стоит узнать из материалов прошедших только что конференций по поисковой оптимизации.

   29 сентября, в Казанском IT-парке прошла вторая конференция по поисковой оптимизации SEO Conference 2011. Краткий отчет день 1 -- день 2


14-15 октября 2011 года в г. Харькове прошла  третья Всеукраинская Конференция «Поисковая оптимизация и продвижение сайтов в сети Интернет» Optimization.com.ua. Краткий отчет день 1 -- день 2

Из доклада Александра Люстика (LegatoSoft)  <Заработать на 1 сайте MFA за полгода 5000$>.

Что нужно сделать?
  • - Определиться с тематикой
  • - Определиться со свободной нишей
  • - Найти интересный материал
  • - Оформить и предоставить пользователям
  • - Загнать в индекс максимум страниц
  • - Собрать первичную статистику запросов
  • - Проработать внутреннюю перелинковку
  • - Каждый месяц повторять

Каковы затраты? 50 баксов за полгода потрачены на внешние ссылки. А результат вот какой - средний CTR страницы 8,73.

Александр Люстик: <Неужели все так просто? Не совсем. Все это вы могли бы выполнять со своим сайтом, но вы не делаете. Вы ведь не оптимизируете код, не прописываете ключевые слова: Сколько из вас делают со своими сайтами все перечисленные стадии оптимизации? Сколько у вас сайтов? Три? Тогда верю!>.


Из выступления Джиллиан Мьюсиг (Gillian Muessig), основатель и президент компании SEOmoz
Вывод: Меняется поисковая система - меняется и оптимизация. Техническая оптимизация - ключевые слова, структура сайта, ссылки, - эта оптимизация умерла в 2008 году.

В конце своего выступления Джиллиан дала несколько советов оптимизаторам на следующий месяц:
  • 10. SocialRank становится более важным, чем PageRank.
  • 9. Инфографика. Возьмите сложную тему и объясните ее с помощью картинок.
  • 8. Видео собирает очень много кликов, если среди ответов есть видео, то все больше людей выбирают именно его.
  • 7. Брендинг опять очень важен - хотя бы в поисковых подсказках.
  • 6. Работайте с социальными сетями, но не пытайтесь сразу там продавать. Например, можно задать необычный вопрос на странице бренда. Или можно учесть мнение пользователей и рассказать им об этом.
  • 5. Предлагайте оставить отзывы.
  • 4. Устанавливайте связи со своими пользователями в социальных сетях. Вовлекайте их в общение с вами.
  • 3. Играйте! Раздавайте баллы и очки, позволяйте людям переходить на новые уровни. Люди любят играть, это очень цепляет.
  • 2. Лидер в отрасли становится лидером по CTR.
  • 1. Сотрудничайте с лидерами!

Из выступления Джима Бойкина (Jim Boykin, Internet Marketing Ninjas, США), - как работать в условиях алгоритма Панда.
  • Если пользователи проводят на вашей странице меньше 15 секунд - у вас проблемы.
  • Если пользователи не ходят по вашему сайту, сразу закрывая его - у вас тоже проблемы.
  • Если пользователи не возвращаются на ваш сайт - это плохо.
  • А вот показатель отказов - сложный фактор. Важно, нашел ли пользователь ответ на свой вопрос, перед тем, как закрыть страницу.
  • Все довольные пользователи одинаковы. Они уходят с Google и ходят по сайту, на который перешли.
Если ваш сайт затронут Пандой - возможно, вам поможет активность в социальных медиа, социальные сигналы. Если вы думаете, что ваши сайты не затронуты Пандой - возможно, вы просто недостаточно хорошо проанализировали ситуацию.
Решения от Джима Бойкина:
  • - Изучайте Google Analitycs.
  • - Работайте с картой кликов и с картой движения мыши на сайте.
  • - Анализируйте, какие разделы пострадали больше - они тянут вниз остальные. Уберите их.
  • - Безжалостно удаляйте дубли.
  • - Сморите на страницы с точки зрения пользователя. Пользователи не должны думать.
  • - Поменяйте дизайн. Контент и юзабилити - самые важные факторы для борьбы с Пандой.
Юрий Кушнеров, (SeoLib.ru, Украина) представил доклад на тему «Влияние социальных сигналов (Twitter, Google +1, Facebook, Vkontakte) на поисковую выдачу Google.com.ua и Yandex.ua».
Обе поисковые системы Google и Yandex любят Facebook, а вот кнопки Одноклассников у лидеров почти нет. «Прокачанность» же Твиттера никак не влияет на выдачу. По крайней мере пока.
Все это не значит, что если вы поставите себе кнопки - вы подрастете в выдаче. Вполне возможно, что зависимость очень косвенная или даже обратная. Кроме того, большое количество кнопок может тормозить загрузку, поэтому надо относиться к их установке разумно.

16 октября 2011 г. в Киеве также состоялся SEMCamp  - – Первая конференция по интернет-продвижению продуктов и услуг на зарубежные рынки. В рамках мероприятия были освещены принципы и специфика работы с зарубежной аудиторией, особенности поисковой оптимизации и контекстной рекламы для зарубежных рынков, вопросы веб-аналитики, юзабилити сайтов и способы улучшения конверсии уже существующих интернет-кампаний. Краткий отчет Часть 1 и Часть 2.

Из доклада  Романа Доброновского (Promodo UA, Харьков) «Изменения в поисковом алгоритме Google: год 2011-й»

Что такое низкокачественный сайт?
  • - обилие страниц с неуникальным контентом;
  • - низкокачественный контент, пользователь сразу покидает такую страницу;
  • - рекламы больше, чем контента, и она навязчива;
  • - сайт для ботов, а не для людей.
В группу риска попадают:
  • Каталоги статей
  • Поиск людей
  • Сравнение цен
  • Сайты вопросов и ответов
  • Каталоги ссылок
  • Объявления
Что происходит?
Сильно падает трафик, аж до 80% . Результат - крушение бизнеса и увольнения. Что делать?
  • Удалить внутренние дубликаты;
  • Улучшить качества контента. Чтобы пользователи не уходили сразу;
  • Вынести ряд данных на поддомены. Например, самый лучший контент;
Как избежать проблем? - Использовать уникальный качественный контент без чрезмерной рекламы и переоптимизации.


Энн Смарти (Ann Smarty), редактор известного во всем мире SEO-ресурса SearchEngineJournal.com - «Гостевой блоггинг как инструмент получения естественных ссылок»
Гостевой блоггинг – это естественный и безопасный способ линкбилдинга.

И еще, на мой взгляд,  интересная информация из рассылки searchengines.ru

1. В рунете появился независимый рейтинг SEO-компаний «КтоПродвинул.ру». Теперь любой желающий может выяснить, кто занимается продвижением сайтов, выходящих в ТОП Яндекса по тем или иным запросам.
Рейтинг каждой SEO-компании зависит от совокупных позиций сайтов клиентов. Для каждого сайта по открытой модели рассчитывается коммерческая стоимость продвижения. SEO-компании ранжируются по совокупной оценочной коммерческой стоимости продвижения сайтов клиентов.
В рейтинге присутствуют все компании, которые были добавлены организаторами или самими SEO-компаниями. Участие в рейтинге открыто для всех SEO-компаний.

2. Опубликованы результаты исследования CMS для SEO.  

3.  Доклад Андрея Плахова на конференции YaC 2011, которая состоялась 19 сентября 2011 года в московском Центре Международной Торговли про Метрику качества Яндекса: wide pFound ()


4. Хороший перевод статьи Тома Шмитц Как эффективно оптимизировать несколько ключевых слов на одной странице?

5. На днях компания «Ашманов и партнеры» анонсировала запуск нового инструмента Analyzethis.ru, измеряющего загруженность сайтов рекламными материалами. Благодаря нововведению пользователи получили возможность узнать, какие поисковые машины рекомендуют сайты с наименьшим количеством раздражающей рекламы.

Как сообщают представители компании, в основе анализатора лежит специально разработанная технология распознавания рекламы, основанная на оценке скриптов, iframe'ов и других элементов кода страницы, которые могут вызывать рекламу. Для каждой страницы из результатов поиска вычисляется ее рекламная нагрузка, учитывающая «веса» всех найденных на странице рекламных элементов. Показатель каждого поисковика в данном анализаторе — это средняя рекламная нагрузка всех найденных страниц с учетом позиционных коэффициентов.
6. Новый поисковый сервис от Neiron Search Tools (NST)



За информацию спасибо рассылке www.searchengines.ru

Saturday, March 12, 2011

Topsy-Twitter search engine

Topsy - поисковая система по Twitter`у. В качестве результатов поиска выдает ранжированные результаты (ссылки), фотографии т твиты. Ранжирование производится по количеству и качеству ретвитов, которые получили эти ссылки.

Поисковая система  Topsy предоставляет API-доступ к результатам поиска, а также к данным типа "влиятельности" (авторитетности) автора и т.п. Доступ к API свободный, ограничение на пользование - 10 000 запросов в час. Правда при этом, из-за трудоемкости и затратности,  1 поисковая операция приравнивается к 10 запросам. Но и 1 тысяча поисковых запросов в час - тоже неплохо :). Есть возможность и коммерческого использования.


Поисковую систему Topsy относят к классу систем поиска в режиме реального времени, осуществляющих поиск по социальным медиа.


Topsy также предлагает:
  • - плагины для броузеров Firefox и Internet Explore, которые показывают самые последние и горячие новости-твиты
  • - виджет поиска, которые веб-разработчик может разместить на своем сайте. Вот такой примерчик поиска по запросу "semantic search engine". Можете протестировать и позадавать свои запросы.











Ссылки по теме:

Tuesday, March 1, 2011

Google изменил алгоритм, а Yahoo провело исследование поиска

Google наконец изменил алгоритм ранжирования сайтов, чтобы избавиться от спама и дубликатов.

Источник новости: www.searchengines.ru

Yahoo провела «трехмерное» исследование поиска - «кто ищет», «что ищет» и «как ищет». Работа исследователей была представлена на конференции WSDM в Гонконге.

Измерения определялись при помощи демографических данных: пола, возраста, дохода и уровня образования, совокупности различных запросов, которые были привязаны к тематикам и географическим регионам. Вопрос «как» искали пользователи, изучался при помощи таких показателей как длина сессии и число запросов за сессию.

Ознакомиться с частью исследований можно при помощи сервиса Yahoo! Clues. Там показываются самые популярные текущие запросы, связанные запросы, и статистика по демографическим данным. Полные данные исследования доступны по ссылке research.yahoo.com (pdf) .

Источник новости: www.searchengines.ru

    

Friday, January 28, 2011

fQwiki - Open Source QWiki clone

Весь интернет шумит от суммы, выделенной на новый проект поисковой вики-системы QWiki - 8 миллионов долларов.(Подробнее про новую поисковую систему Qwiki)

И нашелся один умелец, который за 6 часов написал 321 строчку html-кода (+ javascript), без серверной части!, которая в общих чертах повторяет систему QWiki. Т.е. клон fQWiki представляет собой ОДНУ html-страницу, использует AJAX и прочие возможности web 2.0 - библиотеку JQuery, Google API`s, API поиска в англоязычной версии википедии, и возможности Semantic Web - обращение к dbpedia, выполнение SPARQL-запросов. Система fQWiki , в отличие от монстра QWiki - бесплатна, имеет открытый код (Open Source) и не претендует на миллиардные вложения :).

Рекомендую посмотреть код - очень красивое решение.

Ознакомиться с fQWiki (и взять с разрешения автора код) можно на странице проекта fQWiki. :)

Надо признать, что fQWiki предоставляет более подробную информацию, чем QWiki :)

Источники новости: businessinsider.com, newsgrange.com engl.

    

Thursday, January 27, 2011

semantic search from qwiki

(Подробнее про новую поисковую систему Qwiki)
Итак, система Qwiki открыла доступ. Пример поиска по запросу "Semantic Web".





Красиво...

Запрос: "weather in Ukraine" - We`re sorry...

Запрос "Ukraine" тоже выглядит красиво:





(Читать подробнее про новую поисковую систему Qwiki)


    

Wednesday, January 26, 2011

Google начинает фильтровать "плохой" контент

Google начинает фильтровать "плохой" контент

Google готов принять активные действия против «контентных ферм». По сообщению одного из главных инженеров и специалистов по качеству поиска, Метта Катса, компания готова ввести дополнительные метрики, позволяющие отсеять некачественный контент и снизить количество спама в поисковых результатах.

По словам Каттса: «Сегодня англоязычного спама в результатах Google в половину меньше, чем было пять лет назад, а спама на других языках даже меньше, чем на английском. Тем не менее, мы заметили небольшое увеличение количества спама в последние месяцы, и, несмотря на общий прогресс, которого мы достигли, мы примем новые меры для дальнейшего увеличения качества поиска».

Некоторое время Google никак не реагировал на жалобы пользователей по поводу качества результатов, в которых зачастую встречается контент, формально не являющийся спамом, однако созданный не в лучших интересах пользователей.

Среди мер, которые будут приняты, Каттс назвал изменения алгоритма, которые будут призваны понизить ранжирование сайтов, которые копируют чужой контент и выдают его за свой или просто собирают его автоматически. В качестве источника информации о таких сайтах будут выступать пользователи, установившие новое расширение для браузера Chrome, при помощи которого они смогут маркировать сайты как «спам».

Источник новости: searchengines.ru (русск)
По материалам:  CNet News (engl)

Итак, все-равно, человеческая оценка "семантики", как ни крути.

Напомню, что идея ручного проставления рейтинга не нова - для большинства броузеров уже давно есть плагин сообщества  Web Of Trust  (Читать  подробнее про WOT - Web Of  Trust...)  Очень рекомендую установить и пользоваться, а также самим активно проставлять рейтинги неблагонадежным сайтам. Одним кликом плагин устанавливается к броузеру - и вы всегда будете предупреждены про качество сайтов, а на красные - вас и не пустит.





    

Friday, January 21, 2011

QWiki на TechCrunch Disrupt 2010

В сентябре 2010 года в Сан-Франциско прошло мероприятие TechCrunch Disrupt , которое представляет новые инновационные интернет-компании и их проекты.

Одним из номинантов конкурса стал проект QWiki.

QWiki - платформа, которая аккумулирует разные типы контента и позволяет воспроизводство его на разных устройствах.

Как утверждает докладчик, данная система работает со знаниями. (- !?)
Разработчики выделяют 3 ключевые особенности системы:
  • 1. В QWiki контент генерируется полностью автоматически без участия человека.
  • 2. Контент, воспроизводимый системой полностью озвученый, т.о. полностью обработанный, логически связанный и сгенерированный.
  • 3. Контент полностью интерактивный.

Хочу поставить ударение на том, что в оригинале докладчик вместо слова контент употребляет термин знания, что на мой взгляд терминологически не верно. Это всего лишь контент, поэтому буду употреблять именно этот термин.

Создатели системы утверждают о том, что это "семантическое приложение", и сравнивают его с поисковой системой Google, поскольку QWiki - это прежде всего поисковая система, которая автоматически создает видео-сюжеты (видео-статьи) "на лету" на основании результатов поиска. При этом это вики-система, т.е. она направлена на предоставление справочной (фактографической) информации - о людях, странах, городах, искусстве, популярных темах, погодных данных, мероприятиях, картах и т.п. Предполагается, что система может выдавать и заданные персональные данные пользователя, напр. напоминалка по календарю персональных событий и т.п.
Вся информация выдается приятным женским голосом и сопровождается видео-фрагментами.

Система в качестве исходной информации использует открытые источники, такие как фотографии из Flickr, блоги, твиты, и т.п., и, на основании обработанной информации из Википедии, генерирует видео и аудио- "сюжет".

Уникальность системы, по заявлениям авторов, в полной автоматизации процесса. (Прим. автора. Стоит все-таки не забывать, что контент википедии создают люди, и он иногда бывает не совсем правильным).

Следующий естественный шаг в эволюции Интернета - использование социального свободного контента блогов, фотографий, видео и т.п. для сбора, анализа, переработки и генерации новой (точнее - по-новому представленной) информации.

Система пока представлена альфа-версией.

В общих чертах ознакомиться с проектом можно из видео (англ.)











Подробнее о проекте можно узнать на сайте проекта qwiki.com

По материалам: Social Media Takes Time Off For A Qwiki!(англ)

ИМХО - авторы системы достаточно амбициозны, однако, не за горами ответный ход главного игрока - поисковика Google.
Делая упор на видео и аудио информацию, система становится более "тяжелой", что не всем и не всегда подходит.
Откидывать "обычный" текстовый поиск не стоит. Также нельзя не учитывать объемы необходимых вычислений и обрабатываемых данных, да и саму сложность задачи, на которую замахнулись авторы.
Тут можно вспомнить опыт предыдущего амбициозного "убийцы" Гугла - PowerSet - где он сейчас?? И что они смогли сделать?...


Добавлено 24-01-2011
Первое знакомство с QWiki (Alpha-версия) создает впечатление работы c интерактивной мультимедийной вики-системой. Система поддерживает только английский язык и имеет довольно маленькую базу. Ориентирована на визуальную и аудио- подачу энциклопедической информации общего характера в сжатой форме. На мой взгляд, очень подходит для эффектной подачи информации детям (моему сыну понравилось очень - просто, доходчиво и круто! :)), т.е. система может стать хорошей платформой для обучающей системы.

По мнению англоязычных коллег - система дает очень поверхностные знания...

...it is slick and superficial and dumbs people down. Sure, Qwiki may wind up being “successful”, but then lots of things are successful (take McDonald’s, but that doesn’t mean that 4000-calorie supersized meals are good for society).
http://thenextweb.com/microsoft/2010/10/02/qwiki-will-succeed-because-microsoft-will-buy-it/

Технического описания и научного базиса, к сожалению пока не нашла. Если кто-нибудь имеет подобную информацию, оставьте, плз, в комментах.

Посмотреть пример запроса "Semantic Web".




    

Saturday, December 18, 2010

Новый вид фильтрации у Google

И снова вспоминается классика - идеи летают в воздухе, их надо только быстро подхватить...

Идея и алгоритм, которую так долго обговаривали и прорабатывали у нас - гугл взял да и реализовал... Правда частично, но они на правильном пути. Им, естественно это проще...


Google фильтрует результаты по уровню читаемости


2010-12-14 12:37


Google добавил новый фильтр для поисковых результатов, который может помочь расположить результаты в соответствии с уровнем сложности текста. По словам представителя Google, этот фильтр может быть полезен различным категориям пользователей, в частности, учителям, которые хотят найти материалы различного уровня сложности.

(Про  уровни читабельности-сложности текстов написано в статье Рогушиной Ю.В. "ИСПОЛЬЗОВАНИЕ КРИТЕРИЕВ ОЦЕНКИ УДОБОЧИТАЕМОСТИ ТЕКСТА ДЛЯ ПОИСКА ИНФОРМАЦИИ, СООТВЕТСТВУЮЩЕЙ РЕАЛЬНЫМ ПОТРЕБНОСТЯМ ПОЛЬЗОВАТЕЛЯ", источник eprints.isofts.kiev.ua/235/1/Рогушина_1.doc, и поскольку я принимала участие в тестировании этих критериев, могу сказать, что гугл поленился - их решение слишком упрощенное... А идея очень хорошая и дает неплохие результаты. Статья 2-х или даже 3-х годичной давности.)

Кроме фильтрации сайтов, инструмент позволяет пользователям сравнить уровень читаемости различных документов, выбрав опцию «указать уровень читаемости» ("annotate results with reading levels") и введя имя домена в форму.

Технология, позволяющая делить весь контент на три категории: от «базовой» до «продвинутой», была разработана при участии педагогов, которые разделили тексты на три категории и создали определенную базу, на основании которой была выведена статистическая модель и алгоритм определения сложности текста.

По материалам CNet News

Жаль, что у нашей науки средств на это нету... :(

Thursday, October 28, 2010

Springer

подарок от Спрингер
До 30 ноября на Springer в свободном доступе журналы по математике и computer science:



Mathematics:

* Mathematische Annalen
* Journal of Optimization Theory and Applications
* Mathematische Zeitschrift
* Inventiones Mathematicae
* Mathematical Programming
* Mathematical Intelligencer
* Archiv der Mathematik
* Numerische Mathematik
* Probability Theory and Related Fields
* Bulletin of Mathematical Biology
* Manuscripta Mathematica
* Applied Mathematics and Mechanics
* Journal of Mathematical Sciences
* Journal of Mathematical Biology
* Acta Mathematica
* Israel Journal of Mathematics
* Journal of Geometric Analysis
* Journal d'Analyse Mathematique
* Optimization Letters
* Journal of Fixed Point Theory and its Applications
* Complex Analysis and Operator Theory
* Mathematics in Computer Science
* Japanese Journal of Mathematics
* Qualitative Theory of Dynamical Systems
* Logica Universalis
* Mathematics and Financial Economics
* Mathematical Programming Computation
* Functional Analysis and other Mathematics

   

Computer Science:

* International Journal of Computer Vision
* Machine Learning
* Scientometrics
* Data Mining and Knowledge Discovery
* Algorithmica
* Visual Computer
* Machine Vision and Applications
* AI & SOCIETY
* Computing
* Ethics and Information Technology
* Journal of Real-Time Image Processing
* Swarm Intelligence
* Service Oriented Computing and Applications
* Cryptography and Communications
* Journal of Multimodal User Interfaces



Огромное спасибо за новость : http://community.livejournal.com/ru_math/772714.html?style=mine

Усиленно качаем!

Friday, October 8, 2010

Wolfram Alpha mobile

Wolfram Alpha представил версию поиска для Android

2010-10-08 13:56
Wolfram Alpha развивает мобильное направление поиска. В качестве нового шага на пути освоения мобильного пространства, создатели поисковой системы представили приложение для операционной системы Android.
По словам разработчиков, Wolfram Alpha для мобильного имеет такую же способность к извлечению данных, что и полная версия для PC, а также обладает полным доступом к базе, состоящей из «10 триллионов элементов данных» и включающей «десятки тысяч» моделей вычисления.
Приложение поддерживает как текстовый, так и голосовой ввод. Областями поиска, в которых система себя зарекомендовала наилучшим образом, являются математика, прикладные науки, инженерия и спорт. Приложение стоимостью $1.99 работает только на Android OS 1.6 и выше.
Цена приложения для Android во много раз ниже цены программы для Apple App Store, которая появилась в прошлом году. Тогда стартовая цена поисковой программы равнялась $49.99. Низкие продажи заставили компанию пересмотреть ценовую политику и снизить стоимость установки почти в 25 раз.
По материалам Wolfram Alpha Blog
Источник: www.searchengines.ru (русск.)

Читать подробнее про поисковик Wolfram Alpha и Стивена Вольфрама

Friday, September 24, 2010

sciprog: position statement


Новое! Читать заметки по поводу первого круглого стола!


Уважаемые господа!
Нижеследующее обращение и предложение адресовано всем работникам ІТ-отрасли -- разработчикам, менеджерам, ученым, журналистам, пишущим на темы IT-индустрии, а также преподавателям и студентам соответствующих специальностей.

В настоящее время в Украине в области разработки ПО нет цепочки связывающей науку с индустрией.  Можно ли эту связь восстановить и вообще возможна ли ‘настоящая’ прикладная науки в Украине  ?

Есть предложение под эгидой Украинского отделения АСМ (http://www.acm-chapter.org.ua/) организовать встречу-семинар, на который бы собрались заинтересованные люди из числа IT-профессионалов и попробовали ответить на поставленный вопрос. Цель события -- предложить дискуссионную площадку, где могли бы апробироваться и рождаться новые направления внедрения инноваций и сотрудничества науки и бизнеса, чтобы в неформальной постановке можно было бы обсудить следующие темы:
  1. Есть ли у бизнеса в Украине потребность в R&D ? Какая именно ? Как сейчас она удовлетворяется ?
  2. Есть ли в украинской науке конкурентоспособные разработки и идеи со сравнительно небольшой дистанцией к внедрению ?
  3. Традиционная модель внедрения инноваций в производство (которая была основанная на госзаказе) сейчас в большинстве своем разрушена или обрабатывает “воздух”. Можно ли выработать новую модель. ?

Чем отличается R&D от просто разработки?  С одной стороны, существенно большая неопределенность и риск в сроках  и результатах, c другой -- существенно большие возможности в случае удачного исследования, позволяющие менять ‘правила игры’ в области.  

Можно предположить основные ‘негосударственные’ модели существования науки
  1. a) крупные организации содержат исследовательские отделы, мотивация не только оптимизация собственных процессов, но и просто поддержка знаний о происходящем в отрасли,  
  2. b) венчурная модель -- прикладное исследование проводится как высоко-рисковая инвестиция, поддающаяся коммерциализации,
  3. c) аутсорсинг исследований -- исследовательские задачи передаются специализированной организации, находящейся на Украине
  4. d) ‘хобби-модель’  - исследования проводятся как инициативный-проект, поддерживающийся  нефинансовой мотивацией.

Попробуем проанализировать жизнеспособность  этих моделей в Украине, показав разные примеры, как удачные так и нет.

a) Есть ли у нас крупные организации, работающие в IT области ?  Можно ли узнать что либо о активности из исследовательских отделов ?  
  На сегодняшний день информации об украинских прикладных негосударственных  исследованиях в области IT практически нет - то ли организации недостаточно крупные, то ли ниша, занятая на рынке не подразумевает наукоемких технологий, то ли исследовательская деятельность не афишируется (однако без общения  научный проект долго существовать не может).  

b) Венчурная модель -- на самом деле, в прикладном исследовании есть также и немало существенных отличий от бизнес-проекта:  сроки разработки существенно выше, результаты исследование не всегда пригодны для  коммерциализации, хотя могут иметь практическую познавательную ценность.
  Можно ли проанализировать  существование венчурной модели у нас ? Есть несколько примеров украинских стартапов, где наукоемкая технология играет определенную роль.  Основными препятствиями в этой области является то, что для нормального функционирования такой модели требуется, с одной стороны,  довольное большое количество исследователей, предлагающих свои идеи, с другой стороны - наличие нескольких конкурирующих организаций, способных  произвести первичное финансирование и ‘упаковать’ результаты исследований в форму, пригодную для коммерциализации.  

с) Идея научного аутсорсинга была относительно популярной несколько лет назад, когда транснациональные корпорации открывали подразделения R&D в развивающихся странах из-за относительной дешевизны и  высокого уровня образования. Некоторые центры работают до сих пор, однако активность там постепенно снижается.

d) Хобби-модель - как ни странно, сейчас является чуть-ли не основной рабочей моделью в существенной части академической среды.  Можно ли сделать  совмещение  профессиональной и  научной деятельности более эффективным и удобным и выработать какое-то расширение возможностей для его участников ?  

Также стоит учесть, что в связи с глобализацией и развитием технологий,  для кустарных прикладных исследований на самом деле стало больше возможностей, чем раньше. И Силиконовая долина теперь может находится в любом месте земного шара, так как расстояние между людьми сейчас определяется количеством кликов мыши, а не географией

Мы постараемся обеспечить участие всех заинтересованных сторон и надеемся на формирование новых результативных связей  между академическим и деловым  сообществами в области компьютерных наук. 

Модели коммерциализации научных исследований в области СS в Украине 

Мозговой штурм, посвященный возможным моделям развития и коммерциализации научных исследований в компьютерной отрасли
Когда
вт, 28 сен 19:00 – 22:00 Киев
Где
г. Киев. ул. И. Мазепы 34, к. 208 (карта)

Заполнить анкету на участие




Новое! Заметки по поводу первого круглого стола!

<< читать sciprog: заметки по поводу первой встречи #in >>

Организована инициативная Google-группа http://groups.google.com/group/sciprog?pli=1

Вся информация по sciprog: http://www.lisp.kiev.ua/wiki/sciprog/Sciprog (Поддерживаемые инициативы - Технические встречи,  Технопарк, Хакатоны, Коллаборативные проекты, OSS-проекты)

 

Thursday, September 2, 2010

Тестируем Swingly - систему поиска фактов

Итак, про систему Swingly было уже написано ранее .
Это новая самообучающаяся система поиска фактов.
Наконец пришло разрешение на бета-тестирование системы.

Задем вопрос "What is the future of Internet?"
Результат получился ошеломляющий. Система выдала около двадцати результатов, а также определение, что такое интернет:

Internet is a(n) academic discipline, computer network, digital medium, discipline, mass medium, system, telecommunication, topic, wide area network
Также очень толковое разъяснение:
The Internet is a global network of interconnected computers, enabling users to share information along multiple channels. Typically, a computer that connects to the Internet can access information from a vast array of available servers and other computers by moving information from them to the computer's local memory. The same connection allows that computer to send information to servers on the network; that information is in turn accessed and potentially modified by a variety of other interconnected computers.

Ну и результаты (можете оценить сами):

1 answer from top search results.



  • communication, transactions and entertainment
    See how communication, transactions and entertainment might develop in the future of the Internet.



1 answer from web data.



  • NWE Wireless
    NWE Wireless is the future of high-speed Internet access.



    http://www.nwewn.com • Apr 30, 2009 • Report
1 answer from web data.




  • "We think the future of the Internet is about people, not technology, and knowing who has clout," Assayag said.



2 answers from web data.




  • "The future of the Internet as we know it depends on maintaining freedom and openness online," said Ben Scott, policy director of Free Press.







  • "This is a pivotal moment for the future of the Internet," said Ben Scott, policy director at Free Press, on a conference call today.



1 answer from web data.



  • Bob Taylor
    Looking forward, Bob Taylor in 2000, voiced two concerns about the future of the Internet: control and access.



1 answer from web data.




  • When the 2003 summit failed to agree on the future of Internet governance, the Working Group on Internet Governance (WGIG) was formed to come up with ideas on how to progress.



1 answer from web data.



  • two concerns
    Looking forward, Bob Taylor in 2000, voiced two concerns about the future of the Internet: control and access.



1 answer from web data.



  • video content
    Although video content is lauded and championed as the future of the internet, there is still a lot of dissension over whether it has a place in corporate blogging.



1 answer from top search results.



  • ongoing
    The future of the Internet communications revolution is ongoing, now uniting communities as it recently united networks.



1 answer from web data.



  • Seth Finkelstein's answers
    Seth Finkelstein has posted his answers to a Pew survey on the future of the Internet, and Google making us stupid (or not) in a thought provoking yet grounded (which is rare on the Web-admit it!) post.



    http://paradox1x.org • Apr 30, 2009 • Report
1 answer from web data.




  • On the matter of greater moment--Will the ax fall on Scrabulous--Jonathan Zittrain at The Future of the Internet answers his own question in the affirmative based on the name alone, opining that by calling it "rainbows and buttercups” instead of “Scrabulous” there’d be little claim of brand confusion but noting the "residual claim that the Scrabulous game board infringes the copyright held in the Scrabble game board."



1 answer from web data.



  • the term and shown activities such as publishing recommendations
    The OECD has picked up the term and shown activities such as publishing recommendations for the future of the Internet economy, for example (see the activities section).



1 answer from web data.




  • Professor Zittrain sees the rise of the relatively “tethered appliances” (e.g. iPhones, TiVos, and XBoxes) as the future of the Internet, promoted by companies and adopted by consumers because, when connected to the cloud, they seem to offer security, economies of scale or increased reliability.



1 answer from web data.



  • Google's Marissa Mayer
    Google's Marissa Mayer has unparalleled insights into the future of internet search engines.



1 answer from web data.



  • Social changes
    Social changes brought about by the Internet, & future of computing & Information Technology



1 answer from web data.



  • IPv6
    With the Asia-Pacific Network Information Centre's Geoff Huston stating that IPv4 addresses will be exhausted prior to October 2010, IPv6 is becoming increasingly important in the future of Australian Internet connectivity.



1 answer from web data.



  • Doug Gramling's three children
    Pastor Doug Gramling said his three children are part of the Internet generation that will eventually decide the future of worship.



1 answer from web data.




  • This question is part of an interview on the subject Shopping And Business On The Internet



1 answer from web data.




  • “The broadband quality study shows us which countries have made real moves towards the internet of the future," said Maria Rosalia Vicente, a professor at the University of Oviedo, in a statement.



2 answers from web data.



  • .mf
    .mf is a future Internet country code top-level domain (ccTLD) that is likely to be created for Saint Martin , following the decision on September 21, 2007 by the ISO 3166 Maintenance Agency to allocate MF as the ISO 3166-1 alpha-2 code for Saint Martin .






  • .bl
    .bl is a future Internet country code top-level domain (ccTLD) that is likely to be created for Saint Barthélemy , following the decision on 21 September 2007 by the ISO 3166 Maintenance Agency to allocate BL as the ISO 3166-1 alpha-2 code for Saint Barthélemy .



1 answer from web data.




  • No Answer



1 answer from web data.




  • No Answer



1 answer from web data.
1 answer from web data.




  • No Answer



1 answer from web data.
1 answer from web data.
2 answers from web data.




  • Google CEO Eric Schmidt made some kind of statements to the Financial Times about the future power of the Internet to be a BS detector when it comes to politicians’ statements.







  • Google CEO Eric Schmidt made some kind of statements to the Financial Times about the future power of the Internet to be a BS detector when it comes to politicians’ statements.



1 answer from web data.



  • from its early days
    This course will introduce the history and development of the genre from its early days in pulp magazines to its future on the internet.



1 answer from web data.




  • John Piper’s book, The Future of Justification, has prompted several discussions on the internet in regard to his critique of N. T. Wright.



1 answer from web data.



  • TV
    The advent of cable TV, DVR & Tivo, and the Internet has drastically changed the television landscape today, and will continue to change TV in the future.



    http://knowmoremedia.com/ • Apr 30, 2009 • Report
1 answer from web data.



  • at 1:00pm
    The special session, "Is An Open Platform the Future of the Mobile Internet?" follows immediately at 1:00pm in the same room.



1 answer from web data.



  • WiMax technology
    In short, WiMax technology promises a future of more powerful and more accessible wireless Internet access.



1 answer from web data.



  • with the United States
    BRUSSELS, Belgium-The European Union insisted Friday that governments and the private sector must share the responsibility of overseeing the Internet, setting the stage for a showdown with the United States on the future of Internet governance.



More
Результаты можно откорректировать, указать свое согласие.
 Результат меня довольно приятно удивил - мнения многих специалистов про направления развития интернета, информация свежая.

На запрос "How many documents are in the Internet?" я получила забавные ответы:
Во-первых, система сообщила в резюме, что список ответов скорее всего не соответствует моему запросу. Опять таки, в качестве информации, было дано определение и разъяснение, что такое интернет. А среди ответов были и просто перлы типа "The internet is shit.", но несколько ответов все-таки по теме, хотя и без указания конкретного числа: "But the internet is pretty big...", "The Internet is huge...".

Мне система понравилась. В отличие от других монстров типа Wolfram Alpha и других, претендующих на роль Google Killer App, эта система хотя бы частично смогла ответить на мои вопросы.


 

Популярное

Использование материалов сайта

Информация, представленная на сайте, может свободно использоваться и распространяться при обязательном указании активной прямой ссылки на сайт http://in-search-of-semantics.blogspot.com/, а тексты научных статей – при указании авторства и ссылки на бумажную публикацию.

При размещении текстов статей на своих сайтах, блогах и пр., пожалуйста, присылайте ссылки.
Комментарии перед публикацией предварительно модерируются.

Хотите сказать спасибо автору? Не откажусь :) - Поставьте ретвит на пост, или другую социальную закладку. Спасибо.