Артур Скальский

© РИА-Новости

Интернет и ИТМир

2531

19.07.2013, 13:04

РИА Новости открывает доступ к открытым данным

Семантическая платформа РИА Новости представлена на Международном саммите по семантике и оценена экспертами как одна из ведущих в мире, сообщает Digit.ru.

Специалист по семантике Боннского университета профессор Сорен Ауэр (Soeren Auer) отметил, что даже открытые данные в формате "2 звезды" или "3 звезды" (в форматах xls и csv соответственно) уже замечательное достижение сейчас. Тем приятнее ему видеть такое большое количество проектов с открытыми данными в России, включая государственные проекты, касающиеся тендеров. А данные открытые по формату "5 звезд" до сих пор редкость и в Европе. Ауэр сообщил, что открытые базы в формате "5 звезд" в Европе принадлежат обычно госструктурам. По его словам СМИ в Европе только начали перевод имеющейся информации в открытые данные по формату "5 звезд", например холдинг BBC.

Профессор Кей Сан Чой (Key-Sun Choi) из корейского университета науки и технологий KAIST согласился, что даже открытие Россией 1000 наборов открытых данных – большой успех. Для сравнения он упомянул, что в Корее за предыдущий год переведено в открытые данные только около 500 наборов. При этом в формате "5 звезд" доступно менее чем сотня наборов форматов открытых данных и опять-таки все эти наборы раскрыты государственными органами. В отличие от России, СМИ Южной Кореи также не имеют пока открытых данных, представленных в формате "5 звезд", по словам профессора Чоя. Пока они применяются для госуслуг, хотя есть и бытовые примеры: например в Сеуле можно узнать расписание всех автобусов, сообщается на правительственном сайте, посвященном открытым данным.

Оба ученых отметили, что сейчас относительно налажен процесс передачи открытия данных "сверху вниз", от государства обществу, но пока есть сложности с механизмами открытия и обмена данных гражданами и организациями. Такой обмен, по мнению профессора Чоя, очень помог бы развитию многих сфер бизнеса. Например, в туристической сфере, важной для России, он полагает возможным сбор данных о качестве еды в ресторанах и сервиса в гостиницах методом краудфандинга. А профессор Ауэр упомянул, что использование собственной семантической платформы для обработки данных и дальнейшее открытие данных такого крупного СМИ как РИА Новости – это хороший пример открытия информации "снизу".

Директор офиса W3C в России и зам. директора института информационных технологий ВШЭ Виктор Клинцов считает, что внедрение новых цифровых технологий и переход на открытые данные уже вопрос выживания, а не прибыли. По его мнению, без современных семантических технологий (например, семантических платформ, необходимых для структурирования цифровых данных) через 2-3 года компании перестанут выживать. В США большая тройка New York Times, Associated press и Reuters занимаются вопросами семантики в отношении цифровых данных". Также он предположил, что наличие наборов открытых данных у российского и американских СМИ открывает возможность проведения совместных проектов по синхронизации этих данных.

В целом, по мнению Клинцова, Российское государство достаточно быстро организовало открытие данных и в дальнейшем это может помочь экономическому росту страны. Он сослался на опыт ЕС, где считается, что вложения государства в открытие данных окупится за счет роста малого бизнеса на проектах с открытыми данными. Профессор Ауэр считает важным, что текущий саммит по семантике проходит в России, так как раньше Россия держалась несколько особняком в вопросах изучения семантической технологии, а теперь исследователи смогут обменяться опытом.

Во время саммита были приведены данные теста BSBM, по которым система управления базами данных OntoQuad показала самую высокую производительность. Именно ее РИА Новости совместно с компанией Eventos адаптировали для отечественной семантической платформы. Независимое тестирование проводилось в институте информатики Лейпцигского университетом. По его результатам OntoQuad существенно превзошла по производительности конкурирующие решения Virtuoso, Jenna TDB, BigData.

"В будущем семантическая платформа РИА Новости позволит, например, создавать для каждого читателя его личную ленту новостей, которая будет учитывать его интересы и месторасположение", — описал одно из конкретных применений базы с открытыми данными Роман Никулин, начальник отдела семантического производства объединенной редакции новостей РИА Новости. Он отметил, что семантическая платформа РИА Новости уже используется как в редакции, так и способна выдавать данные внешним клиентам. Например, редактору эта платформа автоматически предлагает теги для статьи, а также ранее вышедшие материалы по теме текущей заметки. Партнерам семантическая платформа на базе открытых данных РИА Новости помогает быстро находить все упоминания нужной информации.

База открытых данных РИА Новости содержит все выходящие материалы агентства (до 5000 материалов в день). Данные представлены в формате "5 звезд", т.е. структурированы, машиночитаемы, связаны с другими открытыми базами данных.

Международный саммит по семантике ежегодно организует компания STI International. В нем участвуют ученые по семантике и сотрудники исследовательских отделов коммерческих компаний всего мира. В этом году саммит впервые проходит в России, в Суздале. Ожидается, что за три дня в нем примут участие около 50 специалистов и ученых.

Электронный адрес публикации открытых данных РИА Новости: opendata.ria.ru.

Артур Скальский

© РИА-Новости

Интернет и ИТМир

2531

19.07.2013, 13:04

URL: https://babr24.info/?ADE=116758

bytes: 5521 / 5360

Поделиться в соцсетях:

Также читайте эксклюзивную информацию в соцсетях:
- Телеграм
- ВКонтакте

Связаться с редакцией Бабра:
[email protected]

Автор текста: Артур Скальский.

Другие статьи в рубрике "Интернет и ИТ"

T2 обновила подписку MiXX в партнерстве с Яндекс Плюсом

Теперь у пользователей MiXX есть доступ к фильмам и сериалам на Кинопоиске, Яндекс Музыке в lossless-качестве, кешбэку баллами Плюса.

Саша Савельева

Интернет и ИТРоссия

940

24.09.2024

Монголия на пути цифрового прогресса: рост в индексе электронного правительства

Монголия демонстрирует впечатляющий рост в сфере электронных услуг. Это наглядно выражается ее значительным скачком в глобальном рейтинге UN Global E-Government Development Index.

Эрнест Баатырев

Интернет и ИТОбществоЭкономика и бизнесМонголия

3994

23.09.2024

Развитие цифровых технологий в Монголии: новые шаги и перспективы

Монголия активно развивает свою цифровую экономику, стремясь к укреплению позиций на мировом рынке информационных технологий.

Эрнест Баатырев

Интернет и ИТНаука и технологииОбществоМонголия

1783

03.09.2024

Блогнот. Казус Дурова. Как это работает

1️⃣ Данных в мире очень много. За 15 лет физическое количество данных (data) выросло в 66 раз. Ежегодный прирост – больше, чем производилось этих самых данных 10 лет назад. И немалую часть этих данных генерируют сами пользователи, размещая контент в соцсетях или реагируя на него.

Глеб Кузнецов

Интернет и ИТРасследованияМир

6909

31.08.2024

Монголия на пути к цифровому будущему: инновации и диверсификация

При наличии огромной территории Монголия является одной из наименее населенных стран мира. Экономические центры там разделяют огромные расстояния, что создает определенные проблемы, решая которые монгольское общество приобретает уникальный социальный и экономический опыт.

Эрнест Баатырев

Интернет и ИТОбществоЭкономика и бизнесМонголия

8091

28.08.2024

Быстрый интернет и безопасность в сети. Новый дайджест Tele2

Еще в двух городах Иркутской области оператор Tele2 улучшил качество связи за счет перехода на сети нового поколения. Из нововведений – доступный абонентам сервис для отслеживания утечек персональных данных. Подробности в августовском дайджесте компании.

Саша Савельева

Интернет и ИТИркутск

2505

22.08.2024

Итоги опроса Бабра: какие политические ТГ-каналы читают красноярцы

В конце июля Бабр в своём телеграм-канале «Красноярск. Бабр. Дальше некуда» (@kras_24) проводил опрос. Пришло время подвести его итоги и узнать, какие политические телеграм-каналы предпочитает читать красноярская, и не только, аудитория. Какие красноярские политические телеграм-каналы вы читаете?

Анна Роменская

Интернет и ИТОбществоПолитикаКрасноярск

14696

16.08.2024

Инсайд. Что стоит за законом о "деанонимизации Телеграма"

Закон о "деанонимизации Телеграма", по всем признакам, в ближайшее время будет принят Госдумой. Главный "запретитель" страны, депутат Госдумы Александр Хинштейн, уже говорит об этом как о свершившемся факте. Что именно предполагается сделать. 1.

Василий Чайкин

Интернет и ИТПолитикаРасследованияРоссия

16608

31.07.2024

Для влюбленных в лето: Tele2 приглашает отправиться в приключение

Мобильный оператор обновил тревел-гид, собрав коллекцию летних путешествий по Иркутской области, а еще вновь улучшил качество звонков и интернета в регионе, на этот раз в городе Черемхово. Подробнее – в дайджесте новостей от Tele2.

Саша Савельева

Интернет и ИТИркутск

6286

29.06.2024

Умный дом? Tele2 поможет

В магазинах Tele2 абоненты покупают не только смартфоны. Посетители салонов выбирают подарки для близких и обустраивают умные дома. Зачем нужны несколько видеокамер и как их выгодно приобрести?

Саша Савельева

Интернет и ИТИркутск

7338

31.05.2024

Иркутская служба поддержки выручает абонентов Tele2 по всей России и не только

Дистанционный центр продаж и сервиса Tele2 – место, где работают неравнодушные люди. Оператор рассказал о буднях центра и нестандартных случаях. Дистанционный центр в Иркутске – одна из четырех площадок Tele2 в стране, где обрабатываются обращения клиентов, поступившие по телефону или в чатах.

Саша Савельева

Интернет и ИТИркутск

10517

27.04.2024

Время для музеев – культурная акция Tele2

Иркутяне могут сходить в музей, заплатив за билет не деньгами, а накопленными минутами из пакета Tele2. В Иркутске доступны планетарий и галерея Бронштейна, но можно слетать в Петербург и посетить Эрмитаж, или доехать до этнографического музея в Улан-Удэ.

Саша Савельева

Интернет и ИТКультураИркутск

44171

19.04.2024

Лица Сибири

Зырянова Татьяна

Фалейчик Юрий

Сумароков Илья (младший)

Бадмацыренов Жаргал

Абдулина Роза

Проценко Александр

Головных Иван

Барданов Александр

Хоменко Валерий

Клюкин Александр