Семантический веб

Всё про веб
 

Семантический веб

Хотя сфера применения XHTML и XSLT довольно ограничена, они позволяют разработчикам добавлять семантическую информацию с минимальными усилиями.

Дэниел Фелт.

Область применения XHTML и XSLT довольно ограничена, но они позволяют разработчикам добавлять семантическую информацию с минимальными усилиями.

Для Тима Бернерса-Ли концепция Семантической паутины является центральной для будущего Всемирной паутины. Вместе со своими коллегами из Консорциума Всемирной паутины (W3C) Бернерс-Ли интенсивно работает над созданием инфраструктуры для этого нового этапа жизни Интернета. Однако совершенно неясно, что именно скрывается за термином "Семантическая паутина".

Веб для машин

Обвинения в том, что концепция Семантической паутины расплывчата, часто направлены против Бернерса-Ли. И это не лишено оснований. Судя по тому, что Бернерс-Ли до сих пор полностью не объяснил свои идеи, он не опубликовал ничего похожего на "белую книгу" Семантического Веба. Однако в тексте под названием Semantic Web Roadmap (www.w3.org/DesignIssues/Semantic.html) вы можете прочитать обзор концепции, ее целей и многих интересных предположений о ней.

Общее определение целей будущего Web довольно увлекательно и амбициозно. Семантическая паутина — это идеология, а не технология. Для Бернерса-Ли Семантическая паутина — это следующий этап в эволюции Интернета. Сегодняшняя Всемирная паутина нацелена только на предоставление людям информации, которую только люди могут эффективно читать. Семантическая паутина, напротив, разрабатывает язык для представления информации в формате, доступном для машинной обработки". Другими словами, Семантический веб — это не веб для людей, а веб для машин. Это набор технологий, позволяющих машинам лучше понимать веб и тем самым делать веб более полезным для человека.

Естественно, эта цель делает рамки Семантического Веба расплывчатыми и неопределенными. Существует множество методов и технологий, которые могут быть применены для достижения этой цели. Некоторые разработчики XML имеют сильное предубеждение против "Педантичной паутины", как в шутку называют идею Бернерса-Ли, из-за ее зависимости от технологий RDF (Resource Description Framework). Источником структурированной информации для машины может быть несколько синтаксисов. Однако, помимо технических дебатов, необходимо признать ценность Семантической паутины как инструмента, который может решить серьезные проблемы коммуникации. В частности, она улучшает нашу способность искать, классифицировать и классифицировать информацию — проблема, которая занимает большую часть нашего времени сегодня. В любом случае, лицо Интернета, безусловно, изменится, вновь предлагая новые возможности для общения и взаимодействия.

ЧИТАТЬ ЕЩЁ:  Формы ввода данных Drupal

Никто не отрицает, что развитие идеи семантической организации только началось. Однако разработчиков не впечатляет общая картина, если они не могут заставить функциональность работать. На сегодняшний день язык XML внес значительный вклад в реализацию целей семантической организации. XML обеспечивает гибкую конституционную основу, на которой можно строить решения для представления данных и их взаимосвязей, высвобождая информацию из неинвазивных и нерасширяемых форм. Я подробно писал о XML в статье "Проблема Бабеля в XML" (см. журнал "Networking Journal", № 1/2001). Поэтому здесь мы сосредоточимся на других технологиях, которые являются ключевыми для этого шага в развитии семантических организаций. Это XHTML, XSLT и RDF.

XHTML и XSLT: потенциал простых технологий

Парадоксально, но самым мощным инструментом семантической организации является сам HTML, особенно его расширение XHTML (расширяемый HTML). Большинство людей знакомы с меткой "meta". Это можно использовать для записи метаданных о документе в целом. Хотя в настоящее время XHTML не широко используется в Интернете, он предоставляет некоторые средства для интеграции семантических подписей. Это позволяет машинам воспринимать содержимое сайта не только как простой текст. Эти инструменты работают с характеристиками классов, обычно используемых в стилевых листах. Их строгое применение позволяет машинам извлекать данные со страниц, предназначенных для восприятия человеком.

Семантическая организация предназначена для машин, а не для людей.

Подобная техника, неофициально известная как "скрейпинг экрана", уже некоторое время используется во Всемирной паутине. Обычные приложения такого рода включают экспорт данных из поисковых систем в сценариях PERL или экспорт заголовков из источников новостей. Однако эти приложения обычно подстраивались под дизайн HTML-страницы, и их приходилось переустанавливать всякий раз, когда дизайн менялся. Как показано в примере, страницы этикеток XHTML выполняют эти задачи более надежно, не обходя лежащий в основе интерфейса HTML.

Поскольку ASP-компании стремятся добавить SOAP (Simple Object Access Protocol) и другие подобные интерфейсы в свои системы для обеспечения удаленного доступа к приложениям, XHTML является хорошим решением, поскольку позволяет использовать два интерфейса (браузер и браузер). Programme SOAP) непосредственно с машины, что дает возможность избежать включения двух интерфейсов (браузер и программа SOAP) непосредственно с машины. HTML. ценность и простота простой онлайн-технологии еще не исчерпана.

ЧИТАТЬ ЕЩЁ:  SEO и JavaScript редиректы

Если в HTML-страницы включена дополнительная информация, программное обеспечение должно преобразовать их в нужный формат. Здесь пригодится еще одна технология W3C: XSLT (Extensible Stylesheet Language Transformations), расширяемые таблицы стилей для преобразования языков. В общем смысле XSLT предоставляет способ преобразования данных, использующих XML-разметку, данных, использующих другие словари или XML-разметку, созданных с помощью словарей в простой текст. XSLT имеет возможность извлекать и преобразовывать дополнительные данные, интегрированные в XHTML. Он обеспечивает превосходный мост между старыми технологиями HTML и приложениями eColoured XML семантических организаций.

XHTML и XSLT имеют очень ограниченную функциональность, но их использование позволяет организационным разработчикам добавлять семантическую информацию без дополнительных усилий. Были предложения по интеграции RDF в HTML-страницы, но подход с использованием XSLT кажется гораздо более привлекательным и простым. Мало кто хочет изучать RDF. Это является препятствием для создания страниц с семантическим контентом.

RDF: сеть по тройкам

Однако RDF (Resource Description Framework, www.w3.org/rdf) является одним из камней фундамента семантической организации. На самом деле, мало кто в восторге от этой технологии. Очень важным преимуществом RDF является информационная модель, поскольку ее довольно громоздкие пенсии часто вызывают критику со стороны разработчиков XML. RDF определяет очень простую тройственную модель данных (субъект, обвинение, объект). Здесь субъекты и обвинения — это uris (унифицированные идентификаторы ресурсов), а объекты — это либо URI, либо слова. Такая простая модель позволяет представлять объекты и их свойства. Сила RDF заключается в этой простоте.

Эффективность этой информационной модели не вызывает сомнений, однако предложенный W3C аннуитет модели RDF, основанный на спецификации синтаксиса XML (называемый RDF/XML), многие считают очень неуклюжим. В настоящее время предлагаются другие синтаксисы. Например, модель RDF может быть реализована с помощью правил SOAP. Если верно, что вся информация в Интернете может быть описана строками RDF, то аннуитеты не имеют особого значения. Тем не менее, универсальный улис является серьезным вопросом для экспертов.

Там, где есть информационная модель, необходимо учитывать характеристики позвоночного. Например, мы можем сказать, что "коммуникация" требует имен, ролей и организационных свойств. Это то, на что действует форма RDF — она определяет словарь RDF, который может быть использован для определения "контакта". Это позволяет всем пользователям ресурса типа "коммуникация" разделять ожидания относительно его характеристик и их связи с другими типами ресурсов.

ЧИТАТЬ ЕЩЁ:  5 главных признаков, что вас взломали, и три верных способа решить эту проблему

Форма RDF несколько отличается от формы структур документов XML (например, DTD и XML Schema) тем, что она определяет классы, свойства и отношения, а не определяет разрешенные аннуитеты. Они работают непосредственно на уровне информационной модели, а не на уровне синтаксиса. Во всем Интернете схема RDF является фундаментальной технологией, поскольку она позволяет машинам делать собственные выводы об информации, собранной в Интернете.

Самой большой проблемой в этой области являются не сетевые технологии, а очень типичное описание объектов и отношений, называемое онтологией. Существуют ограничения относительно использования семантических организаций в автомобильной промышленности, например, если не существует промышленной онтологии для автомобильных запчастей. Такие организации, как Dublin Core Metadata Initiative, уже некоторое время занимаются разработкой таких словарей и достигли определенного прогресса как в самих онтологиях, так и в инструментах для управления ими. Действительно, уже идет процесс, направленный на то, чтобы сделать форму RDF еще одним шагом вперед в определении онтологий. MIT/LCS инициировал разработку онтологии DAML (DARPA Agent Mark-up Language). Его название можно перевести как "язык разметки агентов DARPA". Это звучит несколько угрожающе, учитывая военные цели DARPA.

Идея семантической организации уже вызвала большое замешательство в сообществе XML, и этот процесс, несомненно, будет продолжаться. Более того, за последние шесть месяцев резко возросла активность W3C и MIT/LCS в области Семантической организации и заметно возрос интерес сообщества к RDF. Обсуждается полезность этой технологии и сложности использования RDF. Создание семантически насыщенных документов относительно просто и в основном касается сбора, категоризации и улучшения данных. Несмотря на простоту моста XHTML/XSLT, RDF по-прежнему является отправной точкой для семантической организации. Однако идея машиночитаемой семантической организации может быть реализована с помощью ряда технологий. Хотя некоторые жалуются на отсутствие четкого определения семантической организации, ее действительно глобальный подход полностью отражает ее тонкое, но фундаментальное влияние на организацию.

Оцените статью