Документация модуля обработки семантических данных TRaC/RDF

Эта страница является частью документации сервиса TRaC, и посвящена использованию возможностей работы с семантически организованными данными.

Общее описание сервисов TRaC/RDF

Сервис TRaC включает возможности организации данных с семантическим аннотированием в соответствии с концепцией RDF и извлечения данных средствами языка запросов SPARQL.

Организация семантических данных

Табличные данные могут быть средствами TRaC/RDF преобразованы в семантически организованные данные для последующей загрузки в RDF-хранилище, извлечения и обработки. Семантическая организация осуществляется путем применения к табличному набору данных (например, к такому) схемы - "семантического контракта" (например, такой).

Извлечение семантических данных

Загруженные в RDF-хранилище данные могут быть извлечены и сериализованы с помощью так называемых комплексных запросов. "Комплексные запросы" (пример) представляют собой набор инструкций для извлечения, трансформации (парсинга) извлеченных данных данных и их преставления. Комплексный запрос включает в себя следующие элементы (разделы):

  • SPARQL-запрос для извлечения данных
  • XQuery-запрос (или XLST-инструкция) для трансформации (парсинга) извлеченных данных
  • шаблон в формате XHTML, в который будут помещены обработанные данные
  • параметры извлечения и трансоформации:
    • формат сериализации извлекаемых из RDF-хранилища данных (xml или json (по умолчанию))
    • формат сериализации результата - любой релевантный mime-тип, например, text/plain, text/csv, xml (по умолчанию), html, json

API

API TRaC предоставляет методы для трансформации табличных данных (в формате TRCI) в семантически организованные RDF/XML путем применения семантического контракта и их загрузки в RDF-хранилище для последующей обработки:

  1. Трансформация из формата trci в RDF/XML
    • точка доступа: /garpix/semantik/app/app/api/v0.1/transfom/trci-rdf
    • метод: POST
    • Content-Type: multipart/form-data
    • параметры:
      • trci - строка, содержащая табличные данные в формате TRCI (Content-Type: application/xml)
      • schema - строка, содержая URI семантического контракта (Content-Type: text/plain)
  2. Загрузка семантически организованных данных формата RDF/XML в RDF-хранилище:
    • точка доступа: /...
    • метод: POST
    • Content-Type: multipart/form-data
    • параметры:
      • rdf-xml - строка, содержащая граф RDF/XML (Content-Type: application/rdf+xml)
      • graph - строка, содержая URI графа в хранилище (Content-Type: text/plain)