ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 2

ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 1
ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 2
ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 3

1. “tips and tricks”: LA? L(a(1),..., a(n )). Таким образом, линейное подпространство, порождённое набором векторов, совпадает с подпространством значений матрицы, составленной из векторов набора, как из столбцов.
2. “tips and tricks”: для элементов столбцового и строчного представления матрицы A? Rm ?n справедливы соотношения a( j )? Ae( j ), j? 1,n, T(i )? eT A,i? 1,m.
3. “tips and tricks”: для произведения произвольных матриц? c T B,C со столбовым и строчным ??? (1)? представлением B? (b(1)#...#b(r )),b( j )? Rm, j? 1,r ,C?? " ?,c (r ) ,c(i)? Rn, i? 1,r соответ- ?c T?? (r )? ственно и диагональной матрицы?? diag(?1,..., ?r ) справедливо соотношение rB?C??? b(i )c T. i i ?1 (i )Важной составляющей аппарата конструктивного описания и использования линейных структур является понятие ортогонального проектора, которое полностью отвечает стандартному геометрическому представлению об ортогональном проектировании. Общей, основой эффективного использования ортогональных проекторов является наличие двух эквивалентных определений таких проекторов и возможности их конструктивного построения в связи с линейными подпространствами через псевдообращение.
4. “tips and tricks” («геометрическое определение ортогонального проектора»): для разложения R p? L? L? в прямую сумму ортогональных подпространств ортогональным проектором PL на линейное подпространство PL x? PL (x L? x L? )? x L, где L? R p называется оператор, определяемый соотношением x? x L? x L?, x L? L, x ?L? L?(1)– однозначное представление произвольного вектора x? R p по двум составляющим ортого-нальной суммы. Очевидным образом оператор ортогонального проектирования является линейным оператором.
5. “tips and tricks”: разложение (1) произвольного вектора x? R p в силу симметричности относительно ортогональных слагаемых определяет одновременно два ортогональных проектора: P, P? сL L очевидным соотношением P? P ?L? E p, где E p – единичная матрица соответствующейразмерности.
6. “tips and tricks”: для ортогональногопроектора PL на подпространство L оператор Z L? E p? PL является ортогональным проектором на ортогональное дополнение L? к L: Z? E p? PL? P? .L
7. “tips and tricks“(абстрактное определение ортогонального проектора): для того, чтобы линейный оператор P: R p > R p, был оператором ортогонального проектирования необходимо и достаточно, чтобы он был идемпотентным симметричным оператором. Линейное пространство LP, на которое совершается ортогональное проектирование в соответствии с «геометрическим определением» описывается одним из двух соотношений: L? { x: x? Pu, u? R p }? { x: x? Px, x? R p }.
8. “tips and tricks“(сингулярное или SVD- представление произвольной A? Rm ?n ): для произвольной A? R m ?n ранга r? min(m,n ) справедливо следующее представление матрицы в виде взвешенной суммы тензорных произведений r T где: A?? ?i uivi i ?1, (2) — ?2?…? ?2? 0 общий набор ненулевых собственных чисел матриц AAT, AT A .1- ui r? R m ,i? j,r — ортонормированный набор собственных векторов матрицы AAT, отвечающих ненулевым собственным T 2 2T числам: AA ui? ?i, ?i? 0,i? 1,r ,u i u j? ?ij ,i? j; — vi? R n ,i ?j,r — ортонормированный набор собственных векторов матрицы AT A, отвечающих ненулевым собственным числам: T 2 2 T A Avi? ?i vi, ?i? 0,,i? 1,r ,vi v j? ?ij ,i? j.
9. “tips and tricks“(определение псевдообращения через SVD — представление матрицы): для произвольнойA? R m ?n с SVD — представлением (2) псевдообратная к ней, A?, определяется соотношением r? ?1 T m n A?? ?i vi ui: Ri ?1 > R. (3)Псевдообращение в дальнейшем будет обозначаться аббревиатурой ПдО.Заметим, что SVD — определение ПдО (соотношение (3)) позволяет легко установить, что ПдО коммутирует с транспонированием, а также ряд других полезных соотношений, в частности, что AT (AT )?? A? A.
10. “tips and tricks“: ортогональные проекторы на L A, L A Tопределяется соотношениемrAA??? T, i ?1 AT (AT )? r? A? A? ?v v T i i i ?1

( Читать дальше )

СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 3

Иерархическая трёхуровневая онтология внешнего мира

СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 1
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 2
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 3
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 4

В общем случае в искусственном интеллекте понятие «картина мира» появляется как синоним понятий
«модель мира», «модель предметной области» [Штерн, стр.156]. В области Knowledge representation исследователями предложено немало онтологических систем репрезентации концептуальных знаний о мире (известные онтологии Дж. Совы, Микрокосмос, РуТЕЗ* и другие). Обладая мощным философским и лексическим потенциалом, общие онтологии скорее относятся к области гносеологических моделей, чем к системам, пригодным для семантического анализа текстов живого языка: взаимодействие онтологий с реальным текстом, так же как и результаты онтологической работы, остаются не определёнными.
В предлагаемой структуре Системы семантического анализа ЕЯ текста онтологии отводится ведущая роль. Как система отображения общественного интеллекта она позволяет интерпретировать текстовую информацию на языке общих знаний и объединяет тройку «автор – текст – потребитель» в единую интеллектуальную среду. Любое явление может быть понято и интерпретировано только в контексте общепринятого и стабильного знания.
Базисом Системы служит новая иерархическая трёхуровневая онтология – ИО*3 [Гладун и др., 2008]. Она отличается двумя особенностями: (а) сетевая структура даёт принципиальную возможность объединить – в рамках единой конструкции – знания высшего уровня абстракции, общедоступные (повседневные и актуальные) знания среднего уровня и профессиональные знания нижнего уровня; (б) одновременно она ориентирована на работу с конкретными текстами. Кроме того, показано, что (в) результатом извлечения из текста знаний должен быть «онтологический смысл». Этот смысл поддаётся строгой формализации и компьютерной обработке [Святогор и Гладун, 2009].
Иерархическая трёхуровневая онтология ИО*3 представляет собой семантическую сеть в форме концептуального ориентированного графа.

( Читать дальше )

СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 2

Какие выводы следуют из расширенного толкования понятия «Текст»?

СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 1
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 2
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 3
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 4

Решению задачи полного раскрытия семантического ресурса текста, на наш взгляд, способствует такая Система семантического анализа ЕЯ текстов (Система), которая удовлетворяет следующим требованиям:
Первое. Партнёры интеллектуального общения вместе с текстом погружены в единую компьютерную среду онтологического знания.
Второе. Предварительная лингвистическая обработка исходного текста (морфологический, синтаксический и семантический анализ предложений) необходима для снятия «лексической оболочки» и выделения термов, несущих содержательную нагрузку.
Третье. Результатом компьютерного семантического анализа связного текста должен быть формальный или адаптированный текст ЕЯ, который выражает его смысловое содержание.
Четвёртое. Система должна обеспечивать самоконтроль авторского намерения – насколько адекватно он выражает свои мысли.
Пятое. Система должна многократно активизировать текст с целью более глубокого проникновения в смысл сообщения.
В результате самого общего взгляда на желаемые качества Системы семантического анализа можно сделать вывод, что потенциальные возможности текста реализуются при помощи двух механизмов: анализа через онтологию и активного диалога.

( Читать дальше )

СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 1

СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА

СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 1
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 2
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 3
СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВ ЕСТЕСТВЕННОГО ЯЗЫКА: ЦЕЛИ И СРЕДСТВА часть 4
Авторы: Леонид Святогор, Виктор Гладун
Аннотация: В данной работе предлагается расширенное толкование понятия «текст естественного языка» и предлагается схема полного освоения его семантического ресурса за счёт «компьютерного понимания» и диалога. Указываются средства достижения указанной цели в процессе семантической обработки текстов – использование трёхуровневой онтологии для извлечения из текста онтологического смысла, а также ввод обратной связи для дополнительного уточнения в диалоге содержания дискурса.

Ключевые слова: семантический анализ текста, онтология, смысл, диалог.
ACM Classification Keywords: 1.2.7 Natural Language Processing — Text analysis
Conference: The paper is selected from XVth International Conference “Knowledge-Dialogue-Solution” KDS-2 2009, Kyiv, Ukraine, October, 2009.

Введение

В начале и в конце семантического анализа естественно-языковых текстов стоит Слово. Методы анализа разнообразны и зависят от решаемой в прикладной области задачи, и существует не одно направление обработки текстовой информации. В условном разделении можно выделить методы семантической обработки текстов, которые нацелены на «лингвистические преобразования», например – перевод на иностранный язык и обратно; краткий пересказ; конспектирование; тезисное представление; аннотирование и на решение других прагматических задач. С другой стороны, у исследователей искусственного интеллекта интерес к тексту лежит в области «извлечения знаний» – классификация сообщений, ответы на вопросы, контекстный перевод и понимание дискурсов [Sowa,2002]. Здесь применяются методы концептуального анализа. При этом можно заметить оформление двух проблем: (а) синтез систем представления знаний – онтологий и (б) разработка систем семантического анализа и машинного «понимания» текстов при помощи онтологий.
Проблема (а) решается широким фронтом; из последних, практически успешных работ можно указать на исследование [Палагин и др., 2009], где из корпуса профессиональных текстов автоматически извлекается подструктура знаний в одном из разделов предметной области (ПрО) «Материаловедение». Для синтеза онтологии используются формально-логические и синтаксические средства анализа.

( Читать дальше )
  • +3
  • 2 ноября 2009, 17:22
  • yxom
  • 1

МЕТОДЫ И СРЕДСТВА СЕГМЕНТАЦИИ ПОЛЬЗОВАТЕЛЕЙ WEB-САЙТОВ часть 2

МЕТОДЫ И СРЕДСТВА СЕГМЕНТАЦИИ ПОЛЬЗОВАТЕЛЕЙ WEB-САЙТОВ часть 1
МЕТОДЫ И СРЕДСТВА СЕГМЕНТАЦИИ ПОЛЬЗОВАТЕЛЕЙ WEB-САЙТОВ часть 2

3. Сравнительный анализ основных подходов к сегментации пользователей сайтов
Рассмотрим существующие на сегодняшний день основные подходы к сегментации, принятые в Web Usage Mining [Markov, 2007] для анализа пользователей, и методы сегментации потребителей, используемые в маркетинговых исследованиях [Weinstein, 2004]. В зависимости от способа разбиения на сегменты, их можно разделить на методы сегментации «с учителем», «с подкреплением» и «без учителя».
3.1. Методы сегментации «с учителем»
Для методов сегментации «с учителем» характерна частичная предопределённость целевых метрик и наличие обучающих образцов [Mason, 2006], [Markov, 2007]. Получаемые сегменты основаны на некоторой предопределённой классификации, которая может быть простой (например, пол мужской/женский) или более сложной (например, «Первые пользователи с отменённой покупкой телевизора»). Разбиение выполняется на основе гипотезы об интересности, важности и значительности будущих сегментов.
Большинство существующих на сегодня средств анализа пользователей сайтов, такие как Google Analytics, Coremetrics, предлагают детерминированные подходы к сегментации с использованием статистических методов [Liu, 2008]. При этом данные могут обобщаться в предопределённые блоки вроде дней посещений, отдельных сессий, посетителей или доменов, из которых поступил запрос пользователя.
Как правило, методы обучения «с учителем» выполняются за 3 шага [Markov, 2007]: 1) составляется тренировочный набор данных с предварительно классифицированными значениями целевых переменных в дополнении к независимым переменным; 2) путём обучения с помощью тренировочного набора данных создаётся и проверяется модель классификации; 3) полученная модель применяется для классификации новых пользователей.

( Читать дальше )

СЛОЖНОСТНО–СТРУКТУРНЫЙ ПОДХОД К ИССЛЕДОВАНИЮ ОБЛАСТИ ПРИМЕНИМОСТИ АЛГОРИТМА PROFIT часть 2

СЛОЖНОСТНО–СТРУКТУРНЫЙ ПОДХОД К ИССЛЕДОВАНИЮ ОБЛАСТИ ПРИМЕНИМОСТИ АЛГОРИТМА PROFIT часть 1
СЛОЖНОСТНО–СТРУКТУРНЫЙ ПОДХОД К ИССЛЕДОВАНИЮ ОБЛАСТИ ПРИМЕНИМОСТИ АЛГОРИТМА PROFIT часть 2

Обращение матрицы A осуществляется с помощью итеративного LSQR алгоритма [Слуис, Ворст, 1987], который достаточно быстро сходится при хорошо подобранных параметрах регуляризации Am (амплитуда демпфирования) и Sm (весовой параметр сглаживания скоростных вариаций в соседних
узлах параметризационной сетки). Итерационно решаем систему уравнений:? A?? dT?? ???? am I ?d??? 0? .(6) ????? sm C?? 0?
Где I – диагональная единичная матрица размера M, C — прямоугольная матрица, каждая линия которой состоит из двух единичных элементов противоположного знака, являющихся соседними узлами в параметризационной сетке.
Оптимальные значения этих параметров зависят от многих факторов. Например, при увеличении размера данных параметр демпфирования должен увеличиваться, в то время как при увеличении числа узлов вследствие измельчения разбиения параметр демпфирования должен быть уменьшен. В случае же большого уровня шума в данных параметр демпфирования должен быть достаточно весомым для сохранения устойчивости решения. Процедура нахождения коэффициентов демпфирования до сих пор не формализована. К тому же соотношение между числом параметров, лучей и значениями коэффициентов амплитуд и сглаживания является нелинейным. Например, при удвоении числа лучей соответствующая амплитуда решения получается увеличением коэффициента демпфирования до 1.2. Для каждой сети наблюдений эти значения определяются индивидуально. В качестве основного критерием при нахождении весовых коэффициентов демпфирования используется оценка среднеквадратического среднего (RMS) на каждой итерации. Но он не является абсолютно объективным, поскольку не обеспечивает устойчивости решения. Альтернативным подходом, реализованным в программе PROFIT, к определению оптимальных значений параметров демпфирования является синтетическое моделирование на тестовых примерах с аномалиями фиксированного размера. Например, тесты с шахматной доской.
Скоростные аномалии, полученные после инверсии, вычисляются по регулярной сети и добавляются в скоростную модель, полученную на предыдущей итерации.

( Читать дальше )

СЛОЖНОСТНО–СТРУКТУРНЫЙ ПОДХОД К ИССЛЕДОВАНИЮ ОБЛАСТИ ПРИМЕНИМОСТИ АЛГОРИТМА PROFIT часть 1

СЛОЖНОСТНО–СТРУКТУРНЫЙ ПОДХОД К ИССЛЕДОВАНИЮ ОБЛАСТИ ПРИМЕНИМОСТИ АЛГОРИТМА PROFIT

СЛОЖНОСТНО–СТРУКТУРНЫЙ ПОДХОД К ИССЛЕДОВАНИЮ ОБЛАСТИ ПРИМЕНИМОСТИ АЛГОРИТМА PROFIT часть 1
СЛОЖНОСТНО–СТРУКТУРНЫЙ ПОДХОД К ИССЛЕДОВАНИЮ ОБЛАСТИ ПРИМЕНИМОСТИ АЛГОРИТМА PROFIT часть 2

Татьяна Ступина, Иван Кулаков
Аннотация: В работе представлена формальная постановка сложностно — структурного подхода к исследованию области применимости алгоритма PROFIT (PROfile Forward and Inverse Tomographic modeling). Основная идея состоит в определении кластера моделей среды (разреза геологического строения земной коры), представленных изображениями, которые с допустимой погрешностью восстанавливаются алгоритмом. Метрика в пространстве изображений задается специальным образом. Она учитывает изменение поля скоростей и аномальные включения, количественный и качественный состав которых отражает этапы усложнения моделей сред.
Ключевые слова: сейсмическое профилирование, томография, прямое моделирование, синтетическая модель.
ACM Classification: G1.10. Mathematics of Computing — Applications
Conference: The paper is selected from XVth International Conference “Knowledge-Dialogue-Solution” KDS-2 2009, Kyiv, Ukraine, October, 2009.

Введение
Подход к обработке экспериментальных данных зависит от специфики решаемой задачи в конкретной прикладной области и конечной цели, которая ставится в задаче. В различных областях знаний, целью которых является обнаружение причинно-следственных связей какого-либо процесса или явления, необходимо решать обратную задачу, которая, как правило, является неустойчивой как относительно входных данных, так и самого оператора инверсии. Для оценки качества полученного решения также необходимо уметь решать и прямую задачу. На каждом этапе возникают свои трудности, с которыми необходимо справляться, используя, предложенные к обработке данные и основываясь на выбранной модели. Оценить же качество выбранной модели независимо от качества обрабатываемых данных возможно лишь теоретически при известной «истинной» модели [Вапник, 1984].
В данной работе рассматривается алгоритм PROFIT прямого и обратного моделирования профильных данных в сейсмической томографии [Кулаков, 2007]. Преимущества данного алгоритма при решении задач на реальных и синтетических данных подробно отражены в работах И.Ю. Кулакова. В работе представлены основные этапы этого алгоритма, подчеркивающие многопараметрическую сложность и специфику решаемой задачи. Важной компонентой предложенного алгоритма является возможность построения реконструированной модели геологической среды, т.е. глубинного разреза, что является достаточно интересным и важным для задач геологической интерпретации в целях изучения строения земной коры и поиска полезных ископаемых. Для того чтобы оценить множество правдоподобных, относительно экспертных знаний о моделях сред, реконструкций предлагается сложностно — структурный подход.
В работе предложена формальная постановка сложностно — структурного подхода к исследованию области применимости алгоритма PROFIT. Основная идея состоит в определении кластера моделей среды, представленных изображениями глубинных разрезов, которые с допустимой погрешностью восстанавливаются алгоритмом. Элементы кластера формируются в метрическом пространстве изображений относительно некоторого экспертного шаблона (модель, допустимая по смыслу с точки зрения строения земной коры в данном регионе). Другими словами, задается критерий, определяющий допустимую реконструированную модель среды, построенную алгоритмом PROFIT для данного географического региона и фиксированной системы наблюдений.

( Читать дальше )

ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 3

ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ
ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 1
ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 2
ЛИНЕЙНЫЕ СТРУКТУРЫ В ПРИКЛАДНЫХ ЗАДАЧАХ И КОНСТРУКТИВНЫЕ МЕТОДЫ ИХ ОПИСАНИЯ часть 3

Применения “tips and tricks“- свойств ПдО: линейная регрессия, скалярные наблюдения

Применение ПдО в линейной регрессии определяется тем, что МНК – оценка ^? (оценка метода наименьших квадратов) неизвестного параметра?? R p линейной регрессии p ?1 y? ?? jj? 0 f j ( x )?? на основе наблюдений ( x, y ), x? Rm, y? R1, i? 1, n определяется решением оптимизационной задачи i i i i ^?? Arg min || X?? Y ||2, (11) ??R p в которой X — матрица плана, а Y — вектор – столбец с компонентами y? R1,i? 1,n – вектор наблюдений. В соответствии с соотношением (4) п.13 “tips and tricks“ общее решении задачи (11) определяется соотношением ^?? X ?Y? Z (X )v,v? R p * (12) со свободным параметром v? R p.
Решение задачи МНК — оценивания в виде (12) полностью согласуется с классическим решением уравнения Гаусса – Маркова в виде ^?? (X T X )?1 X TY, Поскольку в случае полного столбцового ранга матрицы плана X?? (X T X )?1 X TY а Z (X )? 0. В этом случае классическом случае множество МНК – оценок в (12) является одно элементным. Применения “tips and tricks“- свойств ПдО: задача терминального управления Под задачей терминального управления для линейноЙ динамической системы с дискретным временем x( k? 1)? A( k ) x( k ) ?b( k )u( k ), x( 0)? x( 0 ), где x( k )? R n, u(k)? R1, A( k )? R n? n, b( k )? R n, k? 0,N, имеют в виду задачу выбора такого управления u(k ), k? 0,N, которое позволяет вывести фазовую траекторию в момент N? 1 на уровень x(1) или, если это невозможно, выбором того же управления минимизировать отклонение 2x( N? 1)? x( 1). Принципиальным результатом для исследования задачи терминального управления является теорема редукции, позволяющая свести задачу терминального управления к СЛАУ.
Теорема (теорема редукции). Задача терминального управления является эквивалентной СЛАУ W ( N? 1)u? x( 1)? A( N? 1) A( N? 2)…A( 0) x( 0 ), в которой вектор u? R N ?1 – объединенный вектор управления, а матрица W ( N? 1) является блочной:
W ( N? 1) ??W ( N? 1,0) #W ( N? 1),1) #…#W ( N? 1,N )?, с блоками W ( N? 1),k ),k? 0,N, определяемыми соотношениями W ( N? 1,k )? A( N ) A( N? 1)…A( k? 1)b( k ),k? 0,N? 1, W ( N? 1,N )? b( N ).
Теорема редукции позволяет исчерпывающим образом исследовать задачу терминального управления с помощью пп.13,14 “tips and tricks”.

( Читать дальше )

МЕТОД ВЫДЕЛЕНИЯ ЗНАЧИМЫХ ДАННЫХ НА ИЗОБРАЖЕНИЯХ ИЗОХРОМНЫХ ЛИНИЙ ДЛЯ СИСТЕМ БЕСКОНТАКТНОГО ИЗМЕРЕНИЯ ВНУТРИГЛАЗНОГО ДАВЛЕНИЯ

МЕТОД ВЫДЕЛЕНИЯ ЗНАЧИМЫХ ДАННЫХ НА ИЗОБРАЖЕНИЯХ ИЗОХРОМНЫХ ЛИНИЙ ДЛЯ СИСТЕМ БЕСКОНТАКТНОГО ИЗМЕРЕНИЯ ВНУТРИГЛАЗНОГО ДАВЛЕНИЯ

Авторы: Наталия Белоус, Виктор Борисенко, Виктор Левыкин, Дмитрий Макивский, Анна Зайцева
Аннотация: Глаукома – это болезнь глаза, причиной которой является повышение внутриглазного давления. Если глазное давление при глаукоме вовремя не снизить до нормы, может погибнуть зрительный нерв, что приведет к необратимой слепоте. На сегодняшний деньпредложен принципиально новый способ измерения внутриглазного давления, базирующийся на обследовании роговицы глаза человека в поляризованном свете, что позволяет видеть на ней специфическую интерференционную картину. В работе авторами предлагается метод, позволяющий провести распознавание изображения глаза человека, отснятого в поляризованном свете, и выделить на исходном изображении данные, необходимые для разработки системы бесконтактного измерения внутриглазного давления. Проведенный анализ показал, что на сегодняшний день не существует аналогов реализации данного метода. Программная реализация метода позволит разработать программно-аппаратный комплекс, на порядок превосходящий существующие аналоги по стоимости и простоте исполнения, а также бесконтактно, быстро и точно измерять внутриглазное давление.
Ключевые слова: Внутриглазное давление, глаукома, диагностика, распознавание изображения, обработка изображения, изохрома, изоклина.
ACM Classification Keywords: I.5 Pattern Recognition, I.5.2 Design Methodology — Feature evaluation and selection.
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Сегодня при неизменных темпах роста науки и техники общество не может обходиться без компьютерной техники. Согласно данным Мировой организации здравоохранения, нагрузка на глаза человека выросла в 100 раз в 2000 году по сравнению с 1900 годом.

( Читать дальше )

ОЦЕНИВАНИЕ РИСКА РЕГРЕССИОННОЙ МОДЕЛИ В СЛУЧАЕ НЕИЗВЕСТНОГО РАСПРЕДЕЛЕНИЯ

ОЦЕНИВАНИЕ РИСКА РЕГРЕССИОННОЙ МОДЕЛИ В СЛУЧАЕ НЕИЗВЕСТНОГО РАСПРЕДЕЛЕНИЯ

Авторы: Татьяна Ступина, Виктор Неделько
Аннотация: В данной работе поднимается достаточно актуальная проблема оценивания качества решения в условиях отсутствия информации о распределениях. Для задачи регрессионного анализа рассматривается альтернативная функция риска, построенная ранговым методом. Отражены положительные и отрицательные стороны такого подхода. Статистическим моделированием получены точечные оценки эмпирической функции риска, отражающие обоснованность применения рангового метода в условия «полной неопределённости».
Ключевые слова: функция риска, эмпирическая функция риска, ранговая регрессия, класс линейных решающих функций.
ACM Classification Keywords: G3 Вероятность и Статистика – Корреляционный и Регрессионный анализ.
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Подход к обработке экспериментальных данных зависит от специфики конкретной области и конечной цели, которая ставится в задаче. В различных областях знаний, целью которых является обнаружение причинно-следственных связей, могут быть использованы одинаковые методы не всегда приводящие к удовлетворительному решению.

( Читать дальше )

ВЫЯВЛЕНИЕ ФРАКТАЛОПОДОБНЫХ СТРУКТУР В ДНК-ПОСЛЕДОВАТЕЛЬНОСТЯХ

ВЫЯВЛЕНИЕ ФРАКТАЛОПОДОБНЫХ СТРУКТУР В ДНК-ПОСЛЕДОВАТЕЛЬНОСТЯХ

Авторы: Владимир Гусев, Любовь Мирошниченко, Надежда Чужанова
Аннотация: Разработан и реализован алгоритм выявления фракталоподобных структур в ДНК- последовательностях. Фрактальность трактуется как самоподобие, основанное на свойстве симметрии или комплементарной симметрии. Локальные фракталы интересны своей способностью аккумулировать множественные палиндромно-шпилечные структуры с потенциально возможными регуляторными функциями. Выявлены реальные случаи проявления фрактальности в различных геномах: от вирусов до человека. Рассмотрена возможность использования фракталоподобных структур в качестве маркеров, различающих близкие классы последовательностей.
Keywords: DNA sequences, fractal-like structures, repeated fragments, palindrome, complementary palindrome.
ACM Classification Keywords: J. Computer Applications – J.3 Life and medical sciences – Biology and genetics; I. Computing Methodologies- I.5 Pattern recognition – I.5.2. – Design methodology –Feature evaluation and selection.
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Отдельные фрагменты ДНК характеризуются проявлениями самоподобия, основанного на свойстве симметрии или комплементарной симметрии. По ассоциации с работой [Mandelbrot, 1992], будем называть их локальными фракталами (при отсутствии искажений) или фракталоподобными структурами (при их наличии).

( Читать дальше )

ИСПОЛЬЗОВАНИЕ FRIS-ФУНКЦИЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ SDX

ИСПОЛЬЗОВАНИЕ FRIS-ФУНКЦИЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ SDX

Авторы: Ирина Борисова, Николай Загоруйко
Аннотация: Рассматривается задача структуризации избыточного набора информации, выявления основных закономерностей, содержащихся в нем с помощью аппарата FRiS-функций. В результате решения этой задачи (задачи SDX) на основе исходного множества объектов строится его сокращенное описание в терминах классов и существенных признаков. Данное описание снабжено системой правил, позволяющих восстанавливать значения всех признаков на основе существенных и находить место новым объектам в системе построенных классов.
Ключевые слова: Распознавание образов, выбор признаков, натуральная классификация, функция конкурентного сходства.
ACM Classification Keywords: I.5.2. Pattern Recognition
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Формализация человеческой способности к анализу информации дает возможность частично наделять этой способностью искусственные объекты – компьютеры. Даже самые примитивные модели анализа данных, перенесенные на компьютеры, позволяют достигать значительных результатов, так как использование этих моделей позволяет машинам решать задачи, недоступные человеку из-за своей громоздкости и трудоемкости.

( Читать дальше )

ОБ ОДНОЙ ЗАДАЧЕ РАСПОЗНАВАНИЯ ПОСЛЕДОВАТЕЛЬНОСТИ, ВКЛЮЧАЮЩЕЙ ПОВТОРЯЮЩИЙСЯ ВЕКТОР

ОБ ОДНОЙ ЗАДАЧЕ РАСПОЗНАВАНИЯ ПОСЛЕДОВАТЕЛЬНОСТИ, ВКЛЮЧАЮЩЕЙ ПОВТОРЯЮЩИЙСЯ ВЕКТОР

Авторы: Алексей Долгушев, Александр Кельманов
Аннотация: Рассматривается дискретная экстремальная задача, к которой сводится один из вариантов проблемы помехоустойчивого off-line распознавания векторных последовательностей, включающих в качестве элемента квазипериодически повторяющийся вектор евклидова пространства. Обоснован эффективный алгоритм решения задачи, гарантирующий оптимальность решения по критерию максимального правдоподобия в случае, когда помеха аддитивна и является гауссовской последовательностью независимых одинаково распределённых случайных величин.
Ключевые слова: помехоустойчивое распознавание, векторная последовательность, повторяющийся вектор, максимум правдоподобия, дискретная экстремальная задача, off-line алгоритм.
ACM Classification Keywords: F.2. Analysis of Algorithms and Problem Complexity, G.1.6. Optimization, G2. Discrete Mathematics, I.5. Pattern Recognition.
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Объект исследования работы – проблемы оптимизации в задачах анализа данных и распознавания образов. Предмет исследования – дискретная экстремальная задача, к которой сводится один из вариантов проблемы помехоустойчивого off-line распознавания векторной последовательности, как последовательности, включающей квазипериодически повторяющийся вектор, совпадающий с некоторым вектором из заданного алфавита векторов евклидова пространства.

( Читать дальше )

СЛОЖНЫЕ ЗАДАЧИ РАСПОЗНАВАНИЯ ОБРАЗОВ И ВОЗМОЖНОСТИ ИХ РЕШЕНИЯ

СЛОЖНЫЕ ЗАДАЧИ РАСПОЗНАВАНИЯ ОБРАЗОВ И ВОЗМОЖНОСТИ ИХ РЕШЕНИЯ

Авторы: Виктор Краснопрошин, Владимир Образцов
Аннотация: Рассматривается задача распознавания образов с обучением. Вводится понятие локальной разрешимости такой задачи и показано, что при некоторых, достаточно конструктивных условиях, задача распознавания является локально разрешимой. Получены критерий и два достаточных условия локальной разрешимости.
Ключевые слова: Задача распознавания образов с обучением, локальный подход, критерий и достаточны условия локальной разрешимости.
ACM Classification Keywords: I. Computing Methodologies; I.5 Pattern Recognition; I.5.1 Models; Subject descriptor: Models Deterministic
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Задача распознавания образов с обучением, как и любая другая задача информатики, может оказаться сложной. Понятие сложности может быть определено по-разному. Чтобы не быть связанными конкретными свойствами задачи, мы определим сложность задачи как некоторую совокупность характеристик, следствием которых является структурируемость информации. К числу таких характеристик можно отнести, к примеру, большую размерность задачи или большой объем обучающей и контрольной выборок.
Надо заметить, что в рамках детерминистского подхода [Журавлев, 1978] вопросы сложности почти не рассматривались. Поэтому в принципиальном смысле важен следующий вопрос: можно ли в рамках указанного подхода развить технику решения сложных задач распознавания образов?
В данной работе показано, что ответ на сформулированный выше вопрос является положительным. Для этого нами введено понятие локальной разрешимости задачи распознавания образов с обучением и для широкого класса моделей алгоритмов определены критерий и достаточные условия локальной разрешимости. В содержательном смысле предложенный подход близок к широко используемой в математике технике, суть которой звключается в декомпозиции задачи.
Полученные результаты свидетельствуют, что понятие сложности задачи распознавания является вполне конструктивным. А т.к. практические задачи с большими размерностью и/или объемами выборок становятся все более актуальными, то и результаты решения подобных задач приобретают несомненную важность.
Заключение

В работе описан один из возможных подходов к решению задачи распознавания образов в случаях, когда можно говорить о сложности априорной информации. В принципиальном смысле предлагаемый подход показывает, что со сложностью, которая является следствием большой размерности, можно справляться стандартным для математики способом – через декомпозицию задачи.
В настоящей работе рассматривается случай, когда на информации можно определить отношение эквивалентности. Показано, что для достаточно широкого класса алгоритмов, можно понизить сложность решения задачи распознавания. Сделано это на примере реализации корректных алгоритмов [Журавлев, 1978]. Полученные результаты могут послужить хорошей основой, как для дальнейших теоретических исследований, так и для решения конкретных практических задач.

КЛАССИФИКАЦИЯ И МОДЕЛИРОВАНИЕ ГЕНЕТИЧЕСКОГО КОДА И ГЕННО-НЕЙРОННЫХ СЕТЕЙ

КЛАССИФИКАЦИЯ И МОДЕЛИРОВАНИЕ ГЕНЕТИЧЕСКОГО КОДА И ГЕННО-НЕЙРОННЫХ СЕТЕЙ

Автор: Адиль Тимофеев
Аннотация: Предлагаются методы автоматической классификации и моделирования генетического кода. Излагаются принципы проектирования и результаты использования гетерогенных генно- нейронных сетей.
Ключевые слова: модели генетического кода, генетическая информатика, гетерогенная генно-нейронная сеть.
ACM Classification Keywords: E.4 Coding and Information Theory
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Основным “строительным материалом” живых организмов являются белки, включающие в себя 20 основных аминокислот. При биохимическом синтезе белков организма используется генетическая информация, закодированная в главном “наследственном материале” – дезоксирибонуклеиновой кислоте (ДНК) [1].

( Читать дальше )

ОПТИМИЗАЦИЯ ОЦЕНКИ ВЕРОЯТНОСТИ ОШИБОЧНОЙ КЛАССИФИКАЦИИ В ДИСКРЕТНОМ СЛУЧАЕ

ОПТИМИЗАЦИЯ ОЦЕНКИ ВЕРОЯТНОСТИ ОШИБОЧНОЙ КЛАССИФИКАЦИИ В ДИСКРЕТНОМ СЛУЧАЕ

Автор: Виктор Неделько
Abstract: The goal of the paper is to investigate what training sample estimate of misclassification probability would be the best one for the histogram classifier. Certain quality criterion is suggested. The deviation for some estimates, such as resubstitution error (empirical risk), cross validation error (leave-one-out), bootstrap and for the best estimate obtained via some optimization procedure, is calculated and compared for some examples.
Keywords: pattern recognition, classification, statistical robustness, deciding functions, complexity, capacity, overfitting, overtraining problem.
ACM Classification Keywords: G.3 Probability and statistics, G.1.6. Numerical analysis: Optimization; G.2.m. Discrete mathematics: miscellaneous.
Conference: The paper is selected from XVth International Conference «Knowledge-Dialogue-Solution» KDS 2009, Varna, Bulgaria, June-July 2009

Введение
Для оценивания качества решающих функций (одна из первых работ [Лбов, 1965]) в задачах распознавания образов (классификации с учителем) на практике обычно используются точечные оценки риска, т.е. вероятности ошибочной классификации.

( Читать дальше )

О НЕКОТОРЫХ ТРУДНОРЕШАЕМЫХ ЗАДАЧАХ ПОМЕХОУСТОЙЧИВОГО АНАЛИЗА СТРУКТУРИРОВАННЫХ ДАННЫХ

О НЕКОТОРЫХ ТРУДНОРЕШАЕМЫХ ЗАДАЧАХ ПОМЕХОУСТОЙЧИВОГО АНАЛИЗА СТРУКТУРИРОВАННЫХ ДАННЫХ

Автор: Александр Кельманов
Аннотация: Рассматриваются дискретные экстремальные задачи, к которым сводятся некоторые варианты проблемы помехоустойчивого off-line обнаружения в числовой последовательности повторяющегося фрагмента, а также некоторые варианты проблемы поиска подмножеств векторов во множестве векторов евклидова пространства. Анализируется сложность редуцированных оптимизационных задач и соответствующих им задач анализа данных и распознавания образов. Дан обзор новых и известных алгоритмических результатов по решению этих задач.
Ключевые слова: поиск подмножеств векторов, помехоустойчивое обнаружение повторяющегося фрагмента, кластерный анализ, дискретная оптимизация, NP-трудная задача, алгоритмы с гарантированными оценками точности.
ACM Classification Keywords: F.2. Analysis of Algorithms and Problem Complexity, G.1.6. Optimization, G2. Discrete Mathematics, I.5.3. Pattern Recognition: Clustering.
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Введение
Объект исследования работы – проблемы оптимизации в задачах анализа данных и распознавания образов. Предмет исследования – дискретные экстремальные задачи, к которым сводятся некоторые варианты проблемы помехоустойчивого off-line обнаружения повторяющегося фрагмента в числовой последовательности и некоторые варианты проблемы поиска подмножеств «похожих» векторов во множестве векторов евклидова пространства. Цель работы – обзор новых и известных результатов по изучению сложности, систематизации и исследованию алгоритмов решения этих задач. Данная работа дополняет сообщения [1-3].

( Читать дальше )

МНОГОКРИТЕРИАЛЬНАЯ ОПТИМИЗАЦИЯ АРХИТЕКТУРЫ НЕЙРОСЕТЕВЫХ КЛАССИФИКАТОРОВ

МНОГОКРИТЕРИАЛЬНАЯ ОПТИМИЗАЦИЯ АРХИТЕКТУРЫ НЕЙРОСЕТЕВЫХ КЛАССИФИКАТОРОВ

Авторы: Альберт Воронин, Юрий Зиатдинов, Анна Антонюк
Аннотация. Рассматривается постановка задачи и процедура векторной оптимизации архитектуры нейросетевого классификатора. В качестве целевой функции предложена скалярная свертка критериев по нелинейной схеме компромиссов. Используются поисковые методы оптимизации с дискретными аргументами. Приведен пример – нейросетевой классификатор текстов.
Ключевые слова: многокритериальная оптимизация, нейронные сети, классификатор.
ACM Classification Keywords: H.1 Models and Principles – H.1.1 – Systems and Information Theory; H.4.2 – Types of Systems; C.1.3 Other Architecture Styles – Neural nets
Conference: The paper is selected from International Conference «Classification, Forecasting, Data Mining» CFDM 2009, Varna, Bulgaria, June-July 2009

Содержание проблемы
Важной разновидностью искусственных нейронных сетей являются нейросетевые классификаторы. Они применяются для технической и медицинской диагностики, классификации различного рода информационных источников и пр. В достаточно общем случае структура q -слойного нейросетевого классификатора с прямыми связями.

( Читать дальше )

ОТОБРАЖЕНИЕ И ВЫВОД ПО АНАЛОГИИ НА ОСНОВЕ НЕЙРОСЕТЕВЫХ РАСПРЕДЕЛЕННЫХ ПРЕДСТАВЛЕНИЙ

ОТОБРАЖЕНИЕ И ВЫВОД ПО АНАЛОГИИ НА ОСНОВЕ НЕЙРОСЕТЕВЫХ РАСПРЕДЕЛЕННЫХ ПРЕДСТАВЛЕНИЙ

Авторы: Сергей Слипченко, Дмитрий Рачковский
Аннотация: Развит подход к рассуждениям по аналогии для иерархически структурированных описаний эпизодов, ситуаций и их компонентов на базе представлений аналогов в виде особой формы векторных представлений — распределенных кодвекторных представлений. Предложены распределенные представления компонентов аналогов, позволяющие непосредственно определять соответствующие друг другу представления компонентов для реализации стадии отображения двух аналогов, а также метод вывода по аналогии на их основе. Предложенные методы исследованы на базах аналогий, которые ранее применялись для исследования ведущих моделей аналогии — SME и ACME. Полученные результаты находятся на уровне результатах SME и ACME, однако за счет использования сходства векторных представления обладают низкой вычислительной сложностью и создают основу для более адекватного учета семантики аналогов и их компонентов. Это делает предложенные методы перспективными для отображения фрагментов баз знаний с большим числом компонентов.
Ключевые слова: аналогия, отображение аналогов, вывод по аналогии, распределенное представление информации, кодвекторы, базы знаний, SME, ACME
ACM Classification Keywords: I.2 Artificial Intelligence, I.2.4 Knowledge Representation Formalisms and Methods, I.2.6 Learning (Analogies)
Conference: The paper is selected from XVth International Conference «Knowledge-Dialogue-Solution» KDS 2009, Varna, Bulgaria, June-July 2009

Введение
Продуктивным подходом, используемым людьми при решении сложных задач в условиях неполноты, неточности, противоречивости входной информации, являются рассуждения на основе примеров решения похожих задач.

( Читать дальше )

ПРИМЕНЕНИЕ НЕЙРОННОЙ СЕТИ ХЕММИНГА И НЕЧЕТКОЙ ЛОГИКИ К ОБНАРУЖЕНИЮ КРАЕВ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ В ОТТЕНКАХ СЕРОГО

ПРИМЕНЕНИЕ НЕЙРОННОЙ СЕТИ ХЕММИНГА И НЕЧЕТКОЙ ЛОГИКИ К ОБНАРУЖЕНИЮ КРАЕВ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ В ОТТЕНКАХ СЕРОГО

Автор: Николай Мурга
Аннотация: В данной работе исследуется применение нейронной сети Хемминга для обнаружения краёв объектов на изображении. Изображение в оттенках серого, поступающее на вход предлагаемой системы, подвергается преобразованию с применением нечёткой логики в двуцветное. После этого из изображения последовательно выделяются блоки пикселей заданной размерности и подаются на входы предварительноинициализированной сети Хемминга. Нейронная сеть выполняет идентификацию краёв в блоке, и в новом изображении вставляет на место блока шаблон, который отвечает коду, полученному на выходе сети. Работу завершает практическое применение метода.
Ключевые слова: Детектирование краёв объектов изображения, Метод разностного группирования, Нейронная сеть Хемминга, Нечёткая логика.
ACM Classification Keywords: I.4.3. Enhancement – Grayscale manipulation, I.4.6. Segmentation – Edge and feature detection, I.4.6. Segmentation – Pixel classification.
Conference: The paper is selected from XVth International Conference «Knowledge-Dialogue-Solution» KDS 2009, Varna, Bulgaria, June-July 2009

Введение
В процессе медицинской диагностики часто возникает необходимость сегментации изображений. Медицинские изображения, а в частности рентген-изображения, характеризуются сильной зашумленностью. Для преодоления этого негативного фактора вышеуказанные методы должны обладать низкой чувствительностью к шумам. Одним из подходов к разрешению данной проблемы является применение нейронных сетей. В данной работе предлагается метод, который использует нечёткую логику и нейронную сеть Хемминга для обнаружения краёв объектов на рентген-изображениях.

( Читать дальше )