Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.

Обратная связь

Презентация на тему Максимально длинная общая подпоследовательность (МДП, LCS)

Содержание

2. Вычисление длины МПД: L(0, j) = 0;
3. Алгоритм Хишберга (Hirschberg D.S.) – линейная памятьПусть
4. Адаптивные алгоритмы вычисления длины МПД: Hunt -
5. Адаптивные алгоритмы вычисления длины МПД: Nakatsu-Kambayashi-Yajima Ri
6. Близкие задачи:задача о наикратчайшей надпоследовательностизадача о медиане
7. Расстояния и меры сходства, отличные от
8. Мера сходства, учитывающая частоты встречаемости l-грамм:
9. Ранговые меры близости. Коэффициент корреляции τПусть l-граммы
10. Ранговые меры близости. Коэффициент корреляции τ
11. Ранговые меры близости. Коэффициент Спирмэна Пусть l-граммы
12. Ранговые меры близости. Коэффициент Спирмэна
13. Ранговые меры близости. Коэффициент конкордации W W
14. Обобщение подхода Лемпеля-Зива Представление S1 в виде
15. Относительная сложность и редакционное расстояниеS2
16. Трансформационное расстояние Трансформационое расстояние и относительная сложность
17. Инверсионное расстояние Инверсионное расстояние dI(π,σ) между последовательностями
18. Точки разрыва π0 = 0 and πN+1
19. Скачать презентацию
20. Похожие презентации

Вычисление длины МПД: L(0, j) = 0; L(i, 0) = 0; 0 ≤ i ≤ m; 0 ≤ j ≤ n;Пример. А = aacacbb; B = ababc. L(A,B) = 3. Всего 13

Главная
Информатика
Максимально длинная общая подпоследовательность (МДП, LCS)

Максимально длинная общая подпоследовательность (МДП, LCS)Последовательность U является подпоследовательностью А, если

Вычисление длины МПД: L(0, j) = 0; L(i, 0) = 0;

Алгоритм Хишберга (Hirschberg D.S.) – линейная памятьПусть L*(i, j) – длина МДП

Адаптивные алгоритмы вычисления длины МПД: Hunt - Shimanski Qi k – наим.

Адаптивные алгоритмы вычисления длины МПД: Nakatsu-Kambayashi-Yajima Ri k – max j, такое

Близкие задачи:задача о наикратчайшей надпоследовательностизадача о медиане (string merging): построение текста Т3,

Расстояния и меры сходства, отличные от ред. расстояния Пусть T1 и

Мера сходства, учитывающая частоты встречаемости l-грамм: где α – произвольная цепочка

Ранговые меры близости. Коэффициент корреляции τПусть l-граммы в Φ l(T1) и Φ

Ранговые меры близости. Коэффициент корреляции τ

Ранговые меры близости. Коэффициент Спирмэна Пусть l-граммы в Φ l(T1) и Φ

Ранговые меры близости. Коэффициент Спирмэна

Ранговые меры близости. Коэффициент конкордации W W используется для сравнения m последовательностей.

Обобщение подхода Лемпеля-Зива Представление S1 в виде конкатенации фрагментов из S2 назовем

Относительная сложность и редакционное расстояниеS2 = aaaa a

Трансформационное расстояние Трансформационое расстояние и относительная сложность идейно близки.Операция «вставка сегмента» используется,

Инверсионное расстояние Инверсионное расстояние dI(π,σ) между последовательностями π и σ определяется минимальным

Точки разрыва π0 = 0 and πN+1 = N + 1π and

Инверсионное расстояние, число точек разрыва и относительная сложностьr(π,σ) ≤ 2dI(π,σ)Точки разрыва однозначно

Слайды презентации

Слайд 2 Вычисление длины МПД:
L(0, j) = 0; L(i,

0) = 0;
0 ≤ i ≤ m;

0 ≤ j ≤ n;

Пример. А = aacacbb; B = ababc. L(A,B) = 3.
Всего 13 МДП:
3 – abb,
6 – aab,
4 – aac

Слайд 3 Алгоритм Хишберга (Hirschberg D.S.) – линейная память
Пусть L*(i,

Алгоритм Хишберга (Hirschberg D.S.) – линейная памятьПусть L*(i, j) – длина

j) – длина МДП текстов А[i + 1 :

m] и B[j + 1 : n].
Тогда для любого i: L(m,n) = maxj{L(i, j) + L*(i, j)}

Слайд 4 Адаптивные алгоритмы вычисления длины МПД: Hunt - Shimanski Qi k

– наим. j, такое что (L(A[1 : i], B[1

: j]) = k

Начальные условия:
Qi,0 = 0, 0 ≤ i ≤ n;
Q0k = n + 1, 1 ≤ k ≤ min(m,n);
Пример. А = aacacbbс,
B = ababc.
Трудоемкость: O(r × log n),

где

число потенциально возможных парных соответствий символов

Слайд 5 Адаптивные алгоритмы вычисления длины МПД: Nakatsu-Kambayashi-Yajima Ri k – max

Адаптивные алгоритмы вычисления длины МПД: Nakatsu-Kambayashi-Yajima Ri k – max j,

j, такое что (L(A[i : m], B[j : n])

= k

Начальные условия:
Ri,0 = n + 1, 0 ≤ i ≤ m;
Rm + 2 – k, k = 0, 1 ≤ k ≤ min(m,n);
Пример. А = aacacbb,
B = ababc.
Трудоемкость: O(n× (m – L)),

Слайд 6 Близкие задачи:

задача о наикратчайшей надпоследовательности

задача о медиане (string

Близкие задачи:задача о наикратчайшей надпоследовательностизадача о медиане (string merging): построение текста

merging): построение текста Т3, сумма переходов к которому от

Т1 и Т2 минимальная. В зависимости от весов ред. операция в качестве Т3 можно получить МДП, наименьшую надпоследовательность, один из текстов (Т1 или Т2), наиболее вероятного предка и т.п.

поиск максимально длинной общей подпоследовательности для группы текстов.

задача о максимально длинной возрастающей (убывающей) подпоследовательности для числовой перестановки

Слайд 7 Расстояния и меры сходства, отличные от ред.

Расстояния и меры сходства, отличные от ред. расстояния Пусть T1

расстояния
Пусть T1 и T2 два текста.
Назовем совместной

частотной характеристикой l-го порядка
текстов T1 и T2 совокупность элементов
Φ l (T1, T2)= {φ l1(T1, T2), φ l2(T1, T2), …, φ l Ml (T1, T2)}
где Ml = Ml (T1, T2) — число l-грамм, общих для обоих текстов,
а элемент φ l i (1 ≤ i ≤ Ml) есть тройка:
<< i-я общая l-грамма – xi,
частота ее встречаемости в T1 – F(T1, xi) и в T2 – F(T2, xi) >>.
Простейший набор мер сходства, упорядоченный по возрастанию l
имеет вид:
,

l = 1,2,…,lmax(T1,T2)

Слайд 8 Мера сходства, учитывающая частоты встречаемости
l-грамм:

где

Мера сходства, учитывающая частоты встречаемости l-грамм: где α – произвольная

α – произвольная цепочка текстов T1 и (или) T2,

| α | – ее длина.
(Findler N.V., Van Leeuten, 1979)

Слайд 9 Ранговые меры близости. Коэффициент корреляции τ
Пусть l-граммы в

Ранговые меры близости. Коэффициент корреляции τПусть l-граммы в Φ l(T1) и

Φ l(T1) и Φ l(T2) упорядочены по убыванию частот.

Порядковое место l-граммы xi в упорядочении определяет ее ранг –
r(T1 , xi) (соответственно, r(T2 , xi)).

Слайд 10 Ранговые меры близости. Коэффициент корреляции τ

Слайд 11 Ранговые меры близости. Коэффициент Спирмэна
Пусть l-граммы в

Ранговые меры близости. Коэффициент Спирмэна Пусть l-граммы в Φ l(T1) и

Φ l(T1) и Φ l(T2) упорядочены по убыванию частот;

порядковое место l-граммы xi в упорядочении определяет ее ранг –
r(T1 , xi) (соответственно, r(T2 , xi)).
Группы равночастотных l-грамм представляются усредненным рангом.
Введем l-граммный аналог расстояния:

где Σl – совокупность всевозможных цепочек длины l ; | Σl | = Rl = nl.
Аналогом коэффициента Спирмэна для характеристики l-го порядка
(l = 1,2,…) является

(**)

При наличии равночастотных l-грамм в (**) вносится поправка на "связанность" рангов. (Кендел М. Ранговые корреляции, М., Статистика, 1975)

Слайд 12 Ранговые меры близости. Коэффициент Спирмэна

Слайд 13 Ранговые меры близости. Коэффициент конкордации W
W используется

Ранговые меры близости. Коэффициент конкордации W W используется для сравнения m

для сравнения m последовательностей.

Вычисляем суммы рангов каждого объекта

Среднее значение суммы рангов одного объекта составляет ES = m(n+1)/2.

S – сумма квадратов отклонений от ES

Равночастотным l-граммам назначаются усредненные ранги и в определения τ, ρ, W вносится поправка на "связанность".
t – число элементов в одной группе.

W, в отличие от τ и ρ изменяется от 0 до 1.

Слайд 14 Обобщение подхода Лемпеля-Зива

Представление S1 в виде конкатенации

Обобщение подхода Лемпеля-Зива Представление S1 в виде конкатенации фрагментов из S2

фрагментов из S2 назовем сложностным разложением S1 по S2.

На каждом шаге копируется максимальный фрагмент S2, совпадающий с префиксом непокрытого участка S1
Если такого фрагмента нет, используется операция генерации символа
c(S1 / S2) – сложность S1 относительно S2 определяется числом компонентов в разложении S1 по S2

Слайд 15 Относительная сложность и редакционное расстояние
S2

Относительная сложность и редакционное расстояниеS2 = aaaa a cccc

= aaaa a cccc c ttttttttttttt – acacacac

a atatatat
S1 = aaaa g cccc g ttttttttttttt g acacacac g atatatat
d(S1,S2) = 4
H(S1/S2) = aaaa*g*cccc*g*ttttttttttttt*g*acacacac*g*atatatat
c(S1/S2) = 9

c (S1/S2) ≤ 2d(S1, S2) + 1

S2 = –––––---tttttttttttttttttaaaaaaaa
S1 = aaaaaaaattttttttttttttttt––---–––

d (S1 , S2) = 16

H(S1 / S2) = aaaaa * ttttttttttttttttt
с (S1 / S2) = 2

Слайд 16 Трансформационное расстояние
Трансформационое расстояние и относительная сложность идейно

Трансформационное расстояние Трансформационое расстояние и относительная сложность идейно близки.Операция «вставка сегмента»

близки.
Операция «вставка сегмента» используется, если посимвольная генерация фрагмента «дешевле»

его копирования.
Порядок покрытия S1 предполагает оптимизацию по всем парам межтекстовых повторов и промежуткам между ними. O(N6).
J.-S.Varré, J.-P.Delahaye, E. Rivals: Transformation Distances: a Family of Dissimilarity Measures Based on Movements of Segments. // Bioinformatics 15(3): 194-202 (1999)

Слайд 17 Инверсионное расстояние
Инверсионное расстояние dI(π,σ) между последовательностями π

Инверсионное расстояние Инверсионное расстояние dI(π,σ) между последовательностями π и σ определяется

и σ определяется минимальным числом инверсий, переводящих одну из

них в другую Задача вычисления инверсионного расстояния для перестановок является NP-полной
В случае "знаковых" перестановок существуют полиномиальные решения
+1 [+2 −4 −5 ] +3 +6 → +1 +5 +4 −2 +3 +6

Hannenhalli, S. and Pevzner, P. Transforming Cabbage into Turnip (Polynomial Algorithm for Sorting Signed Permutation by Reversals). Proc. 27th Ann. ACM Symposium on the Theory of Computing, 1995, pp. 178–189

Слайд 18 Точки разрыва
π0 = 0 and πN+1 =

N + 1
π and σ − произвольные перестановки.
Разрыв между

πi = a и πi+1 = b фиксируется, если в σ нет биграмм ab и ba.
π = 0 | 6 4 | 1 8 5 | 3 | 2 9 7 | 10 r(π, σ) = 5
σ = 0 | 5 8 1 | 2 9 7 | 6 4 | 3 | 10

σ − тождественная перестановка (1 2 … N).
Число точек разрывов (breakpoint distance) r(π, σ) определяется количеством позиций π таких что | πi − πi+1| ≠ 1.
1 2 3 | 8 7 6 | 4 5 | 9