Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Аналіз методів автоматизованого пошуку електронних документів в великих

Метою дослідження є виконання аналізу методів та технологій і визначення необхідності автоматизованого пошуку електронних документів в великих слабоструктурованих масивах.Об’єктом дослідження є інформаційні технології виділення та обробки знань. Предметом дослідження – технологія Text Mining для автоматизованого пошуку
Аналіз методів автоматизованого пошуку електронних документів в великих слабо структурованих масивахВиконала: студенткагрупи Метою дослідження є виконання аналізу методів та технологій і визначення необхідності автоматизованого Значення інформаційних ресурсів Інформаційні технології виділення та обробки знань Аналіз програмного забезпечення для виявлення текстових документів Функціонування механізму роботи пошукової системи можна поділити на два основні, незалежні один Функція «Індексація документів, ключових слів і словосполучень» призначена для перетворення отриманої від Функція «Структурування індексованих документів» призначена для перетворення отриманої інформації до структурованого вигляду Позначимо запит користувача буквою q, а документ - буквою d. Метод зваженого За основу алгоритму Daitch-Makotoff у взято оригінальний Soundex, але він має значно Схема відповідностей літер до алгоритму Daitch-Makotoff Технологія аналізу тексту Text Mining містить 4 основні етапи В даний час пропонується досить багато інструментів текстомайнінга – від відносно простих КінецьДякую за увагу.
Слайды презентации

Слайд 2 Метою дослідження є виконання аналізу методів та технологій

Метою дослідження є виконання аналізу методів та технологій і визначення необхідності

і визначення необхідності автоматизованого пошуку електронних документів в великих

слабоструктурованих масивах.

Об’єктом дослідження є інформаційні технології виділення та обробки знань.

Предметом дослідження – технологія Text Mining для автоматизованого пошуку електронних документів у великих слабо структурованих масивах.

Слайд 3 Значення інформаційних ресурсів

Значення інформаційних ресурсів

Слайд 4 Інформаційні технології виділення та обробки знань

Інформаційні технології виділення та обробки знань

Слайд 5 Аналіз програмного забезпечення для виявлення текстових документів

Аналіз програмного забезпечення для виявлення текстових документів

Слайд 6 Функціонування механізму роботи пошукової системи можна поділити на

Функціонування механізму роботи пошукової системи можна поділити на два основні, незалежні

два основні, незалежні один від одного завдання: індексація метаданих

отриманих від пошукового агента і організація пошуку на підставі запиту користувача і індексованих в системі документів.

Загальна схема роботи системи пошуку і аналізу тексту


Слайд 7 Функція «Індексація документів, ключових слів і словосполучень» призначена

Функція «Індексація документів, ключових слів і словосполучень» призначена для перетворення отриманої

для перетворення отриманої від «агента» інформації у оптимальний для

системи вигляд і додавання її до бази даних.
Функція «Формування релевантного результату та ранжування документів» забезпечує організацію ранжування документів по мірі відповідності до запиту в залежності від наявності метаданих у термінах і їх частоти.
Функція «Ведення словників пошуку» призначена для організації роботи зі словниками термінів, сто-слів, атрибутів та ін. необхідних для прискорення процесу пошуку.
Функція «Формування ключової послідовності по запиту» необхідна для перетворення запиту користувача у прийнятний для системи вигляд.

Діаграма дерева функцій структурування тексту під час пошуку


Слайд 8 Функція «Структурування індексованих документів» призначена для перетворення отриманої

Функція «Структурування індексованих документів» призначена для перетворення отриманої інформації до структурованого

інформації до структурованого вигляду за для забезпечення швидкості обробки

текстів, підвищення її якості за допомогою «самонавчання».
Функція «Фонетичне виправлення інформаційного запиту» виконує підвищення релевантності пошукової системи шляхом корегування помилкових інформаційних запитів.
Функція «Формування динамічної релевантності документів» виконує аналіз callback’ів та на основі отриманих відомостей підвищує або понижує релевантність документа.
Функція «Формування запитів регіонального пошуку» забезпечує організацію пошуку інформації по вибраним державним регіонам.

Діаграма дерева функцій пошукових компонент на основі методів Data Mining


Слайд 9 Позначимо запит користувача буквою q, а документ -

Позначимо запит користувача буквою q, а документ - буквою d. Метод

буквою d. Метод зваженого зонного ранжирування присвоює парі (q,

d) значення релевантності на відрізку [0..1], обчислюючи лінійну комбінацію зонних показників, до якої кожна зона документа вносить булеве значення. Розглянемо безліч документів, кожен з яких має l-зон. Нехай g1, g2..gi ℮[0.1], так що:

Методи ранжирування на основі машинного навчання

Нехай Si де 1

Ваги g1 .. gi вказуються експертами або користувачем. Однак набагато частіше ваги визначаються на основі навчальних прикладів, оцінених заздалегідь.


Слайд 10 За основу алгоритму Daitch-Makotoff у взято оригінальний Soundex,

За основу алгоритму Daitch-Makotoff у взято оригінальний Soundex, але він має

але він має значно більш складні правила конверсії -

тепер у формуванні результуючого коду беруть участь не тільки одиночні символи, а й послідовності з декількох символів.
Крім того, одна комбінація результату забезпечує близько 600 тисяч різних варіацій коду, що у поєднанні з ускладненими правилами зменшує кількість хибнопозитивних термінів у результуючій множині

Схема відповідностей літер до алгоритму Soundex


Слайд 11 Схема відповідностей літер до алгоритму Daitch-Makotoff

Схема відповідностей літер до алгоритму Daitch-Makotoff

Слайд 12 Технологія аналізу тексту Text Mining містить 4 основні

Технологія аналізу тексту Text Mining містить 4 основні етапи

етапи


Слайд 13 В даний час пропонується досить багато інструментів текстомайнінга

В даний час пропонується досить багато інструментів текстомайнінга – від відносно

– від відносно простих програм, що спираються на статистичний

аналіз окремих термінів у текстах, таких як WordStat, до найскладніших додатків типу Aerotext і Businessobjects Text Analysis.
З розвитком Інтернету аналіз, що базується на Text Mining, може реалізовуватися не лише за допомогою впроваджуваних в організації додатків, але і у вигляді онлайнового сервісу.
Останнім часом Text Mining аналіз множинних відкритих джерел інформації стає доступним для комерційних, політичних та інших організацій за рахунок появи саме таких онлайнових служб.
Технології видобутку інформації з неструктурованих текстів (Text Mining) використовуються на практиці вже сьогодні, оскільки обсяги доступною і корисною інформацією ростуть з кожним днем, а потреба в їх аналізі є досить актуальною.

Перспективи використання Text Mining


  • Имя файла: analіz-metodіv-avtomatizovanogo-poshuku-elektronnih-dokumentіv-v-velikih.pptx
  • Количество просмотров: 81
  • Количество скачиваний: 0