Пример решения задания Оценить
Для решения этой задачи запустим 2-й режим в 3-й подсистеме (рисунок137). В этом режиме все признаки, которыми в данном примере являются буквы, выводятся системой "Эйдос" в порядке убывания среднего количества информации, которое в них содержится о принадлежности к словам. Если просуммировать ценность букв "нарастающим итогом" то получим накопительную кривую, представленную на рисунке 138. Эта кривая называется "Парето-диаграмма" по имени известного итальянского математика и экономиста XIX, Вильфредо Парето, впервые предложившего оценивать силу влияния факторов, исключать из рассмотрения незначимые факторы и впервые построившего подобные диаграммы.
![]() |
Рисунок 137. Запуск режима системы "Эйдос" измерения ценности признаков для решения задач идентификации, прогнозирования и управления |
![]() |
Рисунок 138. Парето-диаграмма ценности букв для идентификации слов |
Характерная "полочка" на Парето-диаграмме соответствует цифрам и буквам латинского алфавита, которые не встретились
в словах обучающей выборки. В таблице 74 приведены буквы, проранжированные в порядке убывания среднего количества информации в них, о принадлежности к словам.
Таблица 74 – ЦЕННОСТЬ БУКВ ДЛЯ ИДЕНТИФИКАЦИИ СЛОВ
№ |
Код |
Буква |
Ценность (бит) |
Ценность (бит) "нарастающим итогом" |
Ценность (%) "нарастающим итогом" |
1 |
66 |
Э |
0,76988 |
0,76988 |
4,841 |
2 |
56 |
У |
0,74529 |
1,51517 |
9,526 |
3 |
49 |
М |
0,71090 |
2,22607 |
13,996 |
4 |
46 |
Й |
0,69728 |
2,92335 |
18,380 |
5 |
61 |
Ш |
0,68748 |
3,61083 |
22,703 |
6 |
47 |
К |
0,68569 |
4,29652 |
27,014 |
7 |
67 |
Ю |
0,66376 |
4,96028 |
31,187 |
8 |
52 |
П |
0,66014 |
5,62042 |
35,338 |
9 |
64 |
Ы |
0,65157 |
6,27199 |
39,434 |
10 |
41 |
Д |
0,64023 |
6,91222 |
43,460 |
11 |
68 |
Я |
0,63612 |
7,54834 |
47,459 |
12 |
44 |
З |
0,62131 |
8,16965 |
51,366 |
13 |
65 |
Ь |
0,59697 |
8,76662 |
55,119 |
14 |
38 |
Б |
0,59622 |
9,36284 |
58,868 |
15 |
53 |
Р |
0,58610 |
9,94894 |
62,553 |
16 |
59 |
Ц |
0,57201 |
10,52095 |
66,149 |
17 |
40 |
Г |
0,56958 |
11,09053 |
69,730 |
18 |
39 |
В |
0,55490 |
11,64543 |
73,219 |
19 |
62 |
Щ |
0,52045 |
12,16588 |
76,492 |
20 |
37 |
А |
0,51477 |
12,68065 |
79,728 |
21 |
48 |
Л |
0,50010 |
13,18075 |
82,872 |
22 |
54 |
С |
0,47977 |
13,66052 |
85,889 |
23 |
55 |
Т |
0,47498 |
14,13550 |
88,875 |
24 |
51 |
О |
0,46548 |
14,60098 |
91,802 |
25 |
50 |
Н |
0,45089 |
15,05187 |
94,637 |
26 |
45 |
И |
0,43046 |
15,48233 |
97,343 |
27 |
42 |
Е |
0,42253 |
15,90486 |
100,000 |
Forekc.ru
Рефераты, дипломы, курсовые, выпускные и квалификационные работы, диссертации, учебники, учебные пособия, лекции, методические пособия и рекомендации, программы и курсы обучения, публикации из профильных изданий