Доступ открыт Открытый доступ  Доступ закрыт Доступ платный или только для Подписчиков

Оценка качества малой выборки биометрических данных с использованием более экономичной формы хи-квадрат критерия


https://doi.org/10.21683/1729-2646-2016-16-2-43-48

Полный текст:


Аннотация

Цель. Поставлена цель повышения мощности хи-квадрат критерия Пирсона с тем, чтобы этот критерий стал работоспособен на тестовых выборках биометрических данных малого объема. Необходимо снизить объем тестовой выборки с 200 примеров до 20 примеров при сохранении вероятностей ошибок первого и второго рода. Сбор 20 примеров биометрических образов рассматривается пользователями как комфортный уровень трудозатрат. Необходимость сбора большего числа примеров воспринимается пользователями негативно.

Методы. В статье предложена еще одна (вторая) форма критерия Пирсона гораздо менее чувствительная к объему данных в тестовой выборке. Показано, что традиционная форма хи-квадрат критерия чувствительнее к объему тестовой выборки, чем критерий Крамера фон-Мизеса. Предложенная (вторая) форма хи-квадрат критерия имеет чувствительность к объему тестовой выборки меньше чем чувствительность у классического хи-квадрат критерия и меньше, чем чувствительность у критерия Крамера-фон Мизеса одновременно. Этот эффект достигнут переходом из пространства частот появления событий и вероятностей появления группы похожих событий в пространство более точно оцениваемых младших статистических моментов (математического ожидания и стандартного отклонения). Фрактальная размерность новой синтезированной формы хи-квадрат критерия совпадает с фрактальной размерностью классической формы хи-квадрат критерия.

Результаты. Предположительно, что предложенный в статье еще один вариант хи-квадрат критерия является одним из самых мощных из всех существующих статистических критериев. Дано аналитическое описание соотношения стандартных отклонений классической формы хи-квадрат критерия и новой формы хи-квадрат критерия. Стандартное отклонение второй формы хи-квадрат критерия уменьшается примерно в 2 раза при сохранении математического ожидания на выборках одинакового объема. Последнее эквивалентно четырехкратному снижению требований к объему тестовой выборки в интервале от 16 до 20 примеров. Выигрыш по мощности от применения нового критерия растет по мере роста объема тестовой выборки.

Выводы. Пирсон при создании в 1900 году классического хи-квадрат критерия ориентировался на ограниченные вычислительные возможности, существовавшей тогда вычислительной техники, и был вынужден опираться на найденные им аналитические соотношения. Сегодня ситуация изменилась, ограничения на привлекаемые вычислительные ресурсы исчезли. Однако мы продолжаем по инерции опираться на то, что было создано под вычислительные ресурсы 1900 года. Видимо, следует пытаться учитывать современные возможности вычислительной техники и строить более мощные варианты статистических критериев. Даже если новые критерии будут требовать перебора большого числа возможных состояний (будут иметь большие заранее вычисленные таблицы вместо аналитических соотношений) это сегодня не является сдерживающим фактором. Когда данных недостаточно (в биометрии, в медицине, в экономике) вычислительная сложность статистических критериев не играет особой роли, если результат оценок оказывается более точным.


Об авторах

Б. Б. Ахметов
Международная академия информатизации (МАИН), Туркестан, Казахстан
Россия

кандидат технических наук, академик Международной академии информатизации (МАИН), вице-президент «Международного казахско-турецкого университета имени Ходжи Ахмеда Ясави». Казахстан, 161200 г. Туркестан, проспект Б. Саттарханова, 29, Здание Ректорат, тел. +7 (72533) 3-35-77



А. И. Иванов
лаборатория биометрических и нейросетевых технологий ОАО «Пензенский научно-исследовательский электротехнический институт», Пенза, Россия
Россия

доктор технических наук, доцент – начальник лаборатории биометрических и нейросетевых технологий ОАО «Пензенский научно- исследовательский электротехнический институт». Россия, 440000 г. Пенза, ул. Советская, 9, тел. +7 (841-2) 59-33-10



Список литературы

1. Ramírez-Ruiz J., Pfeiffer C., Nolazco-Flores J. Cryptographic Keys Generation Using FingerCodes. // Advances in Artificial Intelligence – IBERAMIA-SBIA 2006 (LNCS 4140), p. 178-187, 2006

2. Monrose F., Reiter M., Li Q., Wetzel S. Cryptographic key generation from voice. In Proc. IEEE Symp. on Security and Privacy, 2001

3. Feng Hao, Ross Anderson and John Daugman. Crypto with Biometrics Effectively, IEEE TRANSACTIONS ON COMPUTERS, VOL. 55, NO. 9, SEPTEMBER 2006.

4. Язов Ю.К. и др. Нейросетевая защита персональных биометрических данных. // Ю.К.Язов (редактор и автор), соавторы В.И. Волчихин, А.И. Иванов, В.А. Фунтиков, И.Г. Назаров // М.: Радиотехника, 2012 г. 157 с. IBSN 978-5-88070-044-8.

5. Ахметов Б.С., Иванов А.И., Фунтиков В.А., Безяев А.В., Малыгина Е.А. Технология использования больших нейронных сетей для преобразования нечетких биометрических данных в код ключа доступа. Монография, Казахстан, г. Алматы, ТОО «Издательство LEM», 2014 г. -144 c.

6. Ахметов Б.С., Волчихин В.И., Иванов А.И., Малыгин А.Ю. Алгоритмы тестирования биометрико-нейросетевых механизмов защиты информации Казахстан, Алматы, КазНТУ им. Сатпаева, 2013 г.- 152 с. ISBN 978-101-228-586-4.

7. Кобзарь А.И. Прикладная математическая статистика для инженеров и научных работников. М. ФИЗМАТЛИТ, 2006 г., 816 с.

8. Р 50.1.037-2002 Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа χ2. Госстандарт России. Москва-2001 г., 140 с.

9. Ахметов Б.С., Иванов А.И., Серикова Н.И., Фунтикова Ю.В. Алгоритм искусственного повышения числа степеней свободы при анализе биометрических данных по критерию согласия хи-квадрат. Вестник национальной академии наук республики Казахстан. №5, 2014 г. с. 28-:-34.

10. Серикова. Н.И., Иванов А.И., Качалин С.В. Биометрическая статистика: сглаживание гистограмм, построенных на малой обучающей выборке. /Вестник СибГАУ 2014 № 3(55) с.146-150.

11. Ахметов Б.Б., Иванов А.И., Безяев А.В., Фунтикова Ю.В. Многомерный статистический анализ биометрических данных сетью частных критериев Пирсона. // Вестник Национальной академии наук Республики Казахстан. – Алматы, 2015. № 1. С. 5-11.


Дополнительные файлы

Для цитирования: Ахметов Б.Б., Иванов А.И. Оценка качества малой выборки биометрических данных с использованием более экономичной формы хи-квадрат критерия. Надежность. 2016;16(2):43-48. https://doi.org/10.21683/1729-2646-2016-16-2-43-48

For citation: Akhmetov B.B., Ivanov A.I. Estimation of quality of a small sampling biometric data using a more efficient form of the chi-square test. Dependability. 2016;16(2):43-48. (In Russ.) https://doi.org/10.21683/1729-2646-2016-16-2-43-48

Просмотров: 201

Обратные ссылки

  • Обратные ссылки не определены.


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1729-2646 (Print)
ISSN 2500-3909 (Online)