Сравнительный анализ критериев достоверности эксперименитального исследования силовых режимов деформации титановых сплавов Проблеми трибології (Problems of Tribology) 2017, № 2 31 Анищенко А.С., Кухарь В.В., Присяжный А.Г. ГВУЗ «Приазовский государственный технический университет», г. Мариуполь, Украина E-mail: kvv.mariupol@gmail.com СРАВНИТЕЛЬНЫЙ АНАЛИЗ КРИТЕРИЕВ ДОСТОВЕРНОСТИ ЭКСПЕРИМЕНИТАЛЬНОГО ИССЛЕДОВАНИЯ СИЛОВЫХ РЕЖИМОВ ДЕФОРМАЦИИ ТИТАНОВЫХ СПЛАВОВ УДК 621.73.04:519.233 Представлены зависимости силы от степени деформации при горячем деформировании титановых сплавов 5В, 40, ПТ-3В, в том числе с теплоизолирующими прокладками. Определены двумя методами и проанализированы минимальные выборки для экспериментов, установлены допустимые ошибки и оценен их уровень. Проведен отсев грубых погрешностей эксперимента по различным критериям, показано различие в результатах. Предложено при весьма малом числе экспериментов для каждой точки вместо критерия Стьюдента использовать критерии, изначаль- но предназначенные только для малых выборок. Ключевые слова: деформирование, сила, выборка, погрешность, достоверность, отсев. Введение Достоверность результатов экспериментов и обоснованность сформулированных на их основе выводов являются неотъемлемыми критериями оценки любой научно-исследовательской работы. Эти критерии зависят как от техники и технологии проведения экспериментов, так и от методов статистиче- ской обработки их результатов. В научной среде и, в частности, обработке металлов давлением принято больше внимания уде- лять собственно экспериментам, тогда как в существенном большинстве работ для статистической обра- ботки используют доступные прикладные пакеты программ на ЭВМ, оперирующих критериями Фишера и Стьюдента [1]. Вместе с этим, существует огромное количество других критериев, авторы которых приводят достаточно весомые аргументы в их пользу. В работе [2], к примеру, только для проверки ги- потез о значениях параметров распределений рекомендуется около 6 десятков методик и соответствую- щих им критериев. В связи с этим, представляет интерес, может ли повлиять замена критериев оценки эксперимен- тов (к примеру, критерия Стьюдента) на вывод о достоверности полученных экспериментальных пара- метров. Анализ последних исследований и публикаций Согласно статистическим гипотезам статистические критерии оценки делятся на параметриче- ские и непараметрические. Параметрические критерии включают в формулу расчета параметры распре- деления, то есть среднюю величину, дисперсию. Это классические критерии Стьюдента, Фишера, Мак- свелла, Симпсона, Парето и т.д. Непараметрические критерии – критерии, не включающие в формулу расчета параметры распределения и основанные на оперировании частотами или рангами (критерий Вилкоксона-Манна-Уитни, Колмогорова-Смирнова, Пуассона, Паскаля и др.). И те, и другие критерии имеют свои преимущества и недостатки. Как правило, параметрические критерии могут оказаться несколько более мощными, чем непараметрические, но только в том случае, если признак нормально распределен и соблюдается однородность дисперсии в сравниваемых группах. Непараметрические критерии лишены этих ограничений и не требуют сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном – с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Весьма часто исследователи не утруждают себя ни проверкой вида распределения имеющихся у них данных (априори утверждая, что это распределение – нормальное), ни правомерностью выбора ме- тода сравнения данных. Соответственно этому в подавляющем большинстве диссертаций, монографий и статей имеются ссылки на критерий Стьюдента. Вероятно, это говорит о том, что авторы, использующие данный критерий, не имеют необходимых знаний относительно ограничений, присущих данному крите- рию. Можно предположить, что этим авторам неизвестны какие-либо альтернативы данному критерию, либо они не в состоянии ими самостоятельно воспользоваться. В работе [1] утверждается, что в настоя- щее время бездумное применение t-критерия Стьюдента в большинстве публикаций приносит больше вреда, нежели пользы. Сравнительный анализ критериев достоверности эксперименитального исследования силовых режимов деформации титановых сплавов Проблеми трибології (Problems of Tribology) 2017, № 2 32 Цель статьи Целью статьи является оценка достоверности результатов малой серии экспериментов по осадке титановых сплавов различными критериями и выявление возможности их взаимозаменяемости. Изложение основного материала Рассмотрим некоторые вопросы статистической обработки результатов экспериментов на при- мере деформирования титановых сплавов, в том числе с теплоизолирующими прокладками. В наших ра- ботах [3 - 4] были, в частности, представлены зависимости силы осадки Р от степени относительной де- формации образцов Ø125 × 80 мм из сплава 5В, Ø110 × 40 и Ø115 × 30 мм из сплава ПТ-ЗВ (с относи- тельной высотой Н = 0,26 и 0,36) и Ø110 × 40 мм из сплава 40 (рис. 1). Эксперименты воспроизводили первую операцию многоручьевой штамповки поковок, то есть размеры образцов соответствовали реаль- ным размерам исходных заготовок для штамповки. Учитывая существенную дороговизну титановых сплавов, каждый из графиков (рис. 1) был по- строен по средним значениям результатов деформирования лишь пяти образцов. В итоге был получен набор ломаных прямых 1 - 6, отдельные точки которых могли иметь координаты по оси Р, возможно, выпадающие из общего массива данных. Определим, насколько правомерно было использовать значения всех пяти экспериментов при построении каждой точки графика. Для этой цели выберем на рис. 1 точки А и В с координатами соответственно Р1 = 4,50 МН (ломаная 1) и Р2 = 3,5 МН (ломаная 3), которые визуально более других не соответствуют тенденции роста силы осадки при увеличении степени относительной деформации образцов. В табл. 1 для этих точек приведены результаты расчета силы деформирования всех пяти образцов. Вначале определим, достаточно ли было проведено экспериментов с учетом разброса значений полученных результатов. Для этого воспользуемся эмпирической формулой [5] (уровень доверительной вероятности p = 0,95): ,N e f    (1) где N – минимально необходимое количество экспериментов; ν – коэффициент вариации, % е, f – коэффициенты, зависящие от ν. Рис. 1 – Зависимость силы осадки от степени деформации титановых сплавов: 1 – сплав ПТ-3В, Н = 0,26, осадка без прокладок; 2 – то же осадка с прокладками; 3 – сплав ПТ-3В, Н = 0,36, осадка без прокладок; 4 – то же, осадка с прокладками; 5 – сплав 40, Н = 0,36, осадка без прокладок; 6 – то же осадка с прокладками. Сравнительный анализ критериев достоверности эксперименитального исследования силовых режимов деформации титановых сплавов Проблеми трибології (Problems of Tribology) 2017, № 2 33 Таблица 1 Расчетные значения Р (МН) и их статистическая оценка Номер эксперимента Точка графика 1 2 3 4 5 Среднее значение силы осадки, Рср, МН Среднее квадратическое отклонение, S Коэффициент вариации, ν, % А 4,81 4,43 4,52 4,38 4,37 4,50 0,182 4 В 3,5 2,9 3,1 2,7 3,1 3,0 0,30 10 Величину ν определим по формуле: 100% cр S P   , (2) где S – среднеквадратическое отклонение. Значение S рассчитаем по формуле: 2 1 ( ) , 1 n i срP P S n     (3) где Pi – i-ое значение силы осадки, МН; n – количество проведенных экспериментов, для каждой точки, n = 5. Рассчитанные значения S и ν указаны в табл. 1. Коэффициенты е, f выбираем по значениям ν из таблицы, приведенной в работах [5]: е = -7, f = 2,2. Тогда для точки А определяем N = 1,8 ~ 2 экспери- мента, а для точки В N = 15 экспериментов. Таким образом, по данной методике из-за низкой точности замеров силы деформирования для построения ломаной 3 (рис. 1) пяти экспериментов оказалось недос- таточно для обеспечения достоверности результатов. Достаточно большое количество работ [5] предлагают определять минимальную выборку исходя из соотношения: 2 2 2 , t S N   (4) где t – критерий Стьюдента, при p = 0,95, t = 1,96; Δ – допустимая ошибка выборки в относительных величинах. В соответствии с формулой (4) пяти экспериментов на каждую точку А и В будет достаточно, если для точки А допустимая ошибка выборки составит Δ = 0,16, а для точки В – Δ = 0,27. Учитывая, что эксперименты проводили на образцах с размерами, соответствующими реальным размерам загото- вок, полученные значения Δ являются вполне приемлемыми. В дальнейших расчетах будем использовать параметрические критерии оценки в предположе- нии, что для точек А и В выполняется равенство N = n = 5. В табл. 1 значения силы Р в экспериментах № 1 для обеих точек А и В существенно отличаются от среднего значения и требуют проверки на аномальность. Отсев грубых погрешностей может быть проведен по различным методикам, среди которых нас, в первую очередь, интересуют методики, рассчи- танные на выборки небольшого объема n. В ряде работ [6, 7] принято считать, что объем выборки не- большой, если n ≤ 30. Согласно критерию Пустыльника [8] при n ≤ 25 отсев грубых погрешностей проводится по ве- личине максимального относительного отклонения τ, сравниваемой с ее табличным значением: 1 i ср p P P S       , (5) где τ1-р – табличное значение статистики τ, вычисленное при q =1 – p. Если неравенство выполняется, то эксперимент не отсеивают, если нет – исключают. Для наших экспериментов (n = 5, q = 0,05) τ1-р = 1,87 [5], точка А: SA,= 0,182, τА = 1,70; точка В: SB = 0,30, τВ = 1,61, неравенство выполняется и значения экспериментов отсеву не подлежат. Сравнительный анализ критериев достоверности эксперименитального исследования силовых режимов деформации титановых сплавов Проблеми трибології (Problems of Tribology) 2017, № 2 34 Более предпочтительно для наших условий проверять эксперименты на аномальность, используя критерий Кассандровой [5] для весьма малой выборки n ≤ 10. В этом случае вычисляют: 1 1 1 i ср p P P n S n        , (6) и сравнивают полученный результат с τ1-р = 1,87. В итоге имеем: τ1А = 1,90 > 1,87 и эксперимент № 1 для точки А отсеиваем; τ1В = 1,80 < 1,87 и эксперимент №1 для точки В отсеву не подлежит. Согласно критерию Романовского [5] вычисляют выборочное среднее значение силы осадки Рвср и выборочное среднеквадратическое отклонение Sв без учета сомнительного результата. Составляют без- размерную дробь: max в ср в P P R S   . (7) По таблице [5] в зависимости от объёма выборки nв = n – 1 для заданного уровня значимости q (в нашем случае nв = 4 и q = 0,05) определяют значение R0 = 3,6. Для точек А и В значения RА = 3,5 и RВ = 2,78 не превышают R0 = 3,6, следовательно эксперименты № 1 для обоих случаев отсеиванию не подлежат. Часто отсев грубых погрешностей проводят, используя таблицы распределения Стьюдента, хотя чем меньше число экспериментов n, тем сильнее распределение значений t - критерия Стьюдента отли- чается от нормального [1], т.е. эта методика предназначена для больших выборок. Известно, что крити- ческое значение τр (процентная точка нормированного выборочного отклонения) выражается через кри- тическое значение распределения Стьюдента tp, n-2 [7]:   , 2 , 2 , 2 1 2 p n p n табл p n t n n t          . (8) Рекомендуемый метод отсева грубых погрешностей удобен тем, что максимальные относитель- ные отклонения в процессе вычисления могут быть разделены на три группы: 1) τ ≤ τ5%, n ; 2) τ5%, n < τ < τ0,1%, n; 3) τ > τ5%, n . Эксперименты первой группы не отсеивают, третьей – отсеивают, а второй – можно отсеять, ес- ли есть дополнительные соображения, но можно и воздержаться от отсева. При расчетах по критерию Пустыльника нами получены: τА = 1,70, τВ = 1,61. По таблицам [7] выбираем точки t - распределения Стьюдента tp, n-2 , предварительно определив параметр p/ν: для точки А – p/ν = 95 % / 4 = 24, t5%, 3,= 1,7109, t0,1%, 3 = 3,4668, для точки B – p/ν = 95 % / 10 = 9,5, t5%, 3 = 1,8233, t0,1%, 3 = 4,2202. По формуле (8) вычисляем τp, n: для точки А – τ5 %, 5 = 1,4054, τ0,1%, 5 = 1,7891; для точки B – τ5%, 5 = 1,4500, τ0,1%, 5 = 1,8502. Значения τА = 1,70, τВ = 1,61 находятся между двумя критическими значениями: 1,4054 < 1,70 < 1,7891 и 1,4500 < 1,61 < 1,8502. В этом случае предпочтительно (но не обязательно) от от- сева отказаться. Согласно критерию Анскомбома [5], находим разность Δmax = Pmax – Pср (Δmax = 0,31 и 0,5 для точек А и В), которая должна удовлетворять неравенству w < Δmax / S, в котором параметр w находим с использованием t-критерия Стьюдента в неявном виде:    0 2 0 2 1 ; 1 / 2 , 0 ( 1) ( / ) f f q nw f f t f f f nw f           (9) где f = n – 1 – число степени свободы оценки дисперсии; f0 – число дополнительных степеней свободы, обычно f0 = 0. Сравнительный анализ критериев достоверности эксперименитального исследования силовых режимов деформации титановых сплавов Проблеми трибології (Problems of Tribology) 2017, № 2 35 По табл. [5] при уровне значимости q = 0,05 выбираем значение критерия Стьюдента t = 4,177, тогда из соотношения (9) w = 1,65. ΔАmax /SА = 1,67 > w, ΔВmax / SВ = 1,70 > w, следовательно, точки А и В отсеву не подлежат. Используя критерии Греббса и Смирнова [5] как разновидности критерия Анскомбома соответ- ственно получаем значения w = 1,869, 1,91 и тот же вывод. В табл. 2 представлены результаты проверки экспериментов № 1 на их аномальность. Таблица 2 Результаты проверки аномальных значений экспериментов на отсев Результаты Критерии проверки точка А точка В Пустыльника не отсеивать не отсеивать Кассандровой отсеять не отсеивать Романовского не отсеивать не отсеивать Стьюдента возможны оба варианта Анскомбома не отсеивать не отсеивать Греббса не отсеивать не отсеивать Смирнова не отсеивать не отсеивать Выводы Оценка достоверности результатов эксперимента различными статистическими методами дает неоднозначные выводы. Корректную статистическую обработку эксперимента должен проводить про- фессиональный математик - статистик. Литература 1. Леонов В.П. Ошибки статистического анализа биомедицинских данных / В.П. Леонов // Международный журнал медицинской практики. – 2007. – Вып. 2. – С. 19-35. 2. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников / А.И. Кобзарь. – М.: ФИЗМАТЛИТ, 2006. – 816 с. 3. Анищенко А.С. Исследование горячей деформации стальных и титановых заготовок с приме- нением теплоизолирующих прокладок [Study of hot deformation of steel and titanium blanks using heat- insulating gacket] / А.С. Анищенко // Вісник ПДТУ. – Маріуполь. – 2015. – Вип. 31. – С. 126-135. 4. Анищенко А.С. Изотермическая и сверхпластическая деформация металлов: Теория, экспе- римент, технология / А.С. Анищенко. – Saarbrucken: LAP, 2014. – 129 s. 5. Найзабеков А.Б. Квалиметрия в обработке металлов давлением / А.Б. Найзабеков, В.Я. Талма- зан, Н.Ю. Шмидт. – Алматы: РИК по УиМЛ, 2005. – 134 с. 6. Балдин К.В. Основы теории вероятности и математической статистики / К.В. Балдин, В.Н. Башлыков, А.В. Рукосуев. – М.: ФЛИНТА, 2010. – 488с. 7. Львовский Е.Н. Статистические методы построения эмпирических формул / Е.Н. Львовский. – М.: Высшая школа, 1988. – 239 с. 8. Титкова Л.С. Математические методы в психологии / Л.С. Титкова. – Владивосток: Изд-во ДГУ, 2002. – 85 с. Поступила в редакцію 07.04.2017 Сравнительный анализ критериев достоверности эксперименитального исследования силовых режимов деформации титановых сплавов Проблеми трибології (Problems of Tribology) 2017, № 2 36 Anishchenko O.S., Kukhar V.V., Prysiazhnyi A.G. Comparative analysis of reliability criteria for the experi- mental research of the force modes of deformation of titanium alloys. The dependences of the force on the degree of deformation during hot deformation (upsetting) of titanium alloys 5B, 40, PT-3B, including those with heat-insulating gaskets are presented. The minimum sample sizes for experiments were determined by two methods and analyzed, permissible errors were established and their level was estimated. The gross errors of the experiment were screened according to various criteria, the difference in the results was shown. In the case of a very small number of experiments in each point has been proposed instead of the Student's criterion to use criterias which origi- nally intended only for small samples. Key words: deformation, force, sampling, error, reliability, screening. References 1. Leonov V.P. Oshibky statisticheskogo analyza biomedetsinskih dannyih [Errors in the statistical analysis of biomedical data], Mezdunarodnyi jurnal meditsinskoy praktiki, 2007, Vol 2, pp.19-35. 2. Kobzar A.I. Prikladnaia matematicheskaia statistika. Dlia injenerov i nauchnyih rabotnikov [Applied mathematical statistics for engineers and scientists], M., FIZMATLIT, 2006, 816 p. 3. Anishchenko A.S. Issledovanie goriachey deformatsii stalnyih i titanovyih zagotovok s primeneniem teploizoliruyushih prokladok [Study of hot deformation of steel and titanium blanks using heat-insulating gas- ket], Visnyik PDTU, Mariupol, 2015.- Vol. 31 pp.126-135.. 4. Anishchenko A.S. Izotermicheskaia i sverkhplasticheskaia deformatsia metallov [Isothermal and su- perplastic deformation of metals], Saarbrucken: LAP, 2014,129 p.. 5. Nayzabekov A.B., Talmazan V.Ya., Chmidt N.Yu. Kvalimetria v obrabotke metallov davleniem. [Qualimetry in metal forming], Almaty: RIK po UiML, 2005,134 p.. 6. Baldin K.V., Bachlyikov V.N., Rukosuev A.V. Osnovy teorii veroiatnosty i matematicheskoy sta- tistiki [Bases of the theory of probability and mathematical statistics], M., FLINTA, 2010, 488 p. 7. Lvovskiy E.N. Statisticheskie metody postroenia empiricheskikh formul [Statistical methods for constructing empirical formulas], M., Vyisshaya shkola, 1988, 239 p. 8. Titkova L.S. Matematicheskie metody v psirhologii [Mathematical methods in psychol- ogy].Vladivostok, DGU, 2002,85 p.