На путях психологических исследований расставлено множество капканов, очень часто толкающих к ошибочным выводам и к интерпретациям, плохо согласующимся с реальными фактами. Мы перечислим лишь наиболее известные из этих капканов, в которые особенно рискуют попасть психологи – новички или же их испытуемые.

Эффект плацебо

Этот эффект обнаружен медиками. Он основан на внушении, оказываемом преднамеренно или невольно врачом или экспериментатором. Когда испытуемые убеждены в эффективности предлагаемого им лекарственного препарата или предписываемого режима, у них очень часто можно наблюдать желаемые эффекты, хотя на самом деле ни препарат, ни режим никакого действия не оказывают (см. документ 12.7).

Эффект Хоторна

Эффект плацебо – лишь частный случай эффекта Хоторна. Как показали опросы, проведенные промышленными психологами на предприятиях Хоторна в Чикаго, одно лишь участие в эксперименте оказывает на испытуемых такое влияние, что очень часто они ведут себя именно так, как ожидают от них экспериментаторы.

Эффект аудитории

Присутствие публики, пусть даже пассивной, само по себе влияет на скорость обучения испытуемого или выполнение им поставленной задачи. Согласно Зайонцу (Zajonc, 1965), во время обучения наличие зрителей скорее смущает испытуемого, но после того, как он освоит решение задачи, или в том случае, если от него требуется физическое усилие, публика, напротив, облегчает дело.

Эффект Пигмалиона (или эффект Розенталя)

Пигмалион был греческим скульптором, который по преданию изваял статую столь прекрасную, что влюбился в нее и умолил богов оживить ее. Американский психолог Розенталь (1966) назвал именем Пигмалиона явление, состоящее в том, что экспериментатор, твердо убежденный в обоснованности какой-то гипотезы или верности какой-то информации, непроизвольно действует так, что она получает фактическое подтверждение.

Эффект первого впечатления

Этот эффект выражается в том, что очень часто, оценивая личность того или иного человека или черты его характера, мы придаем наибольшее значение своему первому впечатлению. Дело доходит до того, что все последующие сведения о данном лице, противоречащие созданному образу, очень часто отбрасываются как случайные и нехарактерные.

Эффект Барнума

«Каждую минуту на свет рождается простофиля», – утверждал Финеас Т. Барнум. Именем основателя знаменитого цирка была названа склонность людей принимать за чистую монету описания или общие оценки своей личности, если эти оценки преподносятся под научным, магическим или ритуальным соусом. Такой эффект хорошо известен астрологам, ведущим ежедневную рубрику в газетах.

Документ 3.7. Плацебо, Пигмалион и двойной слепой метод

За последние 30 лет благодаря химиотерапии в лечении психических расстройств произошли глубокие изменения. В некоторых случаях, однако, правомерно задать вопрос, кому принадлежит главная роль в таком лечении: препарату, врачу или самому пациенту?

Вот что произошло в 1953 году с психиатром по имени У. Мендел (W. Mendel), работавшим в то время в больнице Сент – Элизабет в Вашингтоне – одной из самых крупных психиатрических лечебниц США. Мендел заведовал отделением, где лечились преимущественно выходцы из Пуэрто – Рико и с Виргинских островов. Большинство из них были госпитализированы из – за их враждебного или агрессивного поведения; некоторых считали столь опасными, что держали в смирительных рубашках, и Мендел посещал их в сопровождении двух телохранителей. Общение с больными еще больше затруднялось тем, что они почти не говорили по – английски, а Мендел не знал испанского.

В это время появился новый транквилизатор – резерпин, который, казалось, давал превосходные результаты. Руководители больницы Сент – Элизабет решили провести у себя испытания этого транквилизатора, используя двойной слепой метод.

Лица, проводившие испытания и раздававшие своим больным таблетки, не знали, что одни из них содержали препарат, а другие – просто подслащенную массу. Иными словами, они не знали, относятся ли больные к экспериментальной группе, действительно получавшей резерпин, или же к контрольной группе для проверки эффекта плацебо.

Эксперимент продолжался несколько месяцев, но очень скоро Мендел пришел к убеждению, что препарат превосходно действует на его больных. За несколько дней их агрессивность резко снизилась, и общение между ними и психиатром становилось все более дружелюбным, так что можно было даже снять смирительные рубашки.

У Мендела не оставалось никаких сомнений, что резерпин произведет революцию в лечении больных этого типа, и он с нетерпением ожидал результатов, полученных в других отделениях. Каково же было его удивление, когда по окончании эксперимента он узнал, что его пациенты были среди тех, кто все время получал подслащенные таблетки совсем без резерпина.

Чем же можно было объяснить изменения в поведении его больных? Анализируя свое собственное поведение, Мендел вынужден был признать, что только оно и было причиной этих изменений. С самого начала эксперимента Мендел действительно вообразил, что его подопечные получают резерпин и поэтому не могут не стать более смирными; он стал относиться к ним соответственно, стараясь увидеть в их жестах, взглядах или улыбке признаки, возвещающие об улучшении их состояния (тогда как раньше он обращал внимание только на проявления агрессивности). Больные в свою очередь отвечали на это тем, что становились более спокойными просто потому, что к ним стали относиться как к полноценным людям. Таким образом, их поведение изменилось не от воздействия лекарства, а от того, как с ними стали обращаться.

1. Единственную гарантию серьезной работы психолога дает его научная подготовка в той или другой области психологии независимо от того, занимается ли он исследовательской или практической работой.

2. Клинический психолог и психолог – консультант оказывают психологическую помощь нуждающимся в ней людям. Первый имеет дело прежде всего с людьми, страдающими психическими расстройствами, которые он пытается диагностировать и лечить, применяя соответствующую психотерапию. Второй помогает главным образом людям, проблемы которых связаны с семейными и супружескими отношениями. Сексолог старается выявить психологические причины сексуальных проблем и найти необходимую терапию. Психолог – консультант помогает отдельным людям или целым общинам справляться с возникающими у них проблемами.

3. Школьные и промышленные психологи – это психологи – консультанты, оказывающие помощь учащимся и работающим людям в выборе специальности или места работы. Что касается педагогических психологов и психологов – эргономистов, то они занимаются совершенствованием методов обучения и труда, а также обстановки в учебных заведениях и на промышленных предприятиях в соответствии с потребностями человека.

4. Психолог вмешивается во все большее число областей человеческой деятельности. В настоящее время возникли и развиваются издательская, юридическая, военная психология, психология религии, взаимодействий с окружающей средой и даже творчества.

5. Генетическая психология – одна из областей теоретической психологии, пытающаяся объяснить психологическое развитие индивидуума с момента оплодотворения яйцеклетки и до смерти, а также механизмы, лежащие в основе этого развития.

6. Психология личности изучает становление у индивидуума свойственных ему особенностей. В отличие от этого социальная психология исследует взаимное влияние людей друг на друга.

7. Фундаментальные исследования в психологии направлены главным образом на выявление законов восприятия и научения, а также на изучение мотивации, решения задач и т.п. Психофизиолога особенно интересуют соотношения между нервной системой и поведением, тогда как психофармаколог пытается оценить воздействие на поведение новых лекарственных препаратов. Зоопсихолог изучает поведение животных, с тем чтобы лучше понять их родственные связи с человеком. Парапсихолог старается убедиться в существовании явлений, еще не получивших объяснения, и понять, как они соотносятся с «обычными» способностями человека. Что касается специалистов по искусственному интеллекту, то их усилия направлены на углубление наших представлений о процессах познания путем проведения аналогий с работой вычислительных машин.

8. В психологии используются методы двух категорий: описательные и экспериментальные. Корреляционный анализ позволяет сравнивать между собой показатели, полученные такими описательными методами, как наблюдения в естественных условиях, систематические наблюдения, а также опросы и тесты; этому анализу, однако, свойственны некоторые ограничения в возможностях интерпретации результатов. Что касается экспериментального метода, позволяющего установить причинно – следственную связь между изучаемыми переменными, то он остается наилучшим научным методом.

9. Создание экспериментальных и контрольных групп дает возможность проверить действие независимой переменной, влияние которой хотят оценить, на зависимые переменные, определяемые поведением испытуемых, после того как взяты под контроль все другие факторы и выявлены промежуточные переменные (присущие испытуемым), способные повлиять на результаты.

10. Результаты эксперимента могут быть искажены под влиянием ряда субъективных факторов, зависящих от экспериментатора и испытуемых. Этого можно избежать, используя двойной слепой метод.

11. Обработка результатов и подготовка сообщения – два последних акта, необходимые для доведения исследования до конца.

Следующее обязательное мероприятие – рандомизация. Начало эксперимента. Исследователь уже примерно (всегда – примерно и никогда – точно) знает, что он собирается делать. Экспериментальная установка готова. «Маша, принесите кролика!» Маша идет в виварий и приносит-таки кролика, но какого или, вернее, которого из тех, что там были? Если спросить об этом исследователя, он уверенно ответит, что животное было выбрано в случайном порядке. Неправильно! Выбор был сделан в произвольном порядке. Различие между этими двумя процедурами объясняется в начале любого хорошего руководства по биологической и медицинской статистике. Лаборантка взяла кролика из клетки, находящейся на полметра от пола вивария – это самые удобные клетки: к нижнему ряду труднее наклоняться, а кролик из верхней клетки, бывает, успевает царапнуть Вас задней лапой. Не все ли равно, где сидел кролик до эксперимента? Нет. Самых тяжелых или самых буйных животных лаборанты, не задумываясь, сажают в клетки нижних рядов – а это, согласитесь, нарушает принцип случайности выбора. Конечно, виварий может быть идеально организован: клетки на одном уровне, животные строго одного веса и т. п., но всегда найдется бесчисленное количество других факторов, препятствующих случайному выбору.

В тех же руководствах по статистике под названием рандомизация описаны элементарные процедуры, позволяющие обеспечить случайность выбора объекта. Если Вы собираетесь сравнить два способа лечения, Вы должны:

а) Определить и, насколько возможно, формализовать показания к применению этих методов, то есть заранее назвать нозологическую форму и, если необходимо, другие признаки будущих больных, которые подвергнутся лечению либо старым, либо новым способом: пол, возраст, и т. п. Любой больной, поступающий в клинику или отделение и соответствующий всем заранее определенным параметрам, автоматически попадает в круг Вашего исследования, и ему присваивается порядковый номер.

б) Заранее заказать в любом компьютерном центре таблицу случайных чисел от 1 до 1000 и разделить ее пополам: 500 чисел до черты и 500 – после. Сверху пишете название старого способа, снизу – нового. Поступает больной. Допустим, его номер 48. Смотрим в таблице: число 48 оказывается в нижней части массива. Этот больной должен получить лечение новым, и только новым способом. Никакие перестановки здесь недопустимы. Если позволить себе их, то невольно начнешь отбирать для применения нового способа лечения «наиболее перспективных» больных. В результате «койко-день» в опытной группе будет существенно меньше, чем в контрольной, и количество осложнений – тоже и т. п. После этого можно обрабатывать полученные данные скольугодно изощренными методами – результаты останутся недостоверными. Вспомним слова Гексли (Хаксли – Thomas Henry Huxley, 1825–1895) о том, что математика – это жернов, который перемалывает все, что бы под него ни положили. Мощь жернова не превратит сорняки в пшеницу. Именно поэтому предложенное Вами будет жить недолго. В случае неклинического, чисто экспериментального исследования метод рандомизации применяется точно так же: животные нумеруются заранее, и затем их делят на опытную и контрольную группы в соответствии с таблицей случайных чисел. Желательно, чтобы ни исследователь, ни его помощники не знали, к какой из двух групп относится данное животное и вводят они исследуемый препарат или плацебо (слепой контроль). Если же удастся организовать дело так, чтобы принадлежность объекта исследования к опытной или контрольной группе оставалась неизвестной и в течение всего эксперимента, и во время первичной обработки данных, это уже будет double blind control, близкий к мировым стандартам. В этом случае исследователь узнает, где – опыт, а где – контроль, только в момент просмотра сводных таблиц или рисунков. А теперь, положа руку на сердце, скажите, часто ли Вы и Ваши коллеги так делаете?

Защита не зря именуется публичной. Это означает, что Вы имеете полное право прийти на заседание Совета и задавать соискателю любые вопросы относительно его работы. Если Вы точно знаете, что сегодняшний соискатель завтра не придет на вашу собственную защиту, задайте ему один короткий вопрос: «Как Вы осуществляли рандомизацию?» Ответа не будет, точнее, будет игра словами с целью замять вопрос. Если же Вы благоразумны, задайте тот же вопрос не на защите, а после нее, при личной встрече. Результат будет тот же.

Тому, в ком развит элемент артистизма, можем посоветовать способ рандомизации одновременно простой, надежный и производящий неизгладимое впечатление на учеников и помощников. Произвольно (а не в случайном порядке) выбираем животное. Доводим эксперимент до момента инъекции, не зная заранее, будет ли это опыт или контроль, и таким образом исключая всякую возможность подсознательного подыгрывания самим себе, зовем любого постороннего человека и просим его подбросить монетку. Орел – вводим препарат, решка – плацебо. Если хотите, смейтесь, а, по-нашему, это и есть поиск истины. Один из нас до сих пор хранит пятак, много лет назад случайно застрявший в люстре во время проведения такой рандомизации.

Термин «доказательная медицина» был предложен группой канадских учёных из Университета Мак-Мастера (1990)

В основе доказательной медицины лежит проверка эффективности и безопасности методик диагностики и лечения в клинических исследованиях.

До 90-х годов не существовало стандартов клинических испытаний. Сейчас есть вполне конкретные методы доказательной медицины, набор правил проведения исследований и последующего анализа.

Например, то, что называется «двойным слепым плацебо-контролируемым методом»: когда ни врач, ни пациент не знают, какой препарат попался больному, - исследуемый или плацебо. Однако на территории СНГ эти методы до сих пор использую редко, т.е. испытания лекарств проводятся, но не в соответствии с международными стандартами. Это, в частности связано с тем, что большие выборки и сама по себе организация клинических испытаний — очень дорогостоящая процедура.

Подавляющее большинство препаратов, которые назначаются в амбулаторных условиях, не имеют доказанной эффективности или безопасности… Среди этих, продающихся в аптеках, препаратов:

  • Актовегин
  • Церебролизин
  • Солкосерил
  • Кортексин
  • Арбидол
  • Оксолин
  • Эссенциале
  • Адеметионин
  • Рибоксин
  • Анальгин
  • Преднизолон
  • Полиоксидоний
  • Анаферон, виферон и др. интерфероны
  • Валидол
  • Пробиотики
  • Биопарокс
  • Предуктал
  • в это список отнесены все

Применение этих «лекарств» целиком и полностью на совести лечащего врача, с обязательным информированным согласием больного на применение (средств с недоказанной эффективностью). Большая часть этого списка нигде в мире больше применяется, кроме как в странах СНГ.

Итак, получается, что до 90-х годов людей лечили НЕ в соответствии с основами доказательной медицины (но, тем не менее, как-то вылечивали); и сейчас эффективность большей части продающихся в наших аптеках препаратов не доказана, что не мешает людям получать в определенных случаях положительный результат. Неужели это все эффект плацебо? Или все-таки руководствоваться всего лишь одним подходом доказательной медицины – это узко и недостаточно?

Вот что об это говорят сам врачи :

«Все-таки, что такое современная медицина — наука, или искусство? Западная медицина учит нас, что это наука, и давайте пожертвуем теми 15-25% пациентов, которые не получили положительного результата от лечения в таком-то исследовании.

Почему это произошло? Да потому, что мы еще очень мало знаем об организме человека и его заболеваниях. Я считаю, что медицина будущего (и только тогда она станет наукой в моем понимании) будет patient-based medicine, когда для каждого пациента будет подбираться индивидуальная терапия. Я думаю, что лет через 50 мы к этому подойдем, ведь геном уже расшифрован!»

«Вся история медицины — это история наблюдений и клинического опыта. Стандарты и консенсусные выводы безусловно нужны, особенно молодым врачам, но давайте не превращаться в самодовольных догматиков и признаем, что завтра эти методы уступят место еще более новым, пока не отработанным способам лечения.»

«Никакие клинические испытания (так же, как и расшифровка генома) никогда не позволят описать все многообразие больных. Поэтому врач, даже самый доказательный, опирается прежде всего на «интуицию».

«Нетрудно заметить, что проблема <болей в спине> носит весьма трудно определяемый характер (причин болей в спине может быть 100). Естественно, оказалось, что препаратом выбора является парацетамол (ввиду его безопасности), все другие методы были признаны бесполезными. Противоречит ли это здравому смыслу — нет. Ведь все и так знают, что парацетамол помогает при болях в спине. Каково клиническое значение подобных рекомендаций — ноль.

На практике мною замечено (поверите ли, но боли в спине — это одна из самых частых жалоб в Америке), что применение комплексной терапии (но именно комплексной, как бы жутко это не звучало) помогает добиться значительных результатов, часто методом проб и ошибок. Мне например нравится комбинация Vioxx/Neurontin/Ultram. Что именно помогает? Потому ли это, что все три препарата действуют на разные механизмы подавления боли или это просто сильная плацебо-терапия? Должен ли я ждать того, когда эта комбинация будет проведена в клинических испытаниях и давать пациентам Тайленол, или все-таки есть место для самодеятельности?»

«В условиях западной медицины часто приходится делать те или иные исследования с целью «доказательства» на тот случай, если больной вдруг надумает подать в суд. Внося записи в историю болезни, всегда стараешься держать в уме, что это всё может пойти на стол прокурора. Постоянно слышишь о том, что, то на одного, то на другого подали в суд.

Постепенно привыкаешь работать так, чтобы в случае чего всегда можно было сослаться на тот или иной алгоритм, и сто раз подумаешь перед тем, как поэкспериментировать или порекомендовать что-то из альтернативной медицины».

Т.о., при всех своих плюсах, на мой взгляд, доказательная медицина имеет существенные недостатки: она, как и любой статистический метод, исключает индивидуальный подход врача к пациенту и работает всего лишь на снятие определенного симптома, без учета причины, вызвавшей заболевание. Т.е. пациентам с одинаковыми клиническими симптомами (например, головная боль, повышенное давление, боли в спине и т.п.) назначают одинаковый препарат.

Факторы, вызвавшие симптомы не должны учитываться, многолетний опыт врача в лечении подобных болезней тоже. Т.е. подход «Лечить больного, а не заболевание» при данном статистическом подходе не работает абсолютно.

Кроме того, «двойное слепое рандомизированное испытание» подходит лишь для сравнения одного химического продукта с другим, менее известным. Подобная методология совершенно не подходит для клинической оценки заболеваний, связанных с дефицитом тех или иных веществ .»

Ну и, конечно же, в случае доказательной медицины полностью исключается влияние личности врача, который может своим словом, как способствовать выздоровлению, так и наоборот, не дать больному шанса, особенно, если пациент легковнушаемый с явной психосоматикой.

Влияние личности врача, (а также вера больного в препарат и выздоровление) здесь как раз и приписывают , который по некоторым оценкам достигает в лечении 30 % ii , а это немало.

Но, что касается подходов альтернативной медицины, то они по своей сути не могут быть стандартизированы из-за индивидуальности этого подхода. Зато здесь учитывается и скорость реакции на препарат у пациента, и длительность заболевания; большое место уделяется профилактике. Однако альтернативная медицина не вписывается в модели страховой медицины, так как часто один врач не может контролировать деятельность другого… Как тогда осуществлять экспертизу – правильно лечили больного или нет?

И еще один открытый деликатный вопрос: можно ли брать на вооружение направление медицины, чьи механизмы не в состоянии понять - даже при положительных его результатах?

Вывод получается один — мир в наши дни зачастую слишком сложен, чтобы согласиться с единственным суждением о том или ином явлении . Искусство врача, его опыт и интуиция в большинстве случаев значат не меньше, чем сухая статистика доказательной медицины.

Ричард Докинз - биолог, профессор Оксфорда и Беркли, член Лондонского королевского общества по развитию знаний о природе о том, что полезного можно узнать о жизни, если воспользоваться самой заурядной научной процедурой.

«Не все идеи, которые используют в своей работе ученые, пригодны для всеобщего использования. Нас, прежде всего, должны интересовать не просто исследовательские методы, а инструментарий, который поможет не-ученым лучше понять, что есть наука, и принимать более взвешенные жизненные решения. Почему три четверти американцев верят в ангелов и ад, половина - в привидения, а треть - в астрологию? Почему четверть американцев полагают, что президент Соединенных Штатов родился за пределами страны и потому не может занимать свой пост? Почему две пятых американцев считают, что Вселенная появилась позже, чем человек приручил собаку?

Давайте не будем пораженцами, которые во всем винят человеческую глупость. Наверняка отчасти так и есть, но давайте немного побудем оптимистами и представим, что все поправимо: дело всего-навсего в отсутствии навыков критического мышления, неумении отделять личное мнение и предрассудки от доказательств. Я верю, что привить их способен двойной слепой контролируемый эксперимент - своего рода научная палка о двух концах, но в хорошем смысле. С одной стороны, это прекрасный исследовательский инструмент: изначально всей полнотой знаний о нюансах эксперимента не обладают не только испытуемые, но и те люди, которые непосредственно проводят эксперимент, что позволяет свести к минимуму субъективный фактор, к тому же есть контрольная группа, которая помогает проверить объективность полученных результатов. С другой, это еще и прекрасный образовательный, дидактический инструмент, с помощью которого можно научить людей критическому мышлению. Моя идея заключается в том, что не нужно, собственно, проводить двойные слепые контролируемые эксперименты, чтобы этого добиться. Нужно понять сам принцип, уловить его важность и наслаждаться его изяществом.

Если бы в каждой школе детей учили ставить двойные слепые контролируемые эксперименты, наше мышление стало бы более совершенным, и вот в каких областях:

Мы бы поняли, что не стоит делать обобщений на основании анекдотов - единичных случаев.

Мы бы поняли, как оценивать вероятность того, что эффект, который кажется важным, на самом деле - результат чистой случайности.

Мы бы поняли, насколько тяжело бывает исключить в мысленных построениях ангажированность, которая далеко не всегда является результатом нечестности или коррумпированности любого рода. Это очень важный урок. Он оказывает чрезвычайно благотворное действие в том, что касается недоверия к авторитетам и личному мнению.

Мы бы поняли, что нам необходима привычка к критическому и скептическому мышлению, которая в итоге может спасти мир».

Слепой метод - процедура проведения исследования реакции людей на какое-либо воздействие, заключающаяся в том, что испытуемые не посвящаются в детали исследования. Метод применяется для исключения субъективных факторов, которые могут повлиять на результат эксперимента.

заключается в том, что не только испытуемые, но и экспериментаторы остаются в неведении о важных деталях эксперимента до его окончания. Двойной слепой метод исключает неосознанное влияние экспериментатора на испытуемого, а также субъективизм при оценке экспериментатором результатов эксперимента.

Кстати! Этот вид контроля часто применяется при изучении лекарственных средств, когда ни субъект, ни человек, применяющий препарат, не знает, является ли это лекарственным средством или плацебо. В таком случае можно отделить эффекты лекарственного средства от любых предубеждений относительно того, какой эффект должно или не должно оказывать лекарственное средство.

При выборе и сравнительной оценке товаров или технологий большинство людей - так уж повелось - обычно ориентируется на мнение компетентных экспертов. А эксперты, в свою очередь, руководствуются наработанным опытом и собственными предпочтениями. Однако существуют и иные, куда более объективные критерии оценки, которые зачастую дают весьма неожиданные результаты. Наглядной иллюстрацией чему могут служить недавние тесты, сравнивавшие, в одном случае, качество по-разному сжатых аудиозаписей, а в другом случае - качество принтерной печати при разных чернилах и сортах бумаги.

Честный путь к истине

Так называемый двойной слепой метод тестирования пришел из науки, где является очень важной частью исследовательского инструментария ученых, поскольку позволяет получать наиболее объективные результаты экспериментов с участием людей. Цель двойного слепого метода - эффективно нейтрализовать первоначальные субъективные предубеждения и сдвиги во мнениях, которые всегда свойственны и тестируемым, и самим организаторам эксперимента, а потому явно или неявно влияют на анализ тестовых данных и оценку итоговых результатов. На сегодняшний день этот метод считается одним из самых важных во многих серьезных областях исследований от медицины и психологии до социологии и криминалистики.

Что представляет собой слепой метод тестирования в принципе, очень просто пояснить на примере с дегустацией, скажем, чая. При открытом способе дегустации приглашенные потребители пробуют чай разных марок и фирм в условиях, когда принадлежность содержимого каждой чашки к определенному бренду известна заранее, а потому дегустаторы обычно делают выбор в пользу тех названий, которыми пользуются регулярно или, по крайней мере, что-то о них знают. Из опытов хорошо известно, что если при дегустации тех же напитков скрыть все сведения о брендах, то те же самые испытуемые нередко выбирают совсем другую марку. Иначе говоря, слепой метод помогает убрать сознательные или подсознательные сдвиги в представлениях испытуемых, существенно влияющие на исход эксперимента.

В более серьезных научных испытаниях вроде медицинских, когда важно не то, нравится или не нравится лекарство, а насколько эффективно оно помогает при лечении, один из общепринятых методов проверки носит название single-blind, то есть одинарный слепой. При этом методе каждый из испытуемых не знает, входит ли он или она в тестовую группу, принимающую новое лекарство, или же в контрольную группу, которой дают нечто нейтральное для сравнения результатов с тестовой. Но, как показывает опыт, этот метод не очень хорош, потому что сами экспериментаторы тоже являются людьми и при организации опытов вольно или невольно пытаются повлиять на получение желаемого исхода. Поэтому, скажем, пациенты нередко могут догадываться, дают им пустышку или настоящее лекарство. Более яркий пример того же самого - это процедура опознания преступника свидетелем, когда организаторы опознания заранее знают, кого нужно разоблачить, и вроде бы обезличенный метод устраивается так, чтобы подтолкнуть испытуемого к нужному выбору.

Для ликвидации всех подобных перекосов разработан двойной слепой (double-blind) метод тестирования, в экспериментах с участием людей позволяющий эффективно нейтрализовать субъективные предубеждения как испытуемых, так и самих испытателей. В условиях двойного слепого уже ни испытуемые, ни экспериментаторы не знают, кто является членом тестируемой группы, а кто членом контрольной группы для сравнения (в условиях правоохранительной работы - когда организаторы опознания сами не знают, кто предполагаемый преступник). Лишь после того, как все данные тестов зафиксированы (а в некоторых случаях и после того, как проанализированы), исследователи, наконец, получают от независимой третьей стороны информацию о том, кто был кто. При аккуратной организации и случайном распределении испытуемых по группам тестирования и контроля двойной слепой метод позволяет полностью избавиться от человеческого субъективизма и проводится в тех случаях, когда хотят добиться наиболее высоких стандартов научной строгости.

Хотя двойные слепые методы получили наибольшее распространение в медицине, в принципе их можно применять в любых экспериментальных ситуациях, где существует возможность того, что результаты испытаний окажутся под влиянием сознательных и/или подсознательных сдвигов в представлениях участников эксперимента. Особенно удобно устраивать двойные слепые тесты с помощью компьютера, поскольку программу, организующую эксперимент, легко сделать так, чтобы она не имела никаких сдвигов в пользу того или иного выбора. По аналогии с приведенными выше примерами из медицины и криминалистики, та часть программы, которая обеспечивает взаимодействие с испытуемым человеком, - это работающий вслепую экспериментатор, а та часть, которая знает, что именно предложено для оценки, - это независимая третья сторона.

Классическим, можно сказать, примером такого подхода, часто реализуемым с помощью компьютера, является так называемый тест ABX, где испытуемому человеку предлагается на пробу неизвестный стимул X, который следует отнести к одному из двух возможных и уже известных выборов A или B. Помимо того, что этот тест очень просто организовать в различных модификациях, ABX давно знаменит тем, что легко и наглядно развенчивает устойчивые мифы, бытующие среди населения. За что его, мягко говоря, недолюбливают многие авторитетные эксперты, эти мифы создающие.

Уши в замешательстве

В 1990-е годы, когда публика начала массово осваивать сжатие музыки с Audio CD в файлы MP3, никому поначалу и в голову не приходила идея об эквивалентности звучания скомпрессированных аудиотреков и исходных дорожек с компакт-диска. Общепринятый стандарт сжатия с постоянным битрейтом 128 Кбит/с давал примерно 10-кратную экономию в размере файлов, благодаря чему стало возможно перекачивание музыки через узкий канал телефонного модема, и при этом сохранял достаточно приемлемое качество звучания для слушателей. Но не более того.

Однако скорость интернет-соединений с годами заметно увеличивалась, еще быстрее росла емкость жестких дисков компьютеров, а параллельно с ними увеличивался и битрейт сжатия аудиофайлов, давая ощутимые улучшения в качестве звука, но при этом наращивая и размер файлов. Поэтому на каком-то из этапов данного процесса возник неизбежный вопрос: а при каких значениях параметров сжатия увеличение битрейта перестает себя оправдывать с точки зрения качества звука, а влечет одно лишь разрастание дискового пространства для хранения? Быть может, в большинстве случаев разумно остановиться уже на 160 или 192 Кбит/с? А при битрейте 256 или 320 Кбит/с треки звучат настолько чисто, что, быть может, уже и матерые аудиофилы не способны их отличить от несжатого звука CD? Не говоря уже об обычных любителях музыки…

Подлинные аудиофилы обычно с презрением относящиеся ко все этим MP3, как правило, против компрессии решительно возражают и уверены, что всегда отличат сжатый с потерями звук от оригинала. Однако еще весной 2000 года германский компьютерный журнал c’t провел весьма качественное двойное слепое тестирование треков MP3 и CD с участием полутора десятка аудиофилов, отобранных профессиональной комиссией из нескольких сотен желающих. Результаты тестов сильно удивили всех - и участников, и организаторов. При прослушивании 1-минутных фрагментов из 17 произведений классики, джаза и поп-музыки, представленных в трех вариантах (128 Кбит/с, 256 Кбит/с и CD-качество) испытуемые достаточно уверенно выделяли лишь 128 Кбит/с, а вот при оценке треков 256 Кбит/с и несжатого формата результаты с выбором наилучшего качества оказались абсолютно идентичны. Иначе говоря, ровно в половине случаев слушатели отдали предпочтение CD, а в половине случаев трекам MP3 256 Кбит/с. Приглашенный в качестве эталонного слушателя звукоинженер фирмы Deutsche Gramophon Гернот фон Шульцендорф, занимающийся подготовкой к изданию мастер-копий записей классической музыки, в общих тестах не участвовал, но в предварительных испытаниях с выявлением CD-звука показал заметно лучшие результаты, чем остальные. После окончания тестов Шульцендорф раскрыл секрет своего успеха. Оказалось, что он по опыту работы заранее знал, что многие записи определенных жанров при качественном сжатии звучат более округло и приятнее для человеческого уха, чем оригинальный трек CD. Поэтому в целом ряде случаев он делал выбор аналитически, по сути дела в пику тому, что реально слышат уши.

Интересные результаты c’t в свое время много обсуждались в Интернете, но нельзя сказать, что поколебали точку зрения настоящих аудиофилов, продолжающих твердо верить в свою правоту. И ныне настаивающих на бесспорном превосходстве тех форматов, вроде FLAC, что для плеера и компьютера умеют паковать аудиозаписи со сжатием без потерь (то есть при воспроизведении восстанавливающие файл до полной копии CD-трека). Однако неоспоримый прогресс проделан и в алгоритмах сжатия с потерями, где все тот же MP3 с переменным битрейтом ныне одновременно может обеспечивать и наибольшее сжатие и наилучшее качество для заранее заданной битрейтовой базы. Другими словами, ничуть не утратил своей актуальности и давно уже задаваемый вопрос о том значении параметра, при котором любителям качества разумно остановиться с наращиванием битрейта, зная, что человеческому уху тончайшие различия все равно уже не уловить.

Совсем свежий двойной слепой тест на этот предмет в апреле 2007-го провел американский журнал Maximum PC. Здесь эксперимент устроили так. К компьютеру с качественной аудиоплатой Creative X-Fi и весьма приличными наушниками Sennheiser HD 580 пригласили четырех аудиофилов, каждый из которых принес свой CD с референсным треком, где нюансы звуковой картины по их мнению лучше всего подходят для анализа качества сжатия. Каждый такой трек представили для прослушивания в трех уровнях качества - 160 Кбит/с, 320 Кбит/с и несжатый WAV. Причем сжатие осуществлялось с переменным битрейтом (VBR), когда степень компрессии динамически уменьшается или возрастает в зависимости от сложности конкретного музыкального фрагмента. Таким образом, каждому тестеру предоставлялось в общей сложности 12 треков для сравнительного прослушивания в максимально доброжелательных условиях. То есть ранжирование записей по качеству осуществлялось не на основе минутного отрывка из каждого куска, а при прослушивании в течение любого интервала времени, любое количество раз и с возможностью попеременного (A/B) сравнения с другими треками.

Больше всего абсолютно все тестеры-аудиофилы были поражены, насколько сложной в реальности оказалась задача. Выяснилось, что при подъеме нижнего порога сжатия до качества 160 Кбит/с VBR аудиотрек уже становится очень и очень непросто отличить от CD-качества даже для опытного уха. Не говоря уже о битрейте 320 Кбит/с. Подводя же общий итог этого испытания, можно отметить, что в условиях, когда максимально возможное число правильных опознаний качества равнялось 12, самый лучший результат верных угадываний для одного аудиофила составил 6, то есть всего половину. Если же чуть изменить способ подсчета и принять во внимание, что каждый из 4 тестеров прослушал для анализа 4 трека в качестве CD (то есть в сумме 16), но при этом совокупно они правильно выявили несжатое качество лишь в 6 случаях, то получается, что в 10 из 16 прослушиваний наилучшее качество звучания было признано за MP3-файлами. Действительно, есть чему поразиться и аудиофилам, и обычным любителям MP3.

На букву Х и на букву Е

Впечатляющий прогресс, проделанный индустрией принтеров за последний десяток-полтора лет, принес в домашний быт сравнительно недорогие аппараты, дающие очень качественную цветную полиграфию, о которой в начале 1990-х потребители и не мечтали. Единственное, пожалуй, что вызывает ворчание и растущее недоумение - это цена на расходные материалы, особенно на быстро кончающиеся чернила для принтера. В то время как достоинства самих принтеров из года в год растут, а цена на них снижается, стоимость чернил и бумаги для этих аппаратов практически не меняется, из-за чего домашняя печать продолжает оставаться недешевым, вообще говоря, удовольствием.

То, что цены на фирменные чернила и бумагу, выпускаемые той же компанией, которая изготовила принтер, искусственно завышаются - это давно ни для кого не секрет. Именно по этой причине все большую популярность в народе обретают чернила и прочие расходные материалы от сторонних производителей. За существенно меньшие деньги у них можно купить примерно такие же расходники, которые по виду дают тот же самый результат, что и фирменные товары. Однако практически у каждого покупателя левого продукта в душе свербит сомнение - а не слишком ли сильно падает качество печати в сравнении с фирменными материалами? Тем более что на это обстоятельство регулярно напирают изготовители родных (дорогих) чернил-бумаги.

Дабы навести ясность в столь насущном вопросе, американское издание Trusted Reviews, специализирующееся на обзорах и тестах потребительских компьютерных технологий, провело большое (двойное слепое, естественно) сравнение расходных материалов для принтеров всех четырех главных изготовителей. Каждая из этих компаний прекрасно известна потребителям, однако установившиеся с некоторых пор в компьютерной прессе порядки таковы, что в явном виде указывать название фирмы стало экономически безопасно лишь в тех случаях, когда материал носит очевидно хвалебный характер. Данное исследование к подобным случаям явно не относится, поэтому знаменитые изготовители принтеров будут упомянуты лишь прозрачными намеками - на букву C, на букву E, на букву H и на букву L.

Итак, вопрос, поставленный исследователями, звучал очень просто: насколько качество печати на основе расходников от сторонних производителей сравнимо с печатью при фирменных чернилах и бумаге? Для тестирования были выбраны четыре популярных современных принтера, широко распространенных у домашних пользователей (точные названия моделей можно найти в итоговом отчете на сайте www.trustedreviews.com). В качестве сторонних поставщиков чернил были выбраны наиболее известные в США фирмы Cartridge World, InkTecShop, JetTec и StinkyInk, но эти названия существенной роли не играют, поскольку компании подобного рода обычно занимаются импортом, перезарядкой и перепродажей расходников от самых разных производителей. Важно лишь то, что это в изобилии предлагаемая дешевая альтернатива дорогим фирменным материалам.

Второй, не менее существенный аспект - это выбор бумаги. Все изготовители принтеров непременно подчеркивают, что для обеспечения качественной печати две главных составляющих, чернила и бумага, непременно должны разрабатываться вместе. Химия чернил должна соответствовать характеристикам бумаги, поэтому структура бумаги для принтеров имеет несколько слоев из разных материалов - один впитывает чернила, другой предотвращает их растекание, третий обеспечивает глянец фотографиям. Чтобы проверить истинность тезиса о важности соответствия фирменной бумаги своим чернилам, исследователи набрали комплекты глянцевой фотобумаги от четырех принтерных компаний, а для сравнения - пачки универсальной принтерной бумаги от сторонних поставщиков: Ilford, Kodak, PC World и Staples. Для распечатки не фотографий, а обычных документов взяли пачку обычной офисной бумаги для принтеров и ксероксов.

Тестирование сводилось к сравнению трех типов изображений: страница черного текста и графики на белом фоне и две фотографии. Одна - пейзаж с зелеными деревьями, синими небесами и скалистым берегом из красного гранита. Вторая - фото модели, дающее разнообразные оттенки цвета тела и фактуру тканей одежды на зеленом фоне листвы. Эти образцы были распечатаны на всех четырех принтерах, с пятью типами чернил и на шести типах бумаги.

Получившиеся в итоге две с половиной сотни распечаток были представлены для оценки группе типичных и достаточно опытных пользователей, которых попросили оценить каждое изображение по 10-балльной шкале. Ориентиры для оценки были такие. 10–9 баллов - если качество картинки таково, что ее хотелось бы оставить как память о свадьбе, юбилее или другом важном событии в жизни; 8-7 баллов - как воспоминание о проведенном отпуске; 6-5 баллов - достаточно хорошо, чтобы просто оставить снимок, хоть и с небольшими дефектами; меньшее количество баллов - для снимков, которые вряд ли захочется сохранить из-за убогого качества.

Перед выдачей для оценки все распечатки были пронумерованы и тщательно перемешаны, так что в соответствии с двойной слепой методикой ни оценщики, ни организаторы уже понятия не имели, что за принтер, чернила и бумага использованы в том или ином случае. Общий вывод всех оценщиков после испытаний - это чрезвычайная сложность задачи по отысканию различий, поскольку все распечатки одной картинки имели очень похожее качество. Тем не менее, когда все результаты тестов были аккуратно расписаны в таблицы, в которых по номерам восстановили параметры каждой распечатки, легко были выявлены и характеристики, набравшие наибольшее количество баллов.

Самый главный итог теста - это то, что члены оценочной комиссии в целом явно отдали предпочтение тем распечаткам, которые были сделаны с помощью расходников сторонних производителей. Для каждого принтера по отдельности левые чернила и комбинация бумаги от разных поставщиков набрали больше баллов, чем распечатки с помощью сочетания из фирменного картирджа и фирменной бумаги.

Таким образом, стало можно вполне компетентно и научно обоснованно утверждать, что чернила сторонних производителей по качеству печати ничем не уступают фирменным расходным материалам, а при особо удачном сочетании компонентов могут и заметно их превосходить. Но это, надо отметить, пока еще не вся картина в своей полноте. Потому что каждый из главных изготовителей принтеров также утверждает, что левые чернила значительно быстрее выцветают, чем их собственные. А отсюда естественным образом вытекает и продолжение теста Trusted Reviews. Теперь образцы, размноженные для первого исследования, частично расклеены на стекла окон, частично на стены и доски объявлений внутри здания, а остальные помещены в альбом на полке в шкафу. Примерно через полгода организаторы теста к ним вернутся и посмотрят, насколько соответствует действительности идея о стойкости фирменных чернил. Вполне возможно, что и этот результат не будет соответствовать устоявшемуся в народе мнению.