Оглавление
Анонс
Статья содержит размышления методологического характера о некоторых концептуальных вопросах использования современных информационных технологий людьми с инвалидностью по зрению (прежде всего, тотально незрячими пользователями, к числу которых я принадлежу) и, как следствие, о невизуальном использовании аппаратного и программного обеспечения. Статья ориентирована на специалистов в сфере обеспечения доступности информационного пространства, разработчиков специализированных (адаптивных) программных решений, а также на не очень широкий круг незрячих пользователей компьютерной техники. Особую благодарность за участие в подготовке материалов хотелось бы выразить моему коллеге – Анатолию Камынину (Портал Tiflocomp).
О целях и правилах обсуждения
В названии статьи присутствует четыре сущностных словосочетания: «современные информационные технологии», «незрячие пользователи», «адаптивные решения» и «доступность цифрового контента». Частота использования этих (или похожих) словосочетаний в той части информационного поля, которая связана с людьми с инвалидностью, неуклонно возрастает. Более того, в настоящее время создаются предпосылки для того, чтобы внимание широкой общественности еще больше концентрировалось вокруг проблем доступности информации, представленной в электронно-цифровой форме, людям с различными ограничениями жизнедеятельности. Вместе с тем, уровень общественного и экспертного осмысления обозначенных вопросов требует большей проработанности, иначе потребность в решениях начнет сильно превосходить экспертный потенциал (собственно, эта тенденция очень характерна для проблем обеспечения доступной среды в целом). Запрос на решения будет сформулирован, а качество проработки предложений окажется настолько низким, что действия, которые неизбежно последуют за принятыми решениями, будут, как минимум, неэффективны.
Статья преследует несколько целей. Во-первых, предложить экспертному сообществу единый терминологический аппарат, чтобы говорить о проблеме одними одинаково понимаемыми словами. Во-вторых, предложить их содержательное наполнение, то есть договориться о том, что именно мы имеем в виду. В-третьих, определить и учитывать принципиально важные аспекты, которые нельзя игнорировать. Иными словами, статья направлена на то, чтобы очертить в первом приближении проблемы использования современных информационных технологий незрячими пользователями с учетом развития и использования адаптивных решений и обеспечения доступности цифрового контента. Ряд изложенных мыслей и формулировок после обсуждения, возможно, потребует уточнений и видоизменений. В то же время, в статье констатированы принципиальные факты, игнорировать или ставить под сомнение которые было бы серьезной ошибкой.
Есть надежда, что предложенный уровень обсуждения позволит включиться в него широкому кругу людей, неравнодушных к вопросам обеспечения безбарьерной окружающей среды в целом, и будет учтен специалистами, работающими в сфере информационной доступности.
«Современные информационные технологии»
Предложить строгое и лаконичное определение словосочетанию «современные информационные технологии» в сколько-нибудь сжатом виде не представляется возможным. Вместо этого, попытаемся примерно очертить его границы. Будем считать, что речь идет о совокупности информационных услуг и сервисов, которые люди получают при помощи смартфонов и компьютеров, а также о возможностях, которые предоставляют эти устройства массовому пользователю. По существу, это интернет-ресурсы и другая информация, представленная в электронно-цифровой форме, а также приложения для стационарных и мобильных устройств и иные пользовательские интерфейсы. Далее будем использовать словосочетание «информационный сервис». Примеры таких информационных сервисов буквально витают в воздухе (а многие из них – так и вовсе в «облаках»): социальные сети, приложения для заказа продуктов, такси и клоунов на детский праздник, государственные услуги, предоставляемые в электронно-цифровой форме, электронные библиотеки и СМИ, сервисы обмена текстовыми и голосовыми сообщениями, а также аудио- и видеозвонками, электронные календари и переводчики, базы данных нормативно-правовой информации, электронный дневник, система учета пациентов, текстовые и табличные редакторы, программы для создания презентаций, компьютерные игры, интегрированные корпоративные решения, онлайн-банкинг и др.
Следующим шагом важно подчеркнуть разницу между функциональностью информационного сервиса и его человеко-ориентированным интерфейсом. В самом общем виде функциональность обеспечивает пользователю дополнительные возможности, а интерфейс – доступ к этой самой функциональности.
О функциональности отдельно взятого информационного сервиса (ресурса или продукта) мы рассуждаем в терминах «да–нет»: либо сервис позволяет пользователям решить конкретную задачу, либо нет. Интерфейс же является посредником между пользователем и функциональностью информационного сервиса: чтобы сделать заказ при помощи терминала в кафе быстрого обслуживания, нужно подойти к терминалу и для начала ткнуть пальцем в красочную картинку с подносом («Есть буду здесь») или пакетом («Возьму с собой»). Совершенно очевидно, что функционал информационной системы, который не имеет пользовательского интерфейса, обречен, т. к. для пользователя этой системы он просто не существует: невозможно заказать гамбургер по-неаполитански, если его нет в меню.
Интерфейс может быть удобным (эргономичным) или не очень, но в современных информационных системах, рассчитанных на массового потребителя, он с большой вероятностью будет графическим. Принципиально пользователь любого информационного сервиса решает две задачи: он воспринимает информацию и сообщает ее системе, т. е. вводит необходимые данные и управляет сервисом. И первая, и вторая задачи решаются при помощи интерфейсов, поэтому они заслуживают отдельного внимания.
У человека, как известно, всего пять органов чувств – инструментов, при помощи которых он, в принципе, способен воспринимать информацию об окружающем мире. Современные информационные сервисы могут выдавать информацию, которую пользователь будет воспринимать только тремя органами чувств – при помощи зрения, слуха и/или осязания. Вкус и обоняние на текущий момент технологического развития в процессе взаимодействия человека с массовыми информационными сервисами не задействованы. Таким образом, все интерфейсы, при помощи которых информационная система предоставляет пользователю информацию, подразделяются на три большие группы:
- Визуальный – система общается с человеком, выводя информацию на экран, а пользователь воспринимает ее глазами. В настоящее время визуальный интерфейс – это, конечно, графический (graphical user interface – GUI) – элементы интерфейса (кнопки, поля, меню) имеют визуальное (графическое) представление, т. е. они нарисованы на экране. Альтернативой графическому является интерфейс текстовый (Text User Interface – TUI), самым ярким примером которого можно считать командную строку: для представления информации используются буквы, цифры и символы псевдографики.
- Аудиальный – информационный сервис выдает информацию в виде синтезированной речи или предварительно записанных голосовых сообщений, а также при помощи звуковых уведомлений неречевого характера. Сравнительно простой аудиоинтерфейс реализован в банкоматах («Вставьте карту», «Введите пин-код») или в безнадежно устаревших стационарных телефонах с автоответчиком («У вас 3 новых сообщения»). Современные системы спутниковой навигации также опираются на вывод информации в виде голосовых сообщений, правда, так называемые «аудиоподсказки» до недавнего времени являлись всего лишь приятным необязательным дополнением к визуальному интерфейсу. Эта тенденция меняется в связи с интенсивным развитием технологий синтеза, а главное – технологий распознавания и интеллектуальной обработки устной человеческой речи (см. ниже «голосовой интерфейс»). Самые сложные аудиоинтерфейсы реализуются программами экранного доступа (см. ниже), которые помимо голосовых (речевых) сообщений включают вспомогательные звуковые эффекты. Некоторые сервисы, рассчитанные на незрячих пользователей, могут позволить себе разрабатывать собственные средства обеспечения доступности (например, режим самоозвучания мобильного приложения AV3715 PocketReader для Android или компьютерные игры для незрячих).
- Тактильный – взаимодействие с системой опирается на прикосновение (восприятие вибрации, фактуры, разницы рельефа). Одним из самых продвинутых тактильных интерфейсов является так называемый «цифровой Брайль» (Digital Braille) – чтение пальцами рельефно-точечного шрифта Брайля при помощи специального периферийного устройства – Брайлевского дисплея.
С точки зрения управления информационным сервисом, т. е. доведения до системы определенной информации, можно выделить следующие варианты интерфейсов:
- Голосовой – взаимодействие с информационной системой осуществляется посредством устной речи: пользователь голосом формулирует запрос, а информационный сервис реагирует на него, озвучивая ответ синтезатором речи или выполняя определенные действия (например, создавая встречу в календаре). В качестве примера можно привести голосовые ассистенты: Сири под iOS и MacOS, Google Assistant и «Дуся» для Android, Cortana для Windows 10.
- Тактильный, который, в свою очередь, подразделяется на кнопочный и сенсорный.
- Кнопочный – информация вводится в систему при помощи кнопочных органов управления. Самый традиционный способ ввода информации – набор текста на физической (кнопочной) клавиатуре персонального компьютера пальцами рук пользователя. Другой пример – ввод пин-кода на терминале при оплате товаров при помощи пластиковой карты.
- Сенсорный (альтернатива кнопочному интерфейсу) – управление информационным сервисом предполагает прикосновение пользователя непосредственно к элементам интерфейса, изображенным на сенсорном экране.
С точки зрения невизуального использования кнопочный интерфейс представляется более удобным, поскольку важную роль играют тактильность (органы управления можно нащупать, т. е. определить без зрения и слуха, и отследить нажатие) и постоянство (физические кнопки располагаются в одном и том же месте, их количество остается неизменным, а функциональная вариативность сравнительно невысокой).
Принципиальная доступность для незрячих пользователей сенсорного интерфейса мобильных устройств на ранних этапах его становления вызывала очень большие сомнения, но сейчас она решена. Вместе с тем, полезные незрячим пользователям свойства кнопочного интерфейса мобильных устройств на текущий момент практически утрачены (вместе с самим кнопочным интерфейсом современных смартфонов – они сейчас в подавляющем большинстве сенсорные).
В принципе, есть и другие способы управления информационными сервисами (например, управление при помощи взгляда или движения различных частей тела), но они останутся за рамками настоящей статьи, т. к. не получили в настоящее время сколько-нибудь массового распространения среди незрячих пользователей современных информационных технологий.
«Незрячие пользователи»
Размышления об этом словосочетании приводят нас к необходимости раздробить это понятие, определив отдельно «незрячего» и «пользователя». «Незрячий» (если использовать это слово в качестве самодостаточного существительного) – это просто человек, который не видит – совсем, ничего и никогда. Более строго: незрячий – это человек, который в силу стойких нарушений функций зрения не может непосредственно использовать визуальный интерфейс информационного сервиса. Второе определение точнее, но сложнее, поэтому требует некоторых пояснений:
- Что значит «в силу»? Это значит, что отсутствие зрения является единственным препятствием на пути к использованию информационного сервиса. В самом грубом приближении мысль звучит так: «Если на время использования этого сервиса этому человеку вернуть зрение, то он точно сможет воспользоваться имеющимся функционалом». Напомним, что по нашему определению информационный сервис рассчитан на массового потребителя, т. е. использование сервиса не предполагает наличие специальных знаний или талантов.
- Что значит «непосредственно»? Это значит, что при наличии посредника – сможет. В качестве посредника может выступать специализированное технологическое решение или зрячий ассистент. При этом у посредника возникает всего две задачи: воспринять интерфейс информационного сервиса и воспроизвести его в приемлемой (доступной для пользователя) форме. Понятно, что для человека это очень низкоуровневая задача: от него требуется только способность видеть, говорить и шевелить пальцами (впрочем, последнее факультативно, так как незрячий пользователь вполне способен самостоятельно манипулировать устройством типа компьютерной «мыши» – главное знать, куда именно надо ее «манипулировать»).
Теперь обратимся к понятию «пользователь». Что именно необходимо, чтобы любой человек превратился в пользователя какого-либо информационного сервиса, если вынести за скобки необходимость взаимодействовать с интерфейсом? Получается, что пользователем может стать человек, который способен освоить функционал информационного сервиса, т. е. понимать объекты, которыми оперирует информационный сервис, их возможности, взаимосвязи и ограничения, воспринимать, оценивать и корректировать изменения, происходящие внутри информационного сервиса, а также принимать необходимые решения и нести ответственность за их последствия. Речь фактически идет о мыслительных, психологических, лингвистических и других ожидаемых способностях среднестатистической дееспособной личности. Проще говоря, пользователь онлайн-банкинга должен понимать слова вроде «пластиковая карта», «реквизиты счета», учитывать ограничения («Нельзя израсходовать больше денег, чем есть на счету, если не взять кредит… Но эти средства придется возвращать – причем в ограниченные сроки и в большем объеме»). Он должен обладать коммуникативными навыками, достаточными для заключения договора банковского обслуживания с финансовым учреждением, уметь концентрировать свое внимание настолько, чтобы освоить мобильное приложение или веб-интерфейс, уметь самостоятельно распоряжаться деньгами и тому подобное. Успешное решение всех этих задач является необходимым минимумом для любого человека, который стремится получить дополнительные возможности от использования того или иного информационного сервиса.
Разобравшись с «незрячим» и «пользователем» по отдельности, можно завершить рассуждения ответом на вопрос: «Влияет ли отсутствие зрения на способности человека, принципиально важные для освоения функционала массового информационного сервиса?». Попытаемся перефразировать: «Не накладывает ли отсутствие зрения существенный отпечаток на мыслительные, психологические, лингвистические и другие характеристики среднестатистической дееспособной личности?»
Для ответа на этот вопрос можно не углубляться в тифлопсихологию, а обратиться к актуальной практике. Она показывает, что сегодня – в начале 2020-х годов – люди с полной потерей зрения успешно пользуются многими информационными сервисами. Например, незрячие пользователи самостоятельно общаются в социальных сетях Facebook и VK, используют доставку еды – DoDo Pizza, Delivery Club, магазин “OK”, сервисы Avito и Profi.ru (где предлагают свои услуги разные специалисты), такси Uber, Get, Yandex и City Mobile, портал госуслуг РФ, Whats App и Skype, интернет-обозреватели Microsoft Edge, Mozilla Firefox, Google Chrome и Yandex-браузер, пакеты прикладных программ Microsoft Office, iWorks и Google Suite, Сбербанк Онлайн и многое другое.
Сразу оговоримся, что использование всех упомянутых информационных сервисов не означает полную доступность для незрячих пользователей всего функционала сложных программных решений или полное отсутствие каких бы то ни было барьеров доступности. Речь идет о другом. Мы можем уверенно констатировать очевидный факт: незрячий человек может стать полноценным пользователем многих информационных сервисов – и это уже давно происходит. Констатация этого простого факта порождает сразу несколько выводов.
- Отсутствие зрения не является непреодолимым препятствием для того, чтобы человек уже сейчас стал пользователем многих информационных сервисов.
- Если обеспечить доступность интерфейса массового информационного сервиса для незрячих пользователей, то с точки зрения сервиса они перестанут отличаться от всех остальных пользователей. Если сервис популярен, т. е. число пользователей достаточно велико, то среди всей массы пользователей обязательно появятся незрячие. Если популярность сервиса будет возрастать, то и количество незрячих пользователей этого сервиса тоже будет возрастать.
- Интерфейс любого массового информационного сервиса при нынешнем уровне технологического развития можно сделать доступным для незрячих пользователей. Логика здесь простая: если обеспечена доступность мобильного приложения «Сбербанк Онлайн», то и другие финансовые институты имеют техническую возможность обеспечить доступность собственных каналов дистанционного банковского обслуживания. Иными словами, обеспечение доступности интерфейса – решаемая задача, т. е. она переходит из области возможного в область желаемого.
«Адаптивные решения»
Выше мы констатировали, что люди с полной потерей зрения могут стать пользователями многих информационных сервисов. Правда, для этого необходимо обеспечить выполнение трех условий:
- Наличие адаптивных решений, способных выполнять роль технологического посредника между визуальным интерфейсом информационного сервиса и сохранными органами восприятия информации – слухом и осязанием.
- Соответствие пользовательского интерфейса информационного сервиса требованиям доступности, поскольку возможности технологического посредника по восприятию и преобразованию информации отличны от возможностей человека.
- Достаточный уровень квалификации незрячего человека в качестве пользователя современных информационных технологий.
Вопросы квалификации незрячих пользователей и доступности цифрового контента в рамках этой статьи не рассматриваются. Сконцентрируемся на анализе доступных адаптивных решений.
Как уже отмечалось, незрячий пользователь – это человек, который в силу объективных причин не может непосредственно воспринимать визуальный интерфейс информационного сервиса. Это, по сути, означает, что ключевая проблема лежит именно в плоскости восприятия информации. Собственно, любая сенсорная инвалидность сильно ограничивает или даже напрочь лишает человека возможности получать определенного рода информацию об окружающей среде. На зрение, по оценкам ученых, приходится до 80% всей информации, соответственно потеря зрения – самая радикальная моноинвалидность. Есть еще сочетанная патология, т. е. одновременное нарушение функций зрения и слуха, тотальная потеря которых оставляет человеку в качестве интерфейса взаимодействия с современными информационными технологиями только цифровой Брайль.
Вместе с тем, почему-то очень многие люди, неотягощенные специфическими знаниями, по умолчанию предполагают использование какой-то особенной «клавиатуры для незрячих». Причем после уточнений («О какой клавиатуре идет речь?») выясняется, что «специальная клавиатура» вовсе не является неправильным названием Брайлевского дисплея. Имеется в виду стандартное устройство ввода, на которое, по мнению неискушенных обывателей, должны быть наклеены специальные метки для обозначения букв русского и английского алфавитов. Видимо, в процессе набора текста эти пользователи смотрят не на экран компьютера (что было бы правильно с точки зрения контроля вводимой информации), а на клавиатуру, т. к. без визуального контроля не попадают пальцами по клавишам.
Специалистам (и даже искушенным обывателям) понятно, что ключевая проблема состоит в способе вывода информации и предлагаемой системе управления информационным сервисом. Таким образом, для обеспечения доступности интерфейса информационного сервиса принципиально важную роль начинают играть две технологии: преобразование текста в речь (text-to-speech) и в рельефно-точечный шрифт Брайля. Сейчас синтезатор речи – это программное решение, для реализации которого достаточно вычислительных мощностей большинства устройств массового применения, и, разумеется, динамик. С рельефно-точечным шрифтом дело обстоит сложнее: для преобразования электронного текста в рельефно-точечный шрифт необходимо специальное дорогостоящее периферийное устройство – Брайлевский дисплей (Braille Display). Вместе с этим, синтезатор речи и Брайлевский дисплей способны только выводить текст доступным для восприятия незрячего пользователя образом. Они не могут самостоятельно определять, какой именно текст и при каких условиях необходимо воспроизводить. Они также не могут предложить способ управления информационным сервисом, приемлемый для незрячего пользователя. Эти задачи решает программное обеспечение, которое получило общее название «программа экранного доступа» (screenreader).
Программа экранного доступа фактически формирует звуковой (при помощи синтезатора речи, дополнительных звуковых эффектов и вспомогательных сообщений) и тактильный (при помощи Брайлевского дисплея или вибрации мобильного устройства) интерфейсы той информационной среды, в которой существует конкретный информационный сервис. Под «информационной средой» в данном случае понимаются операционная система (operating system) и пользовательские агенты (user agents), т. е., например, интернет-обозреватели. Если информационный сервис предполагает использование веб-интерфейса, то получить к нему доступ можно при помощи более или менее любого смартфона и более или менее любого ноутбука, либо настольного компьютера.
Программы экранного доступа представляют собой наиболее яркий пример адаптивных решений для людей с полной потерей зрения. Они разрабатываются больше 40 лет. К настоящему моменту они присутствуют на популярных настольных операционных системах семейства MS Windows (Narrator, NVDA и Jaws), Apple MacOS (Voice Over) и Linux (Orca), а также на двух наиболее популярных мобильных платформах – Android (Talk Back) и iOS (Voice Over).
Строго говоря, адаптивные (вспомогательные) решения представляют собой программные и/или аппаратные средства, изменяющие (адаптирующие) представление информации в форму, доступную для лиц с различными видами функциональных ограничений. В широком смысле речь идёт не только об информации, представленной в электронно-цифровой форме, но и об информации вообще – в любых формах её представления. Применительно к незрячим людям, специализированным (адаптивным) решением можно считать технологию, которая направлена на преодоление барьеров, возникающих из-за стойких нарушений зрительных функций человеческого организма. Для людей с нарушениями зрения недоступной, прежде всего, является любая визуальная информация.
Возьмём для примера задачу определения номинала денежной купюры, имеющую принципиально важное значение для любого человека, включенного в систему общественных взаимоотношений. В данном случае, выражаясь формальным языком, возникает необходимость преобразовать (адаптировать для незрячих) плоскопечатную графическую информацию не электронно-цифрового вида, представленную в виде многоцветного рисунка по обеим сторонам банкноты. В прошлом адаптивные решения тяготели к собственной аппаратной основе, поэтому был создан самостоятельный аппаратный определитель денежных купюр. Это электронное устройство представляло собой коробочку, в специальную щель которой (купюроприемник) нужно было засунуть банкноту. Результат распознавания выдавался при помощи системы длинных и коротких звуковых сигналов.
В настоящее время все большее количество адаптивных решений реализуется в виде приложений, опирающихся на аппаратную и программную инфраструктуру современных массовых устройств. Так, определитель денежных купюр сейчас – это приложение, которое можно скачать в официальных магазинах обеих доступных платформ – App Store для iOS и Google Play для Android. После запуска приложения незрячий пользователь направляет камеру смартфона на купюру, и приложение (информационный сервис) определяет ее достоинство. Затем незрячий пользователь получает информацию о номинале банкноты либо в виде аудиосообщения (его объявляет синтезатор речи, установленный в операционной системе и используемый программой экранного доступа), либо в виде последовательности вибросигналов.
Аналогичным образом теряет актуальность специальное устройство для воспроизведения «говорящих» книг – тифлофлешплеер, уступая место сервисам, реализованным в виде все тех же мобильных приложений под iOS и Android (например, библиотека «Логос»). Органайзеры для слепых (типа Pronto или BrailleSense) постепенно уступают место сочетанию современного смартфона или планшета со специализированным Брайлевским дисплеем, как максимум, реализованным в едином корпусе (смотри материалы об устройстве ElBraille и других устройствах российской компании «Элита групп» на страницах… выпуска). Это приводит к значительному удешевлению и более высокой степени стандартизации используемых устройств и программного обеспечения.
Другими примерами актуальных высокотехнологичных адаптивных решений являются Брайлевская строка и принтер для печати рельефно-точечным шрифтом Брайля, программы спутниковой навигации (например, BlindSquare под iOS и OSMAnd Access под Android), сервисы удаленного видеоассистирования (например, BeMyEyes или Aira), программы для чтения электронных текстов (например, Voice Dream Reader) и т. д.
Встречной тенденцией становится повышение доступности массовых информационных сервисов с целью обеспечения их взаимодействия с существующими адаптивными решениями (в первую очередь, программами экранного доступа). Так, разработчикам современной социальной сети нет смысла вкладывать ресурсы в создание собственных средств доступности в силу целого ряда очевидных соображений, а именно:
- Адаптивные решения – это сложный программный продукт. Чтобы обеспечить сопоставимый пользовательский опыт, потребуется очень много ресурсов, которые фактически придется отвлечь от основных задач проекта.
- Адаптивное решение, будучи сложным программным продуктом, потребует от незрячего пользователя сил и времени на его освоение. Возникает риск, что альтернативное уникальное решение станет не стимулом, а, скорее, дополнительным барьером к использованию информационного сервиса.
- Информационный сервис существует внутри инфраструктуры, т. е. человек, не способный пользоваться инфраструктурой в целом, не доберется и до отдельно взятого оазиса доступности. Так, например, обеспечивать возможность воспроизведения текстовых материалов веб-сайта для незрячих пользователей при помощи синтезатора речи – бессмысленно: если они не решат задачу самостоятельного чтения электронных текстов, то до этого веб-сайта точно не доберутся. (Можно, конечно, допустить, что представленный на веб-сайте синтезатор речи будет более качественным, что функция чтения текстовых материалов окажется полезной для слабовидящих и пожилых пользователей, но в этом случае речь пойдет не о задаче обеспечения доступности информационного сервиса для незрячих, а о повышении удобства его использования другими целевыми аудиториями).
Таким образом, разработчиков современных информационных сервисов необходимо стимулировать к соблюдению сразу двух договоренностей: отказаться от попыток разрабатывать собственные адаптивные решения и соблюдать единые требования доступности, сформулированные в форме стандартов или спецификаций.