Ежегодная конференция DataConf посвящена анализу данных и применению технологий машинного обучения для решения различных бытовых, производственных и бизнес-задач на реальных примерах. Организаторами мероприятия выступают минэкономразвития Алтайского края и Алтайский центр кластерного развития совместно с Barnaul Data Science Community.
Современные веяния
Опытом использования искусственного интеллекта и анализа больших данных поделились практикующие разработчики из ведущих российских и международных IT-компаний, а также вузов Сибири.
Николай Глухов, студент четвертого курса АлтГУ, сотрудник компании Estesis, выступил с докладом по своей дипломной работе — отслеживанию мошенничеств на кассах самообслуживания.
— Довольно актуальная тема для операций с весовыми товарами, — поясняет Николай. — Автоматизированное решение привязано к камерам видеонаблюдения. Они снимают весовую платформу и с помощью компьютерного зрения проверяют, соответствует ли изображение указанному пользователем товару. Программа тестируется, пока вполне успешно.
Помимо компьютерного зрения, Николай интересуется разработками в области обработки естественного языка — это область искусственного интеллекта, которая позволяет компьютерам понимать, анализировать и генерировать текст, общаясь таким образом с человеком. Денис Козлов, заведующий кафедрой информатики Алтайского государственного университета, отмечает, что это направление сейчас в моде. Обработкой естественного языка занимаются большие языковые модели, которые лежат в основе работы нашумевшего ChatGPT и подобных сервисов.
Как готовить данные для моделей машинного обучения, как автоматизировать проекты с их помощью — этому и многому другому обучают в магистратуре АлтГУ, о чем и рассказал на конференции Денис Козлов.
— Программа магистратуры «Инженерия искусственного интеллекта» открылась в 2022 году по гранту, выигранному совместно с Консорциумом вузов во главе с Уральским федеральным университетом, — сообщил Денис Юрьевич. – На базе этого гранта был разработан единый учебный план для ряда вузов, в том числе АлтГУ. Сейчас грантовый проект закончился, и мы получили право на внесение изменений в учебный план. Мы стараемся соответствовать современным веяниям и техническому прогрессу, открываем новые партнерства, подписываем договор с онлайн-площадкой, где наша образовательная программа сможет реализовываться в сетевой форме.
Доверяй, но проверяй
Хотя многие уже так или иначе пробовали пользоваться языковыми моделями, не всех устраивает качество их работы. Искать информацию, планировать путешествия — искусственный интеллект помогает в разных бытовых задачах. Но бывает, что он обманывает, выдает ложную информацию или и вовсе выдумывает нечто неправдоподобное.
— Языковая модель — это что-то вроде умного поисковика, который знает все, но не вся эта информация релевантна. Продуктивность одного школьного учебника физики может быть выше, чем всего интернета, — отметил в своем выступлении Яков Филин, соорганизатор конференции, генеральный директор компании Estesis. — Точечная, краткая, детализированная информация имеет ключевое значение в принятии решений. А языковым моделям скармливаются тонны информации, и им тяжело выбирать правильный ответ из всего этого массива. Создать контент — лёгкая задача. Сложная — его проверить, верифицировать. Многие разуверились в ИИ-агентах потому, что они генерируют фейковый контент. Мы научились генерировать информацию со скоростью света, но забываем её валидировать. Моделей очень много, и теперь актуален вектор на их улучшение.
Среди вариантов решения этой проблемы Яков Филин предлагает, например, предоставление пользователю информации о степени уверенности агента в ответе или же использование нескольких моделей для перекрестной проверки выводов. В отдельных сферах применения ИИ необходимо введение человеческого контроля, ручной проверки на критически важных этапах работы.
«Будущее у языковых моделей есть, но относитесь к ним с осторожностью», — резюмировал Филин.
Руководитель дирекции «Машинное отделение» компании Koronatech Иван Комаров рассказал, как поэтапно создается программа наподобие ChatGPT, какие вызовы возникают у разработчиков и как их решают. Это похоже на обучение ребёнка русскому языку — спикер отметил это на примерах с типичными ситуациями, когда языковая модель на каком-то этапе просто повторяет предложение, отправленное в ее адрес, как бы передразнивает, немного перефразируя. В компании Koronatech языковая модель используется, например, для поиска информации в базе данных. И собственная разработка здесь очень важна, так как компания имеет дело с персональными данными, а бесплатная модель из уже существующих не гарантирует безопасности для этих данных. Языковая модель может давать советы разработчикам и аналитикам, транслитерировать имена и фамилии из загранпаспортов, автоматически переписывая их кириллицей, помогать специалистам в проверке тестовых заданий при приеме на работу или практику.
«Заменят ли ИИ разработчиков? Скорее дополнят, но не заменят. Моделям доверять не скоро начнут, но с их помощью работа человека будет более эффективной», — считают представители Koronatech.