Лингвистические ресурсы и технологии

онлайн-выставка лингво-цифровых проектов ИЛиМК,посвященная празднованию 80-летия ЮУрГУ

Приглашаем всех желающих познакомиться с лингвистическими цифровыми продуктами, которые создаются в ИЛиМК в рамках научно-образовательных проектов!

Научно-образовательные проекты ИЛиМК направлены на разработку цифровых ресурсов лингвистического профиля и реализуются под руководством и при участии преподавателей ИЛиМК, совместно со студентами лингвистических и других направлений подготовки ЮУрГУ. Работы по созданию лингво-ориентированных цифровых ресурсов проводятся преподавателями в рамках реализации проектов, поддержанных грантами различного уровня, и студентами в рамках учебных и производственных практик, проектного обучения, проектных факультативов, научно-исследовательской работы и выпускных квалификационных работ.
Представляем Вашему вниманию краткие описания наших проектов. В описания включены ссылки на наши цифровые продукты, пройдя по которым Вы можете подробнее ознакомиться с содержанием и функционалом созданного лингво-информационного ресурса.

Приятного посещения онлайн-выставки!

 

<b>Силкина Ольга Михайловна</b>, кандидат филологических наук, доцент кафедры «Лингвистика и перевод»

Челябинск в жизни и творчестве замечательных людей

Руководитель проекта: Хомутова Тамара Николаевна, доктор филологических наук, профессор, профессор кафедры «Лингвистика и перевод»
Соруководитель проекта: Силкина Ольга Михайловна, кандидат филологических наук, доцент кафедры «Лингвистика и перевод»

Проект нацелен на создание биографического словаря о выдающихся людях, которые оставили свой след в истории и культуре Челябинска и России. Как писал известный американский поэт Генри Лонгфеллоу в своем Псалме Жизни:

Жизнь великих призывает
Нас к великому идти,
Чтоб в песках времен остался
След и нашего пути.

(перевод И. Бунина)

Созданные нами энциклопедический словарь представляет собой продукт нового направления в современной лексикографии, знаменующий переход от отдельных слов, цитат и пословиц к дискурсу культурного наследия как единице межкультурной и внутрикультурной коммуникации.

Период реализации проекта: 2021-н/в

Развитию интеллектуального туризма в регионе способствует словарь культурного наследия

Цель данного проекта – разработка лингво-информационного ресурса, поддерживающего сохранение и популяризацию культурного наследия региона, помощь иностранным студентам в освоении русского языка и региональной культуры, продвижение культурного туризма, развитие межкультурного диалога, образование и воспитание нового поколения, а также развитие теоретических основ энциклопедического дискурса интеллектуального туризма.

Создаваемый ресурс представляет собой русско-английский биографический словарь, включающий статьи о персоналиях, жизнь и творчество которых связано с Челябинском.  Структура статьи словаря включает, кроме биографической справки, информацию о творчестве и достижениях персоналии, роли Челябинска в жизни персоналии, ассоциации автора статьи-носителя региональной культуры, связанные с персоналией и локациями. Статьи сопровождаются картой, где отмечены значимые для биографии персоналии локации, что представляет ценность как ориентир для выстраивания туристического маршрута по Челябинску.

Словарь содержит энциклопедическую информацию, которая позволяет знакомить как челябинцев, так и иногородних и даже иностранных граждан с культурным наследием региона, прививать интерес к событиям и новостям локального характера, повышать значимость и ценность региональной культуры в глазах современной молодежи.

 

Разработчики

  • Хомутова Тамара Николаевна,
    профессор кафедры лингвистики
    и перевода, доктор филологических
    наук, профессор
  • Бабина Ольга Ивановна,
    заведующий кафедрой лингвистики
    и перевода, кандидат филологических
    наук, доцент
  • Силкина Ольга Михайловна,
    доцент кафедры лингвистики и
    перевода, кандидат филологических
    наук
  • Денисенко Марина Георгиевна,
    доцент кафедры лингвистики и
    перевода, кандидат филологических
    наук

Редакторы

  • Аманда Вегнер, сотрудник
    Офиса академического письма
  • Антипин Николай Александрович,
    кандидат исторических наук,
    доцент кафедры «Отечественная и
    зарубежная история»

Авторы статей и технические редакторы

  • студенты направлений 45.05.01, 45.03.03

Финансирование разработки сайта осуществлялось при поддержке гранта победителю регионального конкурса РФФИ, проект № 20-412-740011 «Дискурс интеллектуального туризма: интегральная модель (на материале мультимедийного энциклопедического словаря культурного наследия «Челябинск в жизни и творчестве замечательных людей»)» (2021). Научный руководитель: Хомутова Тамара Николаевна, д.филол.н., профессор

Уральский регион в военно-публицистическом дискурсе периода Великой Отечественной войны

Руководитель проекта: Солопова Ольга Александровна, доктор филологических наук, доцент, профессор кафедры «Лингвистика и перевод»

Уральский регион в военно-публицистическом дискурсе периода Великой Отечественной войны – уникальный информационный ресурс, который предоставляет открытый доступ к неизвестным и неопубликованным ранее в нашей стране материалам об Урале в период Великой Отечественной войны. Факсимильный архив дает возможность взглянуть на события 1941–1945 гг. глазами современников и участников, как соотечественников, так и западных партнеров.

Период реализации проекта: 2019-2021

Урал — кузница Победы

Цель проекта – сохранение исторической памяти о Великой Отечественной войне, стимулирование интереса к событиям на Урале в годы Великой Отечественной войны, патриотическое воспитание молодежи, создание эффективного канала трансляции исторического знания (с привлечением материалов советского, британского, французского, итальянского, испанского дискурсов) для противодействия попыткам пересмотра и фальсификации причин, итогов и событий одного из самых трагических и героических периодов в истории России.
Партнерами проекта выступили интернет-порталы Министерства Обороны РФ «Память народа» и «Подвиг народа», сайт Правительства РФ, Государственный исторический музей Южного Урала, региональное отделение партии «Единая Россия» в рамках проекта «Историческая память».
Материалы использованы при реализации научно-образовательного проекта «Урал в годы Великой Отечественной войны» на площадке музейно-образовательного комплекса ЮУрГУ (НИУ) (2018–2019), при подготовке экспозиций на выставках «Завтра была война» (2019) и «Одна на всех – Победа» (2020), проведенных на площадке ГИМ ЮУ, в двух онлайн-выставках на сайтах Южно-Уральского государственного университета и Министерства науки и высшего образования РФ и Центрального музея Великой Отечественной войны.

Команда проекта

  • Солопова Ольга Александровна,
    доктор филологических наук, профессор кафедры
    «Лингвистика и перевод»
  • Бернат Оксана Станиславовна,
    кандидат филологических наук, доцент кафедры
    «Лингвистика и перевод»
  • Чернышева Марина Александровна,
    кандидат филологических наук, доцент кафедры
    «Лингвистика и перевод»
  • Раевская Мария Валерьевна,
    кандидат филологических наук, доцент кафедры
    «Лингвистика и перевод»
  • Каган Мария Сергеевна,
    кандидат филологических наук, доцент кафедры
    «Лингвистика и перевод»
  • Шатрович Наталья Владимировна,
    старший преподаватель кафедры
    «Лингвистика и перевод»
  • Наумова Ксения Андреевна,
    кандидат филологических наук, младший
    научный сотрудник научно-исследовательского
    центра спортивной науки

Проект реализовывался при поддержке гранта РФФИ А 19-012-00192 Уральский регион в военно-публицистическом дискурсе периода Великой Отечественной войны (на материале оцифрованных архивных документов СССР и стран Западной Европы) (2019–2021). Руководитель: Солопова Ольга Александровна

AutoTutor : тренажер по академическому письму

Руководитель проекта: Шереметьева Светлана Олеговна, доктор филологических наук, доцент, профессор кафедры «Лингвистика и перевод», директор НОЦ "Лингво-инновационные технологии"

Тренажер AutoTutor представляет собой компьютерное приложение, выполняющее автоматизированную генерацию текста научной статьи на английском языке. Генерация выполняется в результате интерактивного диалога с пользователем. Тренажер включает лингвистическую поддержку в форме модуля для автоматического выделения одно- и многокомпонентной лексики из текста на русском языке и ее перевода на английский.

Период реализации проекта: 2019-2020

Писать научные статьи на английском языке правильно больше не проблема! 

Линейка интерактивных тренажеров AutoTutor разработана для предметных областей математического моделирования, машиностроения, интегративной физиологии и оптоинформатики. В фокусе тренажа находятся два основных и часто проблематичных для русскоязычных авторов аспекта письма: информационная структура международных публикаций и корректность английского языка. Уникальность инструмента AutoTutor заключается в том, что он имеет модули интеллектуальной обработки текста: парсер русского текста, переводчик многокомпонентной лексики, модуль извлечения контента статьи и автоматический генератор английских предложений. AutoTutor посредством компьютерного интервью извлекает из автора содержательную информацию и обеспечивает автоматизированную поддержку изложения этого содержания на английском языке. Таким образом, взаимодействуя с тренажером, автор получает навыки правильной организации содержания статьи, учится корректной английской терминологии и синтаксису английского предложения.

Команда проекта

  • Шереметьева Светлана Олеговна,
    доктор филологических наук, профессор
    кафедры «Лингвистика и перевод»,
    директор НОЦ «Лингво-инновационные
    технологии»
  • Бабина Ольга Ивановна,
    кандидат филологических наук, доцент,
    заведующий кафедрой «Лингвистика и
    перевод», заместитель директора НОЦ
    «Лингво-инновационные технологии»
  • Зиновьева Анастасия Юрьевна,
    кандидат филологических наук,
    доцент кафедры «Лингвистика и перевод»,
    лаборант НОЦ «Лингво-инновационные
    технологии»
  • Неручева Екатерина Дмитриевна,
    лаборант НОЦ «Лингво-инновационные
    технологии»
  • Первухин Алексей Васильевич,
    программист НОЦ «Лингво-инновационные
    технологии»

Челябинск: корпус исторических локальных текстов

Руководитель проекта: Орехова Елизавета Владимировна, кандидат филологических наук, доцент кафедры «Лингвистика и перевод»

Проект по созданию корпуса исторических текстов, посвященных Челябинску, реализуют совместно ИМСГН и ИЛиМК в рамках исполнения государственного задания Минобрнауки Российской Федерации по теме «Изучение региона в контексте глобально-исторических связей с помощью методов цифровой гуманитаристики (на примере Челябинска и Челябинской области)».
Целью проекта является создание цифрового ресурса, поддерживающего проведение историко-культурных исследований методами корпусной лингвистики и контент-анализа. Создаваемый ресурс воплощается в форме облачного сервиса, обеспечивающего доступ к базе размеченных исторических текстов.
Научный руководитель государственного задания: Епимахов Андрей Владимирович, д.и.н., доцент. Руководитель проекта по созданию корпуса текстов в ИЛиМК: Орехова Елизавета Владимировна, к.филол.н., доцент.

Период реализации проекта: 2022-2024

А что вы знаете про Челябинск 19 века?

Челябинск, являющийся сегодня административным центром одноименной области и обладающий населением более 1 млн человек, сформировался как важный транспортно-логистический центр к концу XIX в.

До проведения железных путей это был «жалкий русско-башкирский городишко самого заурядного, захолустного типа. Став затем на линии двух дорог, соединивших Европу с Азией, и узловой станцией на Урал, Челябинск стал быстро расти и расширяться, украсился новыми домами, общественными учреждениями и, сделавшись крупным торговым центром».[1]

Описания превращения Челябинска в бойкий центр торговли после прохождения через него железной дороги неоднократно встречаются в путевых заметках и очерках современников. Они и послужили материалом для нашего исследования. В базовый набор текстов созданного нами корпуса исторических локальных текстов вошли тексты, состоящие из заметок и различных публикаций жителей города, а также путешественников-гостей города, в которых они описывали свои впечатления о городе и Челябинской области: об облике города в целом, архитектуре, инфраструктуре, местных жителях и многом другом. В корпус вошли 15 книг различной жанровой принадлежности, в том числе сборники. Объем корпуса составил около 350 тысяч словоупотреблений.

Созданный нами ресурс позволяет определить, как отражался Челябинск в сознании писателей, путешественников или исследователей прошлого, выявить единицы языка, характеризующие местных жителей, инфраструктуру и внешний облик города, культуру, выявлять единицы, выражающие субъективную оценку города на рубеже 19-20 веков.

[1] Россия. Полное географическое описание нашего отечества. Настольная и дорожная книга. СПб., 1914. Т. 5. С. 490.

Команда проекта

  • Никонова Ольга Юрьевна,
    доктор исторических наук, профессор кафедры
    «Отечественная и зарубежная история»,
    старший научный сотрудник научно-образовательного
    центра «Культурно-исторические исследования»
  • Бабина Ольга Ивановна,
    кандидат филологических наук, доцент,
    заведующий кафедрой «Лингвистика и перевод»
  • Орехова Елизавета Владимировна,
    кандидат филологических наук,
    доцент кафедры «Лингвистика и перевод»

Разработчики сайта

  • Кабиольский Евгений Алексеевич
  • Зайцев Андрей Владимирович
  • Кукшинова Алла Борисовна

Студенты направления 45.03.03 (4 курс)
(разметка корпуса, контент-анализ)

  • Грачева Дарья Олеговна
  • Каримова Виолетта
  • Кутина Алина Владимировна
  • Левина Евгения Андреевна
  • Назарова Арина Евгеньевна
  • Савельев Александр Александрович
  • Хаматшарипова Алина Айнуровна

Финансирование разработки сайта осуществляется в рамках реализации государственного задания Минобрнауки Российской Федерации, проект № FENU-2020-0021 «Изучение региона в контексте глобально-исторических связей с помощью методов цифровой гуманитаристики (на примере Челябинска и Челябинской области)» (2020–2022). Научный руководитель: Епимахов Андрей Владимирович, д.и.н., доцент

<b>Шефер Екатерина Андреевна </b>, старший преподаватель кафедры «Лингвистика и перевод», переводчик Офиса академического письма ЮУрГУ

Английский язык для научно-публикационных целей : электронный курс

Руководитель проекта: Толстых Ольга Анатольевна, кандидат филологических наук, доцент кафедры «Лингвистика и перевод», редактор-консультант Офиса академического письма ЮУрГУ
Соруководитель проекта: Шефер Екатерина Андреевна , старший преподаватель кафедры «Лингвистика и перевод», переводчик Офиса академического письма ЮУрГУ

Авторский англоязычный электронный курс «Английский язык для научно-публикационных целей» знакомит с основными правилами и требованиями, предъявляемыми к англоязычным академическим текстам, помогает собрать свой собственный инструментарий при работе с текстами научных статей и овладеть навыками научного перевода. Индустриальный партнер проекта – Офис академического письма ЮУрГУ

Период реализации проекта: 2021-2023

Англоязычный курс «Английский язык для научно-публикационных целей» состоит из 10 модулей и посвящен таким важным основам теории академического письма, как структура научной статьи и формат IMRaD, речевые модели научного текста, лингвокультурные особенности русскоязычного и англоязычного академических дискурсов. Кроме того, в курсе рассматриваются лингво-информационные технологии в переводе научных текстов – системы автоматизированного перевода и системы машинного перевода, а также чат-бот GPT.

Команда проекта

  • Толстых Ольга Анатольевна, кандидат
    филологических наук, доцент кафедры «Лингвистика и
    перевод», редактор-консультант Офиса академического
    письма ЮУрГУ
  • Шефер Екатерина Андреевна, старший
    преподаватель кафедры «Лингвистика и перевод»,
    переводчик Офиса академического письма ЮУрГУ

Студенты направления 45.03.02

  • Дааева Амина
  • Горылева Екатерина
  • Качева Полина
  • Михайлова Анастасия
  • Науменко Лада
  • Овсянкина Анастасия
  • Целищева Юлия
<p><b>Бабина Ольга Ивановна</b>, кандидат филологических наук, доцент, заведующий кафедрой «Лингвистика и перевод» <p><b>Двойненко Максим Олегович</b>, старший преподаватель кафедры «Международные отношения, политология и регионоведение»

Региональный чат-бот «Выборы 74»

Руководитель проекта: Шестакова Людмила Ивановна, кандидат технических наук, доцент, заведующий кафедрой «Международные отношения, политология и регионоведение»
Соруководитель проекта:

Бабина Ольга Ивановна, кандидат филологических наук, доцент, заведующий кафедрой «Лингвистика и перевод»

Двойненко Максим Олегович, старший преподаватель кафедры «Международные отношения, политология и регионоведение»

Целью проекта является разработка чат-бота, ориентированного на реализацию мониторинга процесса региональных выборов. Чат-бот был апробирован на выборах в муниципальных образованиях Челябинской области 10 сентября 2023 года.

Период реализации проекта: 2023

Выборный процесс становится понятнее для избирателей 

Совместный научно-образовательный проект кафедр «Международные отношения, политология и регионоведение», «Лингвистика и перевод», а также «Социология» направлен на разработку чат-бота в Телеграм, выполняющего функции:

  • информирования населения о порядке голосования, возможных способах проголосовать, перечне кандидатов, документах, которые необходимо иметь при себе на избирательном участке и прочих тонкостях избирательного процесса
  • мониторинг нарушений, которые могут иметь место на избирательном участке

Информирование осуществляется в форме контролируемого диалога. Функция мониторинга правонарушений реализована в виде формы для отправки сигнала о правонарушении неравнодушными гражданами  в адрес Общественной палаты региона.

Созданный чат-бот имеет целью повысить информированность населения о специфике избирательного процесса, помочь молодым гражданам, принимающим участие в голосовании впервые, узнать о специфике избирательного процесса, а также способствовать получению Общественной палатой информации о возможных нарушениях на избирательных участках

Команда проекта

  • Шестакова Людмила Ивановна,
    заведующий кафедрой «Международные
    отношения, политология и регионоведение»,
    кандидат технических наук, доцент
  • Бабина Ольга Ивановна,
    заведующий кафедрой «Лингвистика и
    перевод», кандидат филологических наук,
    доцент
  • Двойненко Максим Олегович,
    старший преподаватель кафедры «Международные
    отношения, политология и регионоведение»
  • Валеева Эльвира Мавлитовна,
    кандидат педагогических наук,
    заведующий кафедрой «Социология»
  • Большаков Лев Михайлович,
    старший преподаватель кафедры «Теория
    государства и права, трудового права»

Участники-студенты

  • Студенты направлений подготовки
    «Политология», «Социология», «Юриспруденция»,
    «Фундаментальная и прикладная лингвистика»

Разработка чатбота велась в рамках реализации обучения на проектном факультативе ЮУрГУ «Региональный чат-бот по контролю и наблюдению за выборами в Челябинской области». Руководитель: Шестакова Людмила Ивановна

<b>Волкова Анна Леонидовна</b>, преподаватель кафедры «Лингвистика и перевод»

Карта языков Российской Федерации

Руководитель проекта: Бабина Ольга Ивановна, кандидат филологических наук, доцент, заведующий кафедрой «Лингвистика и перевод»
Соруководитель проекта: Волкова Анна Леонидовна, преподаватель кафедры «Лингвистика и перевод»

Целью проекта «Карта языков России» является картирование распространения языков по территории Российской Федерации, включая информацию о владении языками, использовании в повседневной речи, а также информацию о населении России, для которого язык является родным. Источником информации выступают данные переписи населения 2021 года.

Период реализации проекта: 2023-2024

А знаете ли Вы, на каких языках говорят в Российской Федерации?

Россия — многонациональное государство, где проживают представители около 200 народов, каждый из которых имеет свой национальный язык. Государственный язык России — русский, при этом на республиканском уровне признаны государственными более 30 языков, около 15 языков имеют официальный статус. Языки народов России представляют 15 языковых семей, включая индо-европейскую, уральскую, тюркскую, абхазо-адыгскую, тунгусо-маньчжурскую и другие языковые семьи. Согласно переписи населения 2021 года, в России насчитывается более 170 языков, которые население считает своим родным языком. Одни языки распространены по территории всей России, другие узко локализованы в определенных регионах.

Данный проект имеет целью создание визуального представления распространения языков по территории Российской Федерации. Отображение распространения языков на картах позволяет выполнять ареальные исследования языков, выявлять уязвимые и исчезающие языки, способствовать изучению явлений взаимопроникновения языков, прогнозировать возникновение пиджинов и креольских языков, предоставить базу для этимологических исследований языков.

 

Команда проекта

  • Бабина Ольга Ивановна,
    заведующий кафедрой «Лингвистика и перевод»,
    кандидат филологических наук, доцент
  • Волкова Анна Леонидовна,
    преподаватель кафедры «Лингвистика и перевод»
  • Максимова Валентина Николаевна,
    директор НОЦ «Геоинформационные системы»,
    доцент кафедры «Международные отношения, политология
    и регионоведение», кандидат педагогических наук
  • Дернова Ольга Алексеевна,
    программист НОЦ «Геоинформационные системы»

Редакторы карт

  • студенты направлений 45.03.03,
    45.03.02, 45.05.01

Разработчики интерфейса

  • Полев Андрей,
    студент 3 курса направления 45.03.03
  • Белканов Даниил,
    студент 3 курса направления 45.03.03

AutoLex : автоматический генератор эквивалентов многокомпонентной профессиональной лексики

Руководитель проекта: Шереметьева Светлана Олеговна, доктор филологических наук, доцент, профессор кафедры «Лингвистика и перевод», директор НОЦ "Лингво-инновационные технологии"

Система AutoLex – это автоматический генератор русско-английских эквивалентов многокомпонентной профессиональной лексики. Система выполняет автоматический анализ загруженного текста, вычленяет синтаксические группы длиной до 4 слов и выполняет их автоматическую классификацию на именные группы, предикаты и остальную лексику. Для выделенных одно- и многокомпонентных групп система предоставляет предметно-ориентированный перевод.

Период реализации проекта: 2014-2021

Переводить профессиональные словосочетания легко!

Линейка AutoLex включает комплекс из электронных ресурсов для перевода профессиональной лексики из технических предметных областей. Уникальность линейки AutoLex заключается в том, что:

  • база знаний AutoLex содержит современные русско-английские эквиваленты одно- и, что особенно важно, многокомпонентных терминов и других языковых выражений конкретной предметной области длиной до 10 компонентов и поддерживает эквивалентный перевод грамматических реализаций лексики;
  • программа может работать в двух режимах: режиме перевода отдельных терминов и выражений через окно ввода и режиме обработки целого текста, что позволяет в считанные секунды получить перевод всех использованных в тексте слов и выражений длиной до 10 компонентов и облегчает понимание переводимого текста путем автоматического выделения именной и глагольной терминологии.

В настоящий момент система осуществляет поддержку перевода терминологии для предметных областей:

  • математическое моделирование
  • машиностроение
  • интегративная физиология
  • оптоинформатика
  • материаловедение
  • золотодобыча
  • новостные сообщения о терактах

Команда проекта

  • Шереметьева Светлана Олеговна,
    доктор филологических наук, профессор
    кафедры «Лингвистика и перевод»,
    директор НОЦ «Лингво-инновационные
    технологии»
  • Бабина Ольга Ивановна,
    кандидат филологических наук, доцент,
    заведующий кафедрой «Лингвистика и
    перевод», заместитель директора НОЦ
    «Лингво-инновационные технологии»
  • Зиновьева Анастасия Юрьевна,
    кандидат филологических наук,
    доцент кафедры «Лингвистика и перевод»,
    лаборант НОЦ «Лингво-инновационные
    технологии»
  • Неручева Екатерина Дмитриевна,
    лаборант НОЦ «Лингво-инновационные
    технологии»
  • Первухин Алексей Васильевич,
    программист НОЦ «Лингво-инновационные
    технологии»

Обучение модели распознавания эмпатичности

Руководитель проекта: Бабина Ольга Ивановна, заведующий кафедрой «Лингвистика и перевод», к.филол.н., доцент

В современной бизнес-среде на многих предприятиях коммуникация с клиентами является одним из ключевых инструментов создания и поддержания позитивного имиджа компании, и, как следствие, привлечения новых клиентов и сохранения лояльности действующих. От этого напрямую зависит прибыль компании. Представление о нормах делового общения могут разниться в разных языках. А когда продукция компании ориентирована на международный рынок, становится необходимостью вести коммуникацию на языке международного общения (английском), который не является родным для сотрудников бизнес-предприятий в России. В этом случае, даже безупречное владение грамматикой языка, не всегда гарантирует, что речь русскоязычного сотрудника будет адекватно восприниматься представителем другой культуры. Так, например, простой перенос императивных конструкций на английский может показаться англоязычному собеседнику грубостью со стороны представителя компании.
Именно с такой проблемой столкнулись сотрудники ООО «Тридиви»: не всегда русскоязычный сотрудник способен понять и предугадать эмоции собеседника в ответ на не вполне удачно построенную фразу на английском языке. Данный проект направлен на разработку решения для задачи обучения сотрудников компании навыкам эмпатичной коммуникации через создание чатбота, функционирование которого опирается на разработанную и обученную нами модель на основе LLM.

Проект включает разработку аугментированного набора языковых данных, собранных с форума поддержки клиентов ООО «Тридиви» по продукту Nuitrack SDK. Набор данных был составлен из реплик сотрудников, характеризующихся различной степенью эмпатичности. Эмпатичность определялась экспертами — каждую реплику оценивалась в два этапа:
1) реплики распределялись на три категории — эмпатичные (1), нейтральные (0) и индифферентные (характеризующиеся отсутствием эмпатии) (категоризацию проводили 3 эксперта), а также данные были размечены по некоторым дополнительным лингвистическим параметрам.
2) пул индифферентных реплик — дополнительно оценивался по степени эмпатичности (каждая реплика — оценивалась 4 экспертами, общая оценка определялась как среднее арифметическое оценок экспертов). Полученные оценки нормировались таким образом, что диапазон индифферентных оценок составлял [-1; 0].
Полученные набор данных был аугментирован с применением ряда приемов библиотеки nlpaug.
Результатом этой работы стали два набора данных:
базовый, включающий исходные реплики с оценками эмпатичности 1, 0 или числа в диапазоне [-1;0], всего 186 реплик
аугментированный, включающий расширенные с помощью библиотеки набор данных на основе базового, всего 1500 реплик.
Аугментированный набор данных стал основной для дообучения модели DistilBERT (показавшей наилучший результат) для распознавания эмпатичности высказывания сотрудника на английском языке, около 86% предсказаний на тестовой выборке не отклонялись от эталонного значение по метрике MSE более чем на 0,25.

Команда проекта

  • Бабина Ольга Ивановна,
    заведующий кафедрой «Лингвистика и перевод»,
    кандидат филологических наук, доцент
  • Артюшенко Екатерина,
    выпускник кафедры «Лингвистика и перевод»,
    направление подготовки 45.03.03
    «Фундаментальная и прикладная
    лингвистика»
  • Кругликова Светлана,
    выпускник кафедры «Лингвистика и перевод»,
    направление подготовки 45.03.03
    «Фундаментальная и прикладная
    лингвистика»
  • Корнаева Софья,
    выпускник кафедры «Лингвистика и перевод»,
    направление подготовки 45.03.03
    «Фундаментальная и прикладная
    лингвистика»

Мы выражаем искреннюю благодарность ООО «Тридиви» и лично А.Г. Цыбулевскому, Л.И. Лешукову и Д.И. Яковлеву за предоставленные корпоративных регламентов по составлению эмпатичных ответов сотрудников техподдержки, что обеспечило возможность произвести разметку корпуса текстов ответов сотрудников предприятия, а также ценные советы и рекомендации, высказанные в процессе работы над проектом.

Чатбот-консультант для абитуриентов

Руководитель проекта: Бабина Ольга Ивановна, кандидат филологических наук, доцент, заведующий кафедрой «Лингвистика и перевод»

Консультационный чат-бот представляет собой информационно-справочный ресурс, который в режиме диалога с пользователем рассказывает о направлениях подготовки в ИЛиМК. Диалог с чатботом направлен на то, чтобы помочь абитуриенту определиться с выбором специальности, познакомиться с жизнью студентов ИЛиМК и получить информацию о правилах приема на направления подготовки ИЛиМК.

Период реализации проекта: 2023

Расскажу, покажу, сориентирую…

Чат-бот для абитуриентов ИЛиМК содержит информацию о направлениях подготовки ИЛиМК, включая специальности лингвистического и политологического цикла. Чат-бот может рассказать о вступительных испытаниях на направления ИЛиМК, преимуществах каждой специальности, сообщить о том, кем работают выпускники каждого направления подготовки. Кроме того, чат-бот может дать ссылки на официальный сайт ЮУрГУ, где у абитуриента есть возможность посмотреть проходные баллы прошлых лет на каждое направление, наличие бюджетных мест, содержание учебного плана, календарь абитуриента и получить много другой полезной информации. В чат-боте реализован калькулятор ЕГЭ, который позволяет по набору экзаменов подобрать специальность ИЛиМК, на которую может подавать заявление абитуриент. Чат-бот в доступной форме даст исчерпывающую информацию об образовании в ИЛиМК, красочно покажет картины студенческой жизни и подскажет, куда можно обратиться за более подробными разъяснениями относительно поступления на направления и специальности института.

Команда проекта

  • Бабина Ольга Ивановна,
    заведующий кафедрой «Лингвистика и перевод»,
    кандидат филологических наук, доцент
  • Балановская Дарья Михайловна,
    выпускник кафедры «Лингвистика и перевод»,
    направление подготовки 45.03.03 «Фундаментальная и
    прикладная лингвистика»

Сократ-2020: адаптационный чат-бот для иностранных студентов

Руководитель проекта: Борисов Сергей Валентинович, доктор философских наук, доцент, профессор кафедры «Философия»

Цифровой ресурс Сократ-2020 представляет собой чат-бот, позволяющий иностранному студенту адаптироваться в географическом, учебном и культурном пространстве российского вуза, совершенствовать навыки культурной, образовательной и когнитивной компетентности, повышающие качество жизни иностранного студента, эффективность его обучения и способствующие его гармоничной интеграции в социально-культурную жизнь города и региона.
Реализация проекта осуществлялась совместно ИМСГН и ИЛиМК. В состав команды проекта вошли сотрудники ИЛиМК: Светлана Олеговна Шереметьева, доктор филологических наук, доцент, профессор кафедры лингвистики и перевода, директор НОЦ «Лингво-инновационные технологии»; Ольга Ивановна Бабина, кандидат филологических наук, доцент, заведующий кафедрой лингвистики и перевода, зам. директора НОЦ «Лингво-инновационные технологии».

Период реализации проекта: 2021-2022

Спроси у «Сократа»

В проекте приводится решение локальной, но важной задачи: посредством цифровых технологий организовать процесс адаптации иностранных студентов, обучающихся в российском вузе, находящихся в ситуации когнитивного диссонанса в чуждом культурном пространстве, что обусловлено культурными различиями, разным жизненным укладом, разными ментальными установками и т.д. В этих условиях необходимо, чтобы культурное консультирование осуществлялось быстро и своевременно, в контексте возникшей проблемной ситуации, за несколько «кликов».
Основываясь на результатах проведенного социологического исследования с иностранными студентами, была проведена выборка «негативных» (проблемных) маркеров целевой группы, которые легли в основу диалоговой базы данных чат-бота. В результате, чат-бот Сократ-2020 в ходе диалога может рассказать студенту, приехавшему на учебу из другого государства, о том, как пользоваться общественным транспортом в Челябинске, что делать при проблемах со здоровьем, как улучшить свои знания в русском языке, рассказать об особенностях культуры России и ответить на другие вопросы, важные для его социализации и инкультурации в инокультурном пространстве.

Команда проекта

  • Борисов Сергей Валентинович,
    руководитель Ассоциации философов-практиков
    «Рацио»,профессор кафедры «Философия»,
    доктор философских наук, доцент
  • Шереметьева Светлана Олеговна,
    профессор кафедры «Лингвистика и
    перевод», директор НОЦ «Лингво-инновационные
    технологии», доктор филологических наук,
    доцент
  • Бабина Ольга Ивановна,
    заведующий кафедрой «Лингвистика и
    перевод», зам. директора НОЦ
    «Лингво-инновационные технологии»,
    кандидат филологических наук,
    доцент
  • Комельков Артем Анатольевич,
    ведущий программист отдела
    глобальных сетевых технологий
  • Морозова Светлана Витальевна,
    заведующий кафедрой «Общая
    психология, психодиагностика и
    психологическое консультирование»,
    кандидат психологических наук,
    доцент
  • Черняева Юлия Евгеньевна,
    старший преподаватель кафедры
    «Общая психология, психодиагностика и
    психологическое консультирование»,
    заместитель директора НОЦ «Психология»
  • Салганова Елена Ивановна,
    доцент кафедры «Социология»,
    кандидат социологических наук,
    доцент
  • Зиновьева Анастасия Юрьевна,
    доцент кафедры «Лингвистика и
    перевод», лаборант НОЦ «Лингво-инновационные
    технологии», кандидат филологических наук
  • Неручева Екатерина Дмитриевна,
    лаборант НОЦ «Лингво-инновационные
    технологии»

Финансирование разработки чат-бота осуществлялось при поддержке Фонда президентских грантов, проект № 21-1-014489 Адаптационный чат-бот для иностранных студентов российского университета Сократ-2020 (2021–2022). Научный руководитель: Борисов Сергей Валентинович, д.филос.н., доцент