МОСКВА, 25 апр. Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research улучшили качество ответов искусственного интеллекта до 15% по пяти различным показателям, сообщают в компании.
Это означает, что виртуальные ассистенты, чат-боты и другие ИИ-системы, использующие этот метод, смогут работать точнее и эффективнее, отметили в компании. Разработка может быть применена в различных сферах: от образования до медицины. Результаты исследования были представлены 24 апреля на международной конференции по обучению представлениям (ICRL) в Сингапуре, а сама разработка уже опубликована в открытом доступе.
За основу были взяты и улучшены методы Trust Region, применяемые в различных областях ИИ. В компании отметили, что современные языковые модели, обучаясь на больших объемах данных, сталкиваются с проблемой потери качества при долгой тренировке. Исследователи предложили использовать новый метод, который позволили влиять на обучение LLM.
Например, во время генерации вежливых ответов на вопросы модель может начать отклоняться от изначальных настроек и генерировать только вежливые ответы без всякого содержания.
Чтобы избежать этого, ученые из T-Bank AI Research предложили периодически обновлять «настройки по умолчанию» модели. Предложенный метод позволяет модели отмечать ключевые «ориентиры» на своем пути, что помогает избежать отклонений и быстрее достичь целевой точки. В отличие от стандартных подходов, где модель использует фиксированные начальные параметры, Trust Region предусматривает динамическое изменение этой опорной точки двумя способами: мягким или жестким обновлением.
Эксперименты показали, что эти обновления помогают моделям давать более понятные и безопасные ответы. Например, модели с Trust Region, обученные на задаче сокращения длинных текстов, улучшили качество на 10-15% по сравнению с традиционными методами. Особенно заметно, что модели меньше путаются в сложных задачах и лучше следуют инструкциям от пользователя.

Свежие комментарии