LLM Провайдеры

Версия: 1.62

LLM (Large Language Model) провайдер - это сервис, предоставляющий доступ к языковым моделям для генерации ответов AI.

Содержание


Что такое LLM провайдер

LLM провайдер - это сервис, который:

  • Предоставляет доступ к языковым моделям (GigaChat, OpenAI, Claude и др.)
  • Обрабатывает запросы на генерацию текста
  • Возвращает ответы в реальном времени (streaming)
  • Учитывает параметры генерации (temperature, maxTokens и др.)

Зачем нужны провайдеры

  • Разные модели - разные провайдеры предоставляют разные модели
  • Гибкость - можно выбрать подходящую модель для задачи
  • Резервирование - можно настроить несколько провайдеров для отказоустойчивости
  • Стоимость - разные провайдеры имеют разную стоимость использования

Настройка провайдера (для администраторов)

Требования: Для настройки провайдеров нужна роль администратора.

Создание провайдера

  1. Перейдите в АдминистрированиеLLM Провайдеры
  2. Нажмите кнопку "Создать провайдер" или "+"
  3. Заполните информацию:
    • Тип провайдера - GigaChat, Custom, AITunnel
    • Название - название провайдера
    • Описание - краткое описание
  4. Настройте подключение:
    • Token URL - URL для получения токена (для OAuth)
    • Completion URL - URL для отправки запросов
    • Authorization Key - ключ авторизации
    • Scope - область доступа (для OAuth)
  5. Настройте модель:
    • Модель - выберите модель из списка
    • Доступные модели - список моделей для выбора
  6. Настройте параметры запроса:
    • Request Headers - дополнительные заголовки (JSON)
    • System Prompt - системный промпт по умолчанию
    • Temperature - креативность по умолчанию
    • Max Tokens - максимальная длина ответа
    • Top P - параметр ядра выборки
    • Presence Penalty - штраф за присутствие токенов
    • Frequency Penalty - штраф за частоту токенов
  7. Настройте флаги:
    • Активен - провайдер доступен для использования
    • Глобальный - провайдер доступен для всех workspace
    • Разрешить самоподписанные сертификаты - для тестовых серверов
  8. Нажмите "Создать"

Редактирование провайдера

  1. Найдите провайдер в списке
  2. Нажмите кнопку "Редактировать" (иконка карандаша)
  3. Внесите необходимые изменения
  4. Нажмите "Сохранить"

Активация/деактивация провайдера

  1. Найдите провайдер в списке
  2. Переключите флаг "Активен"
  3. Изменения сохраняются автоматически

Важно: Деактивированный провайдер не будет использоваться в ассистентах.


Выбор провайдера в ассистенте

Пользователи могут выбрать провайдер для конкретного ассистента.

Как выбрать

  1. Откройте настройки ассистента
  2. Найдите раздел "LLM настройки" или "AI настройки"
  3. В поле "LLM Провайдер" выберите провайдера из списка
  4. Сохраните изменения

Доступные провайдеры:

  • Провайдеры, доступные в рабочем пространстве
  • Глобальные провайдеры (если настроены администратором)
  • Провайдеры workspace (если настроены)

Приоритет выбора провайдера

При использовании ассистента провайдер выбирается по следующему приоритету:

  1. Провайдер ассистента - если указан в настройках ассистента
  2. Провайдер workspace - если не указан провайдер ассистента, используется провайдер из настроек Unica Chat workspace
  3. Глобальный провайдер - если не указан провайдер workspace, используется глобальный провайдер

Настройка провайдера workspace

  1. Перейдите в АдминистрированиеLLM Провайдеры
  2. Найдите раздел "Unica Chat Config"
  3. Выберите провайдер из списка
  4. Настройте модель и параметры (опционально)
  5. Сохраните изменения

Этот провайдер будет использоваться по умолчанию для всех ассистентов в workspace, если не указан провайдер ассистента.


Настройка модели

Модель определяет конкретную версию языковой модели для использования.

Выбор модели в провайдере

При создании или редактировании провайдера:

  1. В поле "Модель" выберите модель из списка доступных
  2. Или введите название модели вручную
  3. Сохраните изменения

Выбор модели в ассистенте

  1. В настройках ассистента найдите поле "Модель"
  2. Выберите модель из списка доступных для выбранного провайдера
  3. Или оставьте пустым для использования модели по умолчанию провайдера
  4. Сохраните изменения

Доступные модели

Доступные модели зависят от типа провайдера:

  • GigaChat: GigaChat-Pro, GigaChat, GigaChat-Lite
  • AITunnel: GPT-5.1 Chat, GPT-5 Mini, GPT-4.1, Claude 3.7 Sonnet, Gemini 2.5 Pro и др.
  • Custom: зависит от настроек провайдера

Параметры генерации

Важно: Начиная с версии 1.62 параметры генерации LLM управляются из одного места — настройки ассистента → «Расширенные параметры». Настройки в провайдере работают как ограничители, а не как значения по умолчанию для ассистентов.

Роль провайдера: ограничитель (ceiling)

Параметр Max Tokens в настройках провайдера задаёт максимально допустимый лимит для всех ассистентов, которые используют этот провайдер. Если в ассистенте указано значение выше лимита провайдера — оно автоматически обрезается до значения провайдера.

Пример: провайдер ограничен 8000 токенов, ассистент настроен на 16000 → в запросе к LLM будет передано 8000.

Параметры в форме провайдера

Набор доступных параметров зависит от типа провайдера:

Для Unica AI — только:

  • Лимит токенов (максимум) — потолок для всех ассистентов этого провайдера
  • Системный промпт — инструкция для LLM по умолчанию
  • Расширенные параметры запроса (JSON) — дополнительные поля тела запроса (workspace_id и др.)

Для других типов (GigaChat, AITunnel, Custom) — дополнительно:

  • Temperature — креативность (0.0–2.0)
  • Top P — ядро выборки (0.0–1.0)
  • Presence Penalty — штраф за повторение тем (-2.0 до 2.0)
  • Frequency Penalty — штраф за повторение токенов (-2.0 до 2.0)

Управление параметрами генерации в ассистенте

Все тонкие настройки генерации задаются в ассистенте через блок «Расширенные параметры». Пустое поле означает «использовать значение провайдера».

Подробнее: Ассистенты → Расширенные параметры LLM

Temperature (Креативность)

Контролирует случайность ответов.

  • Диапазон: 0.0–2.0
  • По умолчанию: 0.2 (системный дефолт)
  • Низкое значение (0.1–0.3): более точные, детерминированные ответы
  • Среднее значение (0.5–0.7): баланс между точностью и креативностью
  • Высокое значение (0.8–1.0): более креативные, разнообразные ответы

Настраивается в ассистенте. Для Unica AI провайдеров: не задаётся в провайдере.

Max Tokens (Максимальная длина / Лимит)

Максимальное количество токенов в ответе.

  • В провайдере: задаёт потолок — ассистент не может превысить это значение
  • В ассистенте: задаёт желаемое значение (но не выше лимита провайдера)
  • По умолчанию: 4096 (системный дефолт)

Top P, Presence Penalty, Frequency Penalty

Доступны только в настройках провайдеров типа GigaChat, AITunnel, Custom. Для Unica AI — настраиваются исключительно через ассистент.

  • Top P: 0.0–1.0 (ядро выборки)
  • Presence Penalty: -2.0 до 2.0 (штраф за повторение тем)
  • Frequency Penalty: -2.0 до 2.0 (штраф за повторение токенов)

Типы провайдеров

GigaChat

Провайдер от Сбера, предоставляющий доступ к моделям GigaChat.

Особенности:

  • OAuth авторизация
  • Поддержка streaming
  • Российский провайдер

Настройка:

  • Token URL: https://ngw.devices.sberbank.ru:9443/api/v2/oauth
  • Completion URL: https://gigachat.devices.sberbank.ru/api/v1/chat/completions
  • Scope: GIGACHAT_API_PERS

AITunnel

Провайдер, предоставляющий единый API для доступа к различным моделям (OpenAI, DeepSeek, Claude, Gemini).

Особенности:

  • Единый API для разных моделей
  • Поддержка множества моделей
  • Простая настройка

Настройка:

  • Completion URL: https://api.aitunnel.ru/v1/chat/completions
  • Authorization Key: API ключ от AITunnel

Unica AI

Внутренний провайдер на базе Unica AI.

Особенности:

  • Не требует API ключа
  • Не требует Token URL и Scope
  • Параметры генерации (temperature, top_p и др.) настраиваются только через ассистент
  • В форме провайдера доступны: лимит токенов (потолок), системный промпт, расширенные параметры (JSON)

Настройка:

  • Completion URL: адрес Unica AI сервиса
  • Лимит токенов: максимум для всех ассистентов этого провайдера
  • Расширенные параметры (JSON): {"workspace_id": "GENERAL"} (обязательно)

Custom

Кастомный провайдер для подключения любых совместимых API.

Особенности:

  • Гибкая настройка
  • Поддержка любых совместимых API
  • Кастомные заголовки и параметры

Настройка:

  • Укажите Token URL и Completion URL вашего API
  • Настройте Authorization Key
  • Настройте Request Headers при необходимости

Частые проблемы

Провайдер не работает

Проблема: Провайдер настроен, но не отвечает на запросы.

Возможные причины:

  • Провайдер неактивен
  • Неправильные URL или ключи
  • Проблемы с сетью
  • Провайдер недоступен

Решение:

  • Проверьте, что провайдер активен
  • Проверьте правильность URL и ключей
  • Проверьте подключение к интернету
  • Проверьте статус провайдера на его стороне

Не могу выбрать провайдер в ассистенте

Проблема: В списке провайдеров нет нужного провайдера.

Возможные причины:

  • Провайдер неактивен
  • Провайдер не доступен в рабочем пространстве
  • Провайдер не глобальный и не привязан к workspace

Решение:

  • Проверьте, что провайдер активен
  • Убедитесь, что провайдер доступен в вашем workspace
  • Обратитесь к администратору для настройки провайдера

Ошибки авторизации

Проблема: Появляются ошибки авторизации при использовании провайдера.

Возможные причины:

  • Неправильный Authorization Key
  • Истёкший токен (для OAuth)
  • Неправильный Scope (для OAuth)

Решение:

  • Проверьте правильность Authorization Key
  • Для OAuth провайдеров проверьте настройки Token URL и Scope
  • Обновите ключи при необходимости

Медленные ответы

Проблема: Провайдер отвечает медленно.

Возможные причины:

  • Перегрузка провайдера
  • Проблемы с сетью
  • Большой Max Tokens
  • Сложный запрос

Решение:

  • Подождите немного (провайдер может быть перегружен)
  • Проверьте подключение к интернету
  • Уменьшите Max Tokens
  • Упростите запрос

Связанные разделы


Примечания

  • Версия: 1.62
  • Настройка: Только для администраторов
  • Приоритет: Провайдер ассистента → Провайдер workspace → Глобальный провайдер
  • Параметры генерации: Управляются в ассистенте → «Расширенные параметры»; провайдер задаёт только потолок по maxTokens
  • Безопасность: Ключи авторизации хранятся в зашифрованном виде