LLM Провайдеры

Версия: 1.62

LLM (Large Language Model) провайдер - это сервис, предоставляющий доступ к языковым моделям для генерации ответов AI.

Содержание

Что такое LLM провайдер
Настройка провайдера (для администраторов)
Выбор провайдера в ассистенте
Приоритет выбора провайдера
Настройка модели
Параметры генерации
Типы провайдеров
Частые проблемы

Что такое LLM провайдер

LLM провайдер - это сервис, который:

Предоставляет доступ к языковым моделям (GigaChat, OpenAI, Claude и др.)
Обрабатывает запросы на генерацию текста
Возвращает ответы в реальном времени (streaming)
Учитывает параметры генерации (temperature, maxTokens и др.)

Зачем нужны провайдеры

Разные модели - разные провайдеры предоставляют разные модели
Гибкость - можно выбрать подходящую модель для задачи
Резервирование - можно настроить несколько провайдеров для отказоустойчивости
Стоимость - разные провайдеры имеют разную стоимость использования

Настройка провайдера (для администраторов)

Требования: Для настройки провайдеров нужна роль администратора.

Создание провайдера

Перейдите в Администрирование → LLM Провайдеры
Нажмите кнопку "Создать провайдер" или "+"
Заполните информацию:
- Тип провайдера - GigaChat, Custom, AITunnel
- Название - название провайдера
- Описание - краткое описание
Настройте подключение:
- Token URL - URL для получения токена (для OAuth)
- Completion URL - URL для отправки запросов
- Authorization Key - ключ авторизации
- Scope - область доступа (для OAuth)
Настройте модель:
- Модель - выберите модель из списка
- Доступные модели - список моделей для выбора
Настройте параметры запроса:
- Request Headers - дополнительные заголовки (JSON)
- System Prompt - системный промпт по умолчанию
- Temperature - креативность по умолчанию
- Max Tokens - максимальная длина ответа
- Top P - параметр ядра выборки
- Presence Penalty - штраф за присутствие токенов
- Frequency Penalty - штраф за частоту токенов
Настройте флаги:
- Активен - провайдер доступен для использования
- Глобальный - провайдер доступен для всех workspace
- Разрешить самоподписанные сертификаты - для тестовых серверов
Нажмите "Создать"

Редактирование провайдера

Найдите провайдер в списке
Нажмите кнопку "Редактировать" (иконка карандаша)
Внесите необходимые изменения
Нажмите "Сохранить"

Активация/деактивация провайдера

Найдите провайдер в списке
Переключите флаг "Активен"
Изменения сохраняются автоматически

Важно: Деактивированный провайдер не будет использоваться в ассистентах.

Выбор провайдера в ассистенте

Пользователи могут выбрать провайдер для конкретного ассистента.

Как выбрать

Откройте настройки ассистента
Найдите раздел "LLM настройки" или "AI настройки"
В поле "LLM Провайдер" выберите провайдера из списка
Сохраните изменения

Доступные провайдеры:

Провайдеры, доступные в рабочем пространстве
Глобальные провайдеры (если настроены администратором)
Провайдеры workspace (если настроены)

Приоритет выбора провайдера

При использовании ассистента провайдер выбирается по следующему приоритету:

Провайдер ассистента - если указан в настройках ассистента
Провайдер workspace - если не указан провайдер ассистента, используется провайдер из настроек Unica Chat workspace
Глобальный провайдер - если не указан провайдер workspace, используется глобальный провайдер

Настройка провайдера workspace

Перейдите в Администрирование → LLM Провайдеры
Найдите раздел "Unica Chat Config"
Выберите провайдер из списка
Настройте модель и параметры (опционально)
Сохраните изменения

Этот провайдер будет использоваться по умолчанию для всех ассистентов в workspace, если не указан провайдер ассистента.

Настройка модели

Модель определяет конкретную версию языковой модели для использования.

Выбор модели в провайдере

При создании или редактировании провайдера:

В поле "Модель" выберите модель из списка доступных
Или введите название модели вручную
Сохраните изменения

Выбор модели в ассистенте

В настройках ассистента найдите поле "Модель"
Выберите модель из списка доступных для выбранного провайдера
Или оставьте пустым для использования модели по умолчанию провайдера
Сохраните изменения

Доступные модели

Доступные модели зависят от типа провайдера:

GigaChat: GigaChat-Pro, GigaChat, GigaChat-Lite
AITunnel: GPT-5.1 Chat, GPT-5 Mini, GPT-4.1, Claude 3.7 Sonnet, Gemini 2.5 Pro и др.
Custom: зависит от настроек провайдера

Параметры генерации

Важно: Начиная с версии 1.62 параметры генерации LLM управляются из одного места — настройки ассистента → «Расширенные параметры». Настройки в провайдере работают как ограничители, а не как значения по умолчанию для ассистентов.

Роль провайдера: ограничитель (ceiling)

Параметр Max Tokens в настройках провайдера задаёт максимально допустимый лимит для всех ассистентов, которые используют этот провайдер. Если в ассистенте указано значение выше лимита провайдера — оно автоматически обрезается до значения провайдера.

Пример: провайдер ограничен 8000 токенов, ассистент настроен на 16000 → в запросе к LLM будет передано 8000.

Параметры в форме провайдера

Набор доступных параметров зависит от типа провайдера:

Для Unica AI — только:

Лимит токенов (максимум) — потолок для всех ассистентов этого провайдера
Системный промпт — инструкция для LLM по умолчанию
Расширенные параметры запроса (JSON) — дополнительные поля тела запроса (workspace_id и др.)

Для других типов (GigaChat, AITunnel, Custom) — дополнительно:

Temperature — креативность (0.0–2.0)
Top P — ядро выборки (0.0–1.0)
Presence Penalty — штраф за повторение тем (-2.0 до 2.0)
Frequency Penalty — штраф за повторение токенов (-2.0 до 2.0)

Управление параметрами генерации в ассистенте

Все тонкие настройки генерации задаются в ассистенте через блок «Расширенные параметры». Пустое поле означает «использовать значение провайдера».

Подробнее: Ассистенты → Расширенные параметры LLM

Temperature (Креативность)

Контролирует случайность ответов.

Диапазон: 0.0–2.0
По умолчанию: 0.2 (системный дефолт)
Низкое значение (0.1–0.3): более точные, детерминированные ответы
Среднее значение (0.5–0.7): баланс между точностью и креативностью
Высокое значение (0.8–1.0): более креативные, разнообразные ответы

Настраивается в ассистенте. Для Unica AI провайдеров: не задаётся в провайдере.

Max Tokens (Максимальная длина / Лимит)

Максимальное количество токенов в ответе.

В провайдере: задаёт потолок — ассистент не может превысить это значение
В ассистенте: задаёт желаемое значение (но не выше лимита провайдера)
По умолчанию: 4096 (системный дефолт)

Top P, Presence Penalty, Frequency Penalty

Доступны только в настройках провайдеров типа GigaChat, AITunnel, Custom. Для Unica AI — настраиваются исключительно через ассистент.

Top P: 0.0–1.0 (ядро выборки)
Presence Penalty: -2.0 до 2.0 (штраф за повторение тем)
Frequency Penalty: -2.0 до 2.0 (штраф за повторение токенов)

Типы провайдеров

GigaChat

Провайдер от Сбера, предоставляющий доступ к моделям GigaChat.

Особенности:

OAuth авторизация
Поддержка streaming
Российский провайдер

Настройка:

Token URL: https://ngw.devices.sberbank.ru:9443/api/v2/oauth
Completion URL: https://gigachat.devices.sberbank.ru/api/v1/chat/completions
Scope: GIGACHAT_API_PERS

AITunnel

Провайдер, предоставляющий единый API для доступа к различным моделям (OpenAI, DeepSeek, Claude, Gemini).

Особенности:

Единый API для разных моделей
Поддержка множества моделей
Простая настройка

Настройка:

Completion URL: https://api.aitunnel.ru/v1/chat/completions
Authorization Key: API ключ от AITunnel

Unica AI

Внутренний провайдер на базе Unica AI.

Особенности:

Не требует API ключа
Не требует Token URL и Scope
Параметры генерации (temperature, top_p и др.) настраиваются только через ассистент
В форме провайдера доступны: лимит токенов (потолок), системный промпт, расширенные параметры (JSON)

Настройка:

Completion URL: адрес Unica AI сервиса
Лимит токенов: максимум для всех ассистентов этого провайдера
Расширенные параметры (JSON): {"workspace_id": "GENERAL"} (обязательно)

Custom

Кастомный провайдер для подключения любых совместимых API.

Особенности:

Гибкая настройка
Поддержка любых совместимых API
Кастомные заголовки и параметры

Настройка:

Укажите Token URL и Completion URL вашего API
Настройте Authorization Key
Настройте Request Headers при необходимости

Частые проблемы

Провайдер не работает

Проблема: Провайдер настроен, но не отвечает на запросы.

Возможные причины:

Провайдер неактивен
Неправильные URL или ключи
Проблемы с сетью
Провайдер недоступен

Решение:

Проверьте, что провайдер активен
Проверьте правильность URL и ключей
Проверьте подключение к интернету
Проверьте статус провайдера на его стороне

Не могу выбрать провайдер в ассистенте

Проблема: В списке провайдеров нет нужного провайдера.

Возможные причины:

Провайдер неактивен
Провайдер не доступен в рабочем пространстве
Провайдер не глобальный и не привязан к workspace

Решение:

Проверьте, что провайдер активен
Убедитесь, что провайдер доступен в вашем workspace
Обратитесь к администратору для настройки провайдера

Ошибки авторизации

Проблема: Появляются ошибки авторизации при использовании провайдера.

Возможные причины:

Неправильный Authorization Key
Истёкший токен (для OAuth)
Неправильный Scope (для OAuth)

Решение:

Проверьте правильность Authorization Key
Для OAuth провайдеров проверьте настройки Token URL и Scope
Обновите ключи при необходимости

Медленные ответы

Проблема: Провайдер отвечает медленно.

Возможные причины:

Перегрузка провайдера
Проблемы с сетью
Большой Max Tokens
Сложный запрос

Решение:

Подождите немного (провайдер может быть перегружен)
Проверьте подключение к интернету
Уменьшите Max Tokens
Упростите запрос

Связанные разделы

Ассистенты - настройка провайдера в ассистенте
RAG и векторный поиск - использование провайдеров в RAG
Административная панель - управление провайдерами

Примечания

Версия: 1.62
Настройка: Только для администраторов
Приоритет: Провайдер ассистента → Провайдер workspace → Глобальный провайдер
Параметры генерации: Управляются в ассистенте → «Расширенные параметры»; провайдер задаёт только потолок по maxTokens
Безопасность: Ключи авторизации хранятся в зашифрованном виде